Volver

Inteligencia artificial y su impacto en la verificación de identidad

Vivimos en una época donde las máquinas, el software y varios procesos automáticos están transformando gran parte de las actividades productivas del mundo.  La Inteligencia Artificial juega un papel muy importante en esta transformación. Uno de los campos más prometedores de aplicación de la IA son los denominados procesos de verificación de identidad (conocidos en el argot empresarial como comprobaciones KYC -Know your Costumer-), donde la agilidad, escalabilidad, y seguridad se han convertido en una prioridad, en especial para aquellas empresas con escenarios de verificación en línea.  El alcance de la IA, sus limitaciones y prospectiva para apoyar los procesos de verificación de identidad son discutidos en el presente documento.

Retos de los procesos de verificación de identidad

Los procesos de verificación de identidad se enfrentan a tres grandes desafíos: seguridad, agilidad y escalabilidad. Si hablamos de seguridad el fraude por suplantación es el gran problema por atacar.  El Instituto Nacional de Transparencia, Acceso a la Información y Protección de Datos Personales de México define la suplantación como “la apropiación de la identidad de una persona, para hacerse pasar por ella, asumir su identidad frente a terceros públicos o privados, a fin de obtener ciertos recursos o beneficios a su nombre” [INAI2018]. La suplantación no es un problema menor, el número de transacciones fraudulentas bajo esta modalidad continúa aumentando a medida que los estafadores y los cibercriminales se vuelven más sofisticados.

En Colombia, por ejemplo, la Superintendencia de Industria y Comercio (SIC) evidenció en el primer semestre del 2019 un incremento del 122% en quejas por suplantación en relación con el mismo periodo del año inmediatamente anterior [SIC2019]. De acuerdo con el informe de la SIC los sectores con mayor número de quejas son las telecomunicaciones (69,6%) y ventas por catálogo (30,4%). En México, la Condusef (Comisión Nacional para la Protección y Defensa de los Usuarios de Servicios Financieros) reportó 78.989 casos de reclamaciones bancarias por posibles suplantaciones en 2017 [JOR2020].  La Comisión Nacional Bancaria y de Valores de este mismo país confirmó 16.596 casos de robo de identidad en 2017, lo que constituye un incremento del 213% del año inmediatamente anterior [JOR2020] [INAI2018]. De la misma forma el FTC (Federal Trade Commission) de Estados Unidos procesó 1.4 millones de informes de fraude y 444.602 informes por robo de identidad en 2018 con un monto total de pérdidas estimado en $ 1.48 billones de dólares [FTC2019]. En este mismo informe destacan la tendencia incremental en el número total de fraudes año a año, así como lo métodos cada vez más sigilosos y sofisticados de los cibercriminales para cometer suplantación de identidad.

Los sistemas de verificación deben, por lo tanto, incluir nuevos niveles de seguridad que vayan más allá de la solicitud de un documento de identificación. Estrategias para la verificación de la autenticidad de los documentos (confirmación de texto válido de microimpresión, identificación de hologramas, etc.) en combinación con validación biométrica (reconocimiento facial, prueba de vida, huellas digitales, etc.) están empezando a ser incorporadas ya sea con componentes humanos o gracias a los adelantos existentes en IA.

Los otros dos grandes retos que enfrentan los sistemas de verificación de identidad son la agilidad y escalabilidad. Si bien nuevas estrategias pueden ser incorporadas para alcanzar estándares de seguridad más altos, estos análisis tienen que realizarse de manera ágil y en entornos altamente amigables para los usuarios finales. De nada sirve un conjunto de análisis altamente sofisticados si sus tiempos de respuesta son más altos que los que consume un humano o involucran procesos engorrosos de levantamiento de datos para el usuario. La usabilidad de los futuros sistemas de verificación es un aspecto fundamental para garantizar su éxito en entornos de rápido movimiento transaccional como la banca o las telecomunicaciones. La velocidad con que los servicios de verificación son requeridos, exige, además, una alta escalabilidad computacional y un consumo de recursos en operación factibles a nivel de costos.  

La Inteligencia Artificial

Los desarrollos en IA prometen, sin lugar a duda, solventar gran parte de los retos antes mencionados. Raymond Kurzweil definió la IA como “The art of creating machines that perform functions that require intelligence when performed by people” [RK1990]. La IA no es más que el estudio y diseño de máquinas y sistemas, que desde la perspectiva de los seres humanos con los que interactúan, son “inteligentes”. Estas máquinas “inteligentes” están influyendo en casi todas las facetas de nuestras vidas para ayudar a mejorar la eficiencia y aumentar las capacidades humanas.

Con IA se pueden automatizar las validaciones biométricas y de autenticidad de documentos con grados de confianza cercanos a los de un humano experto, y con la capacidad de procesar millones de transacciones a un ritmo inalcanzable para equipos de validadores humanos. Igual de importante es su capacidad de escalamiento una vez los modelos son entrenados. Con las capacidades de cómputo actuales estos modelos pueden operar en la mayoría de los dispositivos móviles actuales.

¿Pero exactamente como la IA pueden enriquecer los procesos de verificación de identidad? A continuación, se listan desarrollos de IA que desde ReconoSER ID hemos integrado a nuestros servicios de verificación de identidad.

  • Verificación documental: los documentos de identidad, como las cédulas, licencias de conducir y los pasaportes, se fotografían o se graban en video para identificar a los usuarios en línea. La verificación de la autenticidad de los documentos se realiza mediante la extracción automática de la información textual de la foto o video del documento, la confirmación de las posiciones de sus elementos, y la identificación de hologramas. En muchos casos los documentos cuentan con códigos de barras que permiten verificar la información textual extraída.  Todos estos análisis se pueden automatizar gracias a los adelantos en Visión Artificial, una sub-área de Inteligencia Artificial que se encarga del análisis y procesamiento de imágenes y videos.
  • Reconocimiento facial:  las tecnologías de reconocimiento facial permiten identificar a una persona analizando las características de su rostro. El proceso se realiza cotejando un registro previo facial del usuario (comúnmente capturados en los procesos de enrolamiento o alternativamente de fotografías de rostro extraídas de los documentos de identificación) con un registro facial en el momento de realizar la identificación o validar una determinada transacción. Diferentes modelos automáticos de IA que extraen características sobre la simetría de los elementos de un rostro o modelos más sofisticados de redes neuronales profundas pueden ser empleados para esta tarea.
  • Rostro vivo (prueba de vida): un nivel superior de reconocimiento facial es identificar que se trata no solo del mismo rostro, sino que el rostro en el momento de la verificación corresponde a una persona viva y no, por ejemplo, a un video o fotografía de alta calidad de la persona. Estos análisis generalmente se realizan mediante videos donde se le solicita al usuario realizar cierto tipo de movimientos. Los modelos de IA, por lo tanto, deben identificar la ejecución correcta de dichos movimientos.
  • Reconocimiento de huellas digitales: puede que sea el método de identificación biométrica más conocido [RECO2020]. Al igual que los anteriores hacen uso de métodos de Visión Artificial para analizar la similitud de dos imágenes que corresponden a huellas dactilares.
  • Análisis de fuentes abiertas: Mediante procesos robotizados, comúnmente conocidos como RPAs (robotic automation process), se extrae información de bases de datos abiertas de forma automática que dan un soporte adicional sobre la identidad de la persona. Esta información de carácter textual y altamente no estructurada es analiza con técnicas de Procesamiento de Lenguaje Natural (otra sub-área de la IA) para entender su contenido y realizar un perfilamiento de usuario.
  • Estimación del riesgo: Una vez se tienen los resultados de uno o más de los análisis anteriores se requiere emitir un juicio sobre la identidad de las personas y/o el riesgo asociado en una transacción. Esta estimación es particularmente relevante a la luz de las imperfecciones y limitaciones propias de los modelos de IA (se va a hablar sobre esto en la siguiente sección). Para esto hemos creado modelos que integran los resultados de los diferentes análisis de verificación y estiman el riesgo dada la evidencia para una transacción especifica. Estos modelos siguen una línea mucho más clásica de IA y generalmente se basan en modelos de regresión, lógica difusa o modelos de Markov.

Limitaciones de la IA en procesos de validación de identidad

Si bien las posibilidades de la IA son innegables, es realmente importante entender sus limitaciones.  Cualquier desarrollo o modelo de IA es solo tan bueno como los datos con los que fueron desarrollados.  Para entender la anterior afirmación se debe comprender primero el funcionamiento de los algoritmos de “aprendizaje de máquina” con los cuales se construyen la mayoría de los sistemas de IA actuales.

El “aprendizaje de máquina” son básicamente algoritmos con la capacidad de analizar datos, aprender reglas o patrones de ellos para luego hacer predicciones para una tarea específica (e.g. tareas como saber si son la misma cara, la misma huella, o si un documento es auténtico o no). En lugar de codificar a mano las rutinas de software con un conjunto específico de instrucciones y reglas para realizar una tarea en particular, la máquina se “entrena” automáticamente usando grandes cantidades de datos mediante algoritmos que le dan la capacidad de aprender cómo realizar la tarea. Por supuesto que “aprende” la máquina y la capacidad de predictiva de los modelos resultantes viene dada por la calidad y la completitud de la data usada.

A modo de ejemplo considere el proceso de verificación de autenticidad de un documento. Los documentos físicos pueden presentar desgaste y discrepancias de fabricación. De la misma forma diferentes versiones en el tiempo de un mismo documento pueden ser emitidos, ser auténticas y presentar pequeñas diferencias. Estos factores, si no se contemplan en el momento de construir el conjunto de datos de entrenamiento, podrían dar como resultado modelos de IA con un número importante de falsos positivos (i.e. documentos identificados como falsificaciones o fraudulentos cuando no lo son).  

Un problema difícil de afrontar por los sistemas de IA para la validación de autenticidad son los análisis de documentos desgastados o dañados que generalmente conduce a la predicción de falsedad. Este comportamiento erróneo se explica en la ausencia de datos de entrenamiento con imágenes de dichos tipos de documentos, los cuales suelen ser de difícil adquisición.

Se debe garantizar que los modelos de IA son entrenados con datos con características similares a las esperadas que sean usadas en la etapa de predicción. Si se entrena un modelo de reconocimiento facial usando miles de imágenes de rostros en alta resolución, las imágenes de entrada cuando el modelo esté en ejecución deben ser también de alta resolución. Sin embargo, en escenarios reales de reconocimiento facial es común encontrarse con dispositivos móviles o computadores con cámaras web que solo pueden capturar fotografías de baja resolución. Estas discrepancias entre los datos de entrenamiento y los datos de entrada reales cuando el modelo está desplegado y en funcionamiento pueden generar resultados predictivos inesperados. Elementos tan sutiles como la iluminación, la presencia de sombras o la presencia de elementos externos en la foto (i.e. un dedo, un clip, etc.) pueden también causar resultados erróneos. Tener un conjunto tan robusto de datos de entrenamiento que contemple todas las particularidades del dominio de aplicación es un proceso dispendioso, costoso y en muchos casos imposible.  

Podemos decir que un sistema exclusivamente de IA no puede brindar soluciones con una alta precisión en todos los escenarios que se pueden presentar en los procesos de verificación de identidad.  Lo anterior, sin embargo, no opaca su potencial para agilizar y escalar este tipo de procesos con resultados muy próximos a las obtenidos por expertos humanos, pero sin las limitaciones en capacidad de respuesta, volumen y tiempo de operación de estos.

Hoy en día la mejor versión de los sistemas de verificación es aquella que combina IA con revisión experta humana. Mientras que la IA se encarga de los casos más comunes y menos problemáticos (que generalmente son el grueso de solicitudes), los expertos humanos se encargan de la verificación de los casos donde se identifica que la IA es menos confiable o simplemente no puede operar (que generalmente son los casos atípicos).  Los expertos humanos, a diferencia de la IA, pueden identificar formas y niveles totalmente nuevos de falsificación. La única forma de ganar esta lucha constante entre el nivel de sofisticación del fraude y los sistemas de verificación de identidad es con el ojo experto de profesionales capacitados que les enseñen a los modelos de IA mediante ejemplos (i.e. datos) como detectar las nuevas formas de falsificación que van surgiendo. Esta unión mancomunada de inteligencias es sin duda el futuro de los sistemas de verificación de identidad.

Conclusión

La IA está revolucionando los procesos de verificación de identidad mediante la automatización de análisis biométricos y de autenticidad de documentos. Esta automatización permite la construcción de procesos ágiles y escalables a la vez que permite establecer niveles de seguridad mucho más altos.  Estas características son más que deseadas por las empresas dado el inminente incremento de fraudes por suplantación de identidad. Es claro que los procesos de verificación que incluyan múltiples dimensiones de análisis mientras mantienen una relativa facilidad de uso son los llamados a prevalecer en el mercado. 

Si bien los modelos de IA están y seguirán estando limitados por los datos de “entrenamiento”, las ventajas que proveen están muy por encima de sus limitaciones. Lo anterior siempre y cuando, existan políticas y estrategias permanentes para el refinamiento de los modelos mediante conocimiento experto.

Rubén Manrique

Bibliografía

[RK1990] Kurzweil, R. (1990). The Age of Intelligent Machines. MIT Press, Cambridge, MA, USA.

[SIC2019] SIC (2019). “https://www.sic.gov.co/Quejas-por-suplantacion-de-identidad-ante-la-Superindustria-crecieron-122”. Consultado Marzo 2020.

[INAI2018] INAI (2018). Guía para prevenir el robo de Identidad “http://inicio.ifai.org.mx/DocumentosdeInteres/Gu%C3%ADa_Prevenir_RI.pdf”

[JOR2020] Emir Olivares (2019). Se dispara el robo de identidad en México. ” https://www.jornada.com.mx/ultimas/politica/2019/10/28/se-dispara-el-robo-de-identidad-en-mexico-3421.html”. Consultado Marzo 2020.

[FTC2019] Federal Trade Commission (2019). Consumer Sentinel Network Data Book 2018.

[FINT2019] Fintech Iberoamérica (2019). Libro Blanco Iberoamericano de la Identidad Digital.

[RECO2020] Diego Pacheco-Páramo, reconoSER (2020). Biometría para validación de identidad (https://reconoserid.com/stagingv3/biometria-para-validacion-de-identidad/)

3 comments

  • Excelente árticulo, describe muy bien el estado actual de la IA en temas de verificación. Sin embargo, creo que hace falta una discusión igual de seria sobre su match con lineamientos internacionales. Recientemente, por ejemplo, salio el Guiance on Digital Identity de la FATF que habla directamente de servicios para verificación de identidad digital.

    Quedo a la espera de su ampliación.

    1. ¡Muchas gracias por tu participación!, estamos totalmente de acuerdo, es necesario relacionar los adelantos en IA frente a los lineamientos y políticas tanto nacionales como internacionales. Aprovechamos para contarte que estamos preparando un nuevo Whitepaper sobre el Guidance on Digital Identity de la FATF, el cual esperamos lanzarlo aproximadamente dentro de las primeras semanas de Mayo. ¡Te invitamos a mantenerte al tanto de nuestras publicaciones!

Comments are closed.