Volver

Privacidad y navegación por internet

El uso de diferentes servicios por medio de internet, ha permitido a diferentes actores almacenar datos sobre gran parte de la población. El principal uso que se la ha dado a estos datos ha sido el de servir como insumo para clasificar consumidores y potenciar el mercadeo de diferentes productos o servicios. De manera similar, estos datos también pueden ser usados por parte de sistemas de verificación de identidad para reducir la suplantación y el fraude. Sin embargo, los usuarios no tiene claro como se recolectan y usan sus datos en internet. En este documento explicamos de qué manera se recolecta la información de las personas cuando navegan por internet y cómo esta información alimenta sistemas de mercadeo a nivel global.

Si bien la recolección de datos sobre consumidores se lleva haciendo desde hace mucho tiempo usando fuentes como burós de crédito, registros públicos, encuestas, o programas de fidelidad de cliente, la aparición de mecanismos de recolección por medios digitales ha generado una mayor preocupación en la sociedad. Esta preocupación se debe por un lado a la falta de transparencia del proceso de recolección de datos (que se parece mucho a lo que ocurre con los procesos “no digitales”), y por otro lado a la automatización que permite la recolección de grandes volúmenes de datos, lo cual aviva temores asociados a la conformación de sistemas de vigilancia masivos que lleven por ejemplo a la pérdida de libertad o autonomía de las personas. Adicionalmente, debido a que estas grandes bases de datos son el insumo principal de los sistemas de marketing que ofrecen los productos y servicios que todos necesitamos, una recolección parcial, incorrecta, o desproporcionada puede llevar a la discriminación [USB2019], la estigmatización o el abuso de posición dominante [CAR2017]. 

El internet se diseñó como una tecnología para intercambiar información entre dispositivos asociados a entidades, no necesariamente a individuos, por lo cual en su diseño se obvió la necesidad de identificar a los usuarios. La utilización masiva del internet por medio del world wide web y la aparición del comercio electrónico promovieron el desarrollo de tecnologías para identificar al usuario con el objetivo de replicar los procesos de mercadeo que se realizaban en el mundo físico. A continuación explicaremos cómo esta necesidad ha llevado a que hoy en día existan herramientas que permiten que por ejemplo cuando se hace una búsqueda en una página de un navegador como google, aparezca publicidad asociada a dicha búsqueda en la página web de una red social o de un portal de noticias.  

¿Cómo se identifican los usuarios en Internet y como se usa para mercadeo? 

Existen diferentes elementos que permiten asociar a un usuario con una identidad en internet, los cuales pueden ser suficientes para promover la venta de un producto o un servicio. Algunos de estos elementos pueden ser la dirección IP, entregada por el proveedor de internet y que permite el direccionamiento de información desde y hacia un dispositivo, la dirección MAC, asociada a la tarjeta de comunicaciones de un computador, el IMEI de los teléfonos móviles, las llamadas cookies o los  advertising IDs para teléfonos que permiten establecer si un usuario que entra a una  página web ya lo había hecho antes,  o incluso identificadores asociados a las conexiones que usan TLS.  

Un elemento en el que vale la pena detenerse es la cookie, que consiste en un identificador que las páginas web almacenan en un navegador, y que permiten identificar a ese usuario, de tal manera que cuando vuelva a visitar esa página, no se pierda la información de la transacción anterior. Esta tecnología es muy importante, debido a que al acceder a una página de internet la comunicación se da por medio de peticiones que se activan cada vez que se digita una URL o se presiona un enlace. Es decir, cuando se establece una comunicación con una página web esta no es continua, sino que se da por medio de peticiones que se activan por parte del usuario. Esto hace que para el servidor web no sea posible saber con certeza qué hizo el usuario antes. Adicionalmente, el reuso de direcciones IP hace que este elemento no sea suficiente para identificar a un usuario. Por lo tanto, las cookies permiten que cuando un usuario entra a una tienda virtual, y busca un libro en específico, cuando vuelva a entrar una semana después lo primero que se le muestre sea ese mismo libro en descuento. Como se puede ver, esta tecnología es muy útil, y como tal le ha permitido a los consumidores tener una experiencia mas personalizada en las páginas web. Adicionalmente, hay empresas que se dedican a reservar espacios en páginas web de tal manera que pueda poner cookies en el navegador de los usuarios a medida que este visita diferentes páginas, y de esta manera hacer un seguimiento que permita entenderlo mejor, no ya solo en la tienda virtual, sino a través de diferentes tiendas. Sin embargo, las cookies no son el único mecanismo para identificar a un usuario. Otra información que permite identificar a un usuario puede ser la versión de su navegador, la resolución de la pantalla, la versión del teléfono y del sistema operativo o la manera en que algunas características de la página web se despliegan en el dispositivo. Todas estas características en conjunto pueden ayudar a identificar a un usuario, que es el primer paso para poder ofrecerle publicidad personalizada. 

Un segundo elemento para entender la manera en que nuestros datos son usados para vender pauta en internet es lo que se conoce como subasta en tiempo real o Real-Time bidding [BAS2019]. Con el objetivo de generar ingresos, las páginas web reservan espacios específicos donde publican contenido publicitario de terceros. Las Supply Side Platforms (SSP), son empresas especializadas en buscar que los dueños de las páginas web saquen el mayor provecho de sus espacios, es decir que los vendan lo más caros posible. Por otro lado, las Demand Side Platforms (DSP), buscan que las empresas que desean poner publicidad accedan a los espacios mas lucrativos. Este proceso, mediante el cual un espacio en específico de una página de internet se asigna a una publicidad específica se da por medio de una subasta, en la cual los SSP ofrecen espacios de páginas web asociados a un usuario específico a diferentes DSP. Este último aspecto, en el que el espacio de la página web está directamente asociado al usuario es el que conlleva mayores riesgos para la privacidad, pues ha llevado a que se intercambie información personal de los usuarios con el objetivo de optimizar el proceso de mercadeo, es decir de llevar la pauta a los usuarios considerados de “mayor valor”. Adicionalmente, [BAS2019] argumenta que en el proceso de venta del espacio, la información del usuario es compartida con todos los  DSPs que participaron en la subasta, lo cual no solo dificulta el control del flujo de esta información, sino que además nubla la comprensión del usuario respecto a la autorización que dio para usar sus datos. 

Dentro del proceso de subasta en tiempo real, los DSPs no tienen acceso a las cookies mencionadas anteriormente, debido a que estas se guardan en el navegador, y el proceso de venta de espacio se hace por parte de los SSPs. Por lo tanto, para solucionar este problema se utiliza una técnica conocida como cookie syncing o cookie matching. Por medio de esta técnica, es posible que diferentes empresas combinen las cookies de diferentes páginas web, de tal manera que sea posible conocer a un usuario que ha visitado dos páginas que no tienen relación. Es decir, se robustece el perfil incompleto de tal manera que se pueda saber con mayor certeza que este usuario tiene la capacidad y el interés de comprar cierto artículo. Sin embargo, esto puede llevar a que esta información que se acumula permita establecer un perfil que un usuario no desea compartir, o que puede ir en contra de su interés, como podría ser información médica. La falta de transparencia en estos procesos puede ir en contra de la confianza de los usuarios en este tipo de sistemas, y puede ser incuso contraproducente para la efectividad de los anunciadores. Esto ha hecho que se popularicen navegadores o buscadores que reducen el rastro digital como duckduckgo y otros. 

Los sistemas captcha  

Un caso muy interesante que presenta un compromiso entre la privacidad de los usuarios y la capacidad de las páginas web de ofrecer sus contenidos con seguridad son los captcha, y en particular el recaptcha de Google. Los sistemas captcha surgieron con el objetivo de evitar que por medio de software se pudiera acceder de manera automática a páginas web, lo cual puede derivar en que estas se saturen y no se pueda ofrecer el servicio a usuarios legítimos, afectando su disponibilidad. Algunos sistemas captcha exigen que por ejemplo para rellenar un formulario se escriba un texto que aparece deformado, lo cual hace que sea difícil de leer para una máquina. Otros sistemas más seguros, le piden al usuario que escoja las imágenes que corresponden a un semáforo, una bicicleta o un vehículo, por ejemplo. Sin embargo, los sistemas más sofisticados evalúan diferentes características del usuario, como por ejemplo si está usando un perfil asociado a su navegador, si tiene cookies que muestren que accede a otras páginas que lo hagan ver “legítimo”, que su dirección IP corresponda con la localización del servicio web, e incluso la manera en que mueve el cursor sobre la página o cómo teclea.  Estas medidas de seguridad reducen considerablemente la capacidad de acceder de manera automática a las páginas web, pero al mismo tiempo generan un riesgo de privacidad para el usuario, pues se crean perfiles que recopilan información asociada a su navegación, sin ni siquiera pedirle su autorización. Es decir, estos sistemas más sofisticados son completamente transparentes para el usuario y generan menos fricción, pero al mismo tiempo recopilan sus datos sin ofrecer información al respecto [FAS2019]. Este tipo de sistemas están desplegados en todo tipo de páginas web comerciales e incluso gubernamentales de Colombia y el mundo, y su éxito en establecer la existencia de un usuario real se basa en la estrecha relación que mantienen los usuarios con Google cuando usan internet. 

Conclusiones 

La necesidad de identificar a un usuario con el objetivo de establecer la capacidad de ofrecerle un producto o servicio surge mucho antes de la popularización del internet. Sin embargo, la alta penetración del internet, y el crecimiento exponencial del comercio electrónico han hecho que la cantidad de información que se recoge haya crecido considerablemente, haciendo que exista una mayor sensibilidad a los riesgos que trae asociados a la privacidad. En este documento explicamos como esta información se puede recoger en un ambiente digital y como se utiliza para fines de mercadeo. Para que esta información pueda seguir siendo utilizada en un ambiente de confianza y con diferentes propósitos, es necesario que exista transparencia respecto a la información que se recoge de los usuarios y del uso que se hace de esta. 

Diego Pacheco-Páramo 

Bibliografía 

[CAR2017] The taking economy : Uber, information and power. R. Calo and A. Rosenblat. Columbia Law Review, Vol. 117, 2017 

[USB2019] Data Brokers and the Impact on Financial Data Privacy, Credit, Insurance, Employment and Housing. Jun 2019. https://www.banking.senate.gov/hearings/data-brokers-and-the-impact-on-financial-data-privacy-credit-insurance-employment-and-housing 

[BAS2019] On the privacy Implications of real time bidding. M. Bashir 2019. https://www.ahmadbashir.com/static/pdf/bashir-thesis.pdf 

[FAS2019] Google’s new captcha has a dark side. Fast Company. Nov 2019. https://www.fastcompany.com/90369697/googles-new-recaptcha-has-a-dark-side.  

1 comment

Comments are closed.