¿Es posible evitar los daños ocasionados por el uso de Machine Learning en redes sociales?

Trabajo de investigación presentado durante el 1º bimestre del año 2021 por la alumna Martina Fumiere en el contexto de la asignatura «Inteligencia Artificial y Derecho», dictada por la Profesora Cecilia C. Danesi en la Facultad de Derecho de la Universidad de Buenos Aires.





Todo lo que nos ocurre, incluso las humillaciones, las desventuras, los bochornos, todo nos es dado como material, o como arcilla, para que modelemos nuestro arte. - J. L. BORGES[1].





1) Introducción

No es noticia que hoy en día, con el avance de la tecnología, utilizamos las redes sociales para interactuar constantemente. Así, compramos productos, nos informamos, contratamos servicios, conectamos con familiares o amigos, entre otras cosas, a partir del uso de estas redes. Pero, ¿en qué medida las redes sociales influencian de forma negativa en nuestras vidas?

Mediante el presente trabajo de investigación, introduciremos el uso de los algoritmos de machine learning, (también llamado “aprendizaje automático”) aplicados en las redes sociales, para así analizar su relación desde el ámbito de la responsabilidad civil, por los daños que podrían ocasionar.

En este sentido, abordaremos cómo desde nuestro ordenamiento jurídico, podemos responder frente a los daños derivados por esta herramienta de inteligencia artificial, y qué proponemos para prevenirlos.


2) Algunos conceptos previos

En principio, debemos aclarar que no existe una equivoca definición respecto del concepto de Inteligencia Artificial (en adelante “IA”), sin embargo, a los fines del presente trabajo - tomando los parámetros de los especialistas Luger y Stubblefield[2]- entendemos a la IA como una rama de las ciencias de la Computación que se ocupa de la Automatización del comportamiento inteligente.

Uno de los campos más comunes e importantes en el ámbito de la IA, es la técnica de Machine Learning (en adelante, “ML”), que se trata de un sistema de datos de aprendizaje automático. El creador de este término, Arthur Samuel, define al ML como un campo de estudio que proporciona a las máquinas la capacidad de aprender sin ser programadas de forma explícita[3].

Si bien pocas veces se escucha hablar del término “Machine Learning”, debemos destacar que esta técnica se presenta en la mayoría de las herramientas que utilizamos diariamente. Es decir, desde que nos levantamos y desbloqueamos nuestro Smartphone a través del reconocimiento facial, hasta las recomendaciones de las plataformas de streaming, los resultados de los motores de búsqueda de internet y los mails que recibimos etiquetados como spam.


3) ¿Cómo funcionan los modelos de Machine Learning?

El sistema de ML, consiste en algoritmos de aprendizaje automático, que trabajan sobre la base de una gran cantidad de datos, para entrenar al sistema a fin de que realice una predicción, o agrupe elementos, según el resultado que se espera obtener[4].

El aprendizaje automático se refiere a la capacidad del software y computadoras de conjuntos muy grandes de datos que permite a los sistemas adaptar su comportamiento a circunstancias cambiantes[5].

Es decir, es una técnica que, a medida que analiza los datos que se le proveen, estudia los diferentes patrones para crear predicciones o comprender las relaciones entre variables[6]. Esta herramienta, se basa en procedimientos matemáticos y estadísticos, partiendo de una serie datos relevantes introducidos (también llamados input data) a fin de que aprenda las reglas relacionadas con el objetivo determinado, para así automatizarse.

Un sistema de ML aprende con ejemplos, no con instrucciones. Es por ello, que se afirma que debe ser entrenado, y no programado[7], ya que a mayor cantidad de datos y resultados a analizar, mejor realizará el trabajo deseable.

A modo de ejemplo, proponemos el siguiente planteo, a grandes rasgos, para un entendimiento de ML, en lenguaje claro:

Supongamos que queremos diseñar un sistema de ML cuyo objetivo sea que reconozca cuentas falsas en una red social. Para ello, le introduciremos información sobre las conductas de las cuentas falsa que permitan detectarlas (input data), por ejemplo, según la cantidad de solicitudes de amistad que envié por minuto, si realiza excesivas publicaciones, según si no tiene fotografías, dependiendo del nombre de usuario, o las cuentas con las que interactúa. Así, a mayor cantidad de datos que introducimos en este sistema, mayor será el rendimiento para detectarlas.

Luego, debemos entrenar al algoritmo con información constatada, haciéndole saber cuáles son o no las características que coinciden con el objetivo propuesto (“A” se trata de una cuenta falsa; “B” no es falsa).