La Inteligencia Artificial generativa para la detección anticipada de riesgos de depresión en la web
Horacio Thompson es Licenciado en Ciencias de la Computación, becario doctoral de CONICET y docente del Departamento de Informática de la FCFMyN. Desarrolla su tarea investigativa en el Laboratorio de Investigación y Desarrollo en Inteligencia Computacional (LIDIC) de la Facultad y fue seleccionado para participar en Uruguay en las 31° Jornadas de Jóvenes Investigadores que promueve la Asociación de Universidades Grupo Montevideo (AUGM).
La multiplicidad de contingencias que surgen del uso de Internet y sus aplicaciones, ha generado una serie de desafíos para las ciencias. Las redes sociales son un medio masivo de comunicación elegido por las personas para compartir información y expresar sus emociones. Horacio trabaja en dar respuesta a un enorme problema de la actualidad: detectar de manera anticipada usuarios de riesgo en redes sociales, centrándose en dominios vinculados a la salud mental como depresión, desórdenes alimenticios, juego patológico, ideación suicida, anorexia, entre otros.
¿En qué consiste la Detección Anticipada de Riesgos?
La Detección Anticipada de Riesgos (DAR) en la Web consiste en identificar usuarios en riesgo tan pronto como sea posible. Para cada usuario de una red social, se cuenta con una lista de publicaciones y el objetivo es emitir una alarma utilizando el menor número posible de posts. Esto implica no solo garantizar respuestas correctas, sino también asegurar la rapidez en la toma de decisiones. Existen desafíos a nivel mundial como CLEF eRisk y MentalRiskES, donde laboratorios de todo el mundo buscan soluciones a estos problemas y en los cuales participamos activamente. Cada año las técnicas se van perfeccionando en función del avance tecnológico y esto nos mantiene en constante crecimiento, no sólo en el área de investigación sino también en los diferentes dominios propuestos. En este contexto, la Inteligencia Artificial Generativa ha revolucionado el mundo de la tecnología, especialmente a través de los Grandes Modelos de Lenguaje (LLMs). Estos modelos han demostrado una notable capacidad para aprender patrones complejos y generar contenido de alta calidad y en múltiples formatos.
¿Cómo trabajan estos modelos y qué desafíos presentan?
Los LLMs son redes neuronales profundas diseñadas para aprender a procesar y generar lenguaje natural, es decir, el que usamos para comunicarnos. Son entrenados con enormes cantidades de datos textuales provenientes de Internet, completando textos con palabras faltantes y luego se ajustan para lograr comportamientos específicos o mejorar el rendimiento en tareas concretas. Como resultado, estos modelos son capaces de generar texto coherente basado en la información previa y sorprendentemente han adquirido habilidades mucho más avanzadas a las que se esperaban, como traducir textos, analizar sentimientos, generar código, entre otras.
Sin embargo, enfrentan grandes desafíos como las alucinaciones, que ocurren cuando generan información incorrecta pudiendo engañar a las personas, diversos tipos de sesgos como étnicos, de género y culturales y el alto costo computacional en entrenamiento e inferencia. Para abordar estas limitaciones, áreas de investigación como interpretabilidad y razonamiento tienen el propósito de comprender a los LLMs y ver si es posible darles la capacidad de “razonar”. Se busca optimizar a los modelos con el fin de garantizar que las respuestas sean fundamentadas y comprensibles por las personas. Los LLMs actualmente no pueden razonar como hacemos los humanos y esto resulta ser uno de los puntos clave de las organizaciones como OpenAI, Google y Meta, quienes trabajan intensamente para perfeccionar la forma en que estos modelos “piensan”. En nuestro laboratorio, dada la importancia crítica de la DAR, actualmente exploramos enfoques que permitan a los LLMs justificar cada una de sus respuestas y, precisamente, esta fue la motivación del trabajo que presentaremos en las Jornadas de AUGM.
¿De qué se trata el trabajo?
Propusimos un método para resolver la Detección Anticipada de Riesgos (DAR) de depresión utilizando estos Modelos sobre textos en español, cuyas respuestas puedan ser interpretadas por humanos. Definimos un criterio de razonamiento basado en los 21 síntomas del Cuestionario de Beck y solicitamos la asistencia de un psicólogo para que analice muestras de usuario según su criterio profesional. Luego, adaptamos el modelo Gemini de Google para resolver la DAR, utilizando las muestras más representativas elegidas por el especialista. Esto nos permitió desarrollar un método cuya solución puede ser evaluada de forma cuantitativa y cualitativa.
¿Y qué resultados han obtenido?
Obtuvimos predicciones precisas y rápidas, superando notablemente a los métodos del estado del arte, incluidos modelos anteriormente propuestos por nuestro laboratorio. Observamos que es posible adaptar el modelo para generar razonamientos coherentes y valiosos en la detección de usuarios, con respuestas justificadas que permiten una comprensión más profunda de la solución. Por ejemplo, notamos que el modelo reconoció los principales síntomas de depresión, destacando la ideación suicida y la desesperanza como indicadores críticos para detectar rápidamente usuarios positivos. Sin embargo, creemos que la intervención de especialistas sigue siendo esencial para garantizar respuestas completamente correctas, ya que algunas muestras fueron muy difíciles de analizar y admiten diversas interpretaciones. Creemos que nuestro estudio ofrece nuevas perspectivas para abordar la DAR aprovechando el poder de los LLMs, tal como la creación de conjuntos de datos más confiables, medidas de desempeño más sofisticadas e incluso la integración de técnicas avanzadas como Grafos de Conocimiento y Retrieval-Augmented Generation (RAG) para optimizar la adaptación de los LLMs en dominios específicos, algo sobre lo que ya estamos trabajando.
¿Qué sentiste al ser seleccionado en las Pre Jornadas de Jóvenes Investigadores de AUGM y qué expectativas tenes para el encuentro que se realizará en Montevideo?
Estoy muy agradecido de haber sido seleccionado para representar a la UNSL. Los trabajos presentados durante las Pre Jornadas fueron excelentes, lo que evidencia el alto nivel académico y la calidad educativa de nuestra Institución. Estoy seguro de que el encuentro en Montevideo será una excelente oportunidad para dar a conocer nuestros aportes y compartir experiencias en un evento que reunirá a investigadores e investigadoras de Latinoamérica y El Caribe, lo que será muy enriquecedor para mi formación profesional y personal.
Si bien Horacio viajará en representación de la UNSL en el evento de AUGM, el equipo de trabajo se completa con la tarea de los Co-autores: Maximiliano Sapino y Edgardo Ferretti, bajo la dirección de Marcelo Errecalde.