Entradas

Nuevo profesional del Doctorado en Ciencias de la Computación

Sergio Burdisso defendió su tesis del “Doctorado en Ciencias de la Computación”, carrera de posgrado de la Facultad de Ciencias Físico Matemáticas y Naturales (FCFMyN), que se dicta en el Departamento de Informática.

Dicha tesis se tituló “Determinación del Perfil del Autor en Contextos de Clasificación Anticipada de Textos para Múltiples Dominios”, dirigida por el Dr. Marcelo Errecalde (UNSL) y co-dirigida por el Dr. Manuel Montes y Gómez (Instituto Nacional de Astrofísica, Óptica y Electrónica, México)

El jurado a cargo de la evaluación estuvo integrado por:

Presidenta: Dra. Marcela Printista (Decana de la FCFMyN)

Dr. David Enrique Losada Carril (Universidad de Santiago de Compostela, España)

Dr. Alfonso Ureña López (Universidad de Jaén, España)

Dr. Guillermo Leguizamón (UNSL)

El flamante Doctor en Computación contó lo que significa culminar su carrera de posgrado en la FCFMyN: “Es un momento de felicidad por haber logrado cerrar este ciclo de varios años en mi vida. Asimismo, estoy con esa mezcla de incertidumbre y emoción propia de todos los cierres de ciclos en la vida, en los que al terminar una etapa, una nueva comienza”.

– ¿Por qué elegiste este tema de investigación?

-Siempre sentí mucha curiosidad e interés por la Inteligencia Artificial. Por lo que, una vez concluida la Licenciatura, me contacté con el Dr. Marcelo Errecalde, docente de la Facultad, para consultarle por posibles temas de investigación para abordar en el doctorado, y entre ellos, elegí este tema porque me pareció el más interesante y a su vez el más desafiante.

– ¿Cómo es el proceso para la determinación del perfil de un autor en el contexto estudiado?

-El contexto estudiado fue la detección anticipada de riesgo en redes sociales, en particular la experimentación y puesta a prueba del modelo desarrollado se llevó a cabo en la determinación del perfil psicológico de los usuarios. Siendo más precisos, las tareas puntuales abordadas fueron la detección anticipada de depresión, anorexia y conductas autodestructivas en usuarios de Reddit, utilizando los datos de un desafío anual denominado “eRisk” (Early Risk Detection on the Internet) en el que diversos equipos de investigación de todo el mundo participan año a año. En el año 2019, participamos utilizando el modelo desarrollado y obtuvimos los mejores resultados entre todos los equipos de investigación participantes.

En este contexto, el proceso de determinación del perfil (psicológico) del autor en relación a trastornos mentales es llevado a cabo automáticamente por el modelo desarrollado en sí mismo. El modelo desarrollado, al cual llamamos SS3, utiliza un conjunto de ecuaciones que le permiten aprender a valorar las palabras automáticamente en relación al trastorno en cuestión, luego, a medida que procesa el contenido generado por los usuarios va acumulando evidencia en base a las palabras procesadas, hasta que eventualmente, el modelo acumula la suficiente evidencia como para poder decidir qué usuarios están en riesgo por padecer dicho trastorno.

-¿Qué tan fácil es para una persona comprender los modelos interpretables y los modelos explicables?

-Se dice que estos modelos son interpretables si son fáciles de comprender para un humano, es decir, si es fácil de comprender las razones por las que el modelo toma una decisión en base a la entrada procesada. Por otro lado, cuando el modelo es lo suficientemente complejo, no es posible comprender las decisiones que toma, en este caso, se deben utilizar técnicas y mecanismos especiales que intenten explicar, mediante aproximaciones, el funcionamiento de estos modelos. En este último caso se dice que los modelos no son interpretables, sino explicables. En tareas de riesgo que involucran, o se espera que involucren, la vida de personas reales, como las abordadas en el doctorado, se espera que los modelos sean interpretables por un humano, no explicables, ya que de este modo los modelos serán transparentes y , por lo tanto, confiables.

-¿Cómo se logra saber si un modelo es transparente y confiable?

-Un modelo será transparente y confiable si es fácil para los humanos poder comprender sus decisiones. De esta forma, la decisión final puede ser manualmente analizada y validada por humanos expertos en el dominio abordado (por ejemplo, un experto en enfermedades mentales). En caso contrario, cuando el modelo es complejo y “oscuro”, funciona como una caja negra, la cual recibe la entrada y produce una salida, pero sin “dejar ver” cómo funciona su interior. Por lo tanto, los humanos no pueden validar dichas decisiones (un ejemplo de modelos “oscuros” serían las redes neuronales profundas, que constan de miles de millones de parámetros, y que son ampliamente utilizadas por nosotros indirectamente día a día, cada vez que YouTube nos recomienda un video, Netflix una película, Facebook nos muestra publicidad, entre otros).

-¿Qué se entiende por valoración de palabras?

-Como se explicó anteriormente, el modelo desarrollado parte de aprender a valorar las palabras en relación a la tarea abordada. El modelo se formuló de forma general, y puede aprender dicha valoración sin depender de ningún tipo de tarea en particular, siempre que se dispongan de datos para entrenarlo (por ejemplo, contenido de usuarios, noticias, libros, etc. Dependerá de la tarea abordada lo que “datos” signifique). Personalmente, creo que el mayor aporte de mi doctorado fue el haber podido crear este conjunto de ecuaciones que le permiten al modelo aprender a valorar las palabras en base a los datos procesados. La diferencia que tienen estas ecuaciones con otras ya existentes, es que fueron creadas con el objetivo de aprender una valoración que es intuitiva de comprender para los humanos, intentando imitar una valoración similar a la que haría un humano. En la última etapa del doctorado desarrollé una herramienta que, coloreando cada palabra con una intensidad proporcional al valor aprendido, le permite a los investigadores o expertos humanos en el dominio abordado, comprender visualmente las razones en base a las cuales el modelo tomó la decisión. También dejé disponible en línea (http://tworld.io/ss3/) dos demos que permiten probar esto en línea.

-¿Cómo se lograría un clasificador ideal de textos de múltiples dominios?

-Dependerá de los dominios abordados. En nuestro caso particular, los dominios abordados fueron todos de detección anticipada de riesgo en línea. En la primera parte del doctorado delineamos qué características debería tener un clasificador (modelo) ideal para abordar dominios de detección anticipada de riesgos en redes sociales. En este sentido, dado que en estos dominios los modelos deben:

1. Procesar un flujo continuo (e infinito) de texto correspondiente a la secuencia de publicaciones/texto de los usuarios.

2. Poder decidir si la información procesada es suficiente para clasificarlos.

3. Ser transparentes y confiables.

Un modelo ideal debe poder abordar estos tres aspectos de una forma eficiente e integral, por lo que determinamos que un modelo ideal debe poseer, al menos, las siguientes características:

1. Poder trabajar/funcionar incrementalmente.

2. Capturar, contener y sintetizar, desde la secuencia de entrada, la suficiente información como para poder decidir cuándo clasificar con efectividad.

3. Ser un modelo interpretable, con capacidad de explicarle visual y naturalmente la clasificación al humano.

El modelo desarrollado durante el doctorado se creó con el objetivo de poseer estas tres características de una forma integral.

– ¿En qué ámbito trabajás actualmente?

-Más allá de la tarea docente que llevo a cabo hace unos años como auxiliar de primera en el Departamento de Informática, no estoy realizando ningún otro trabajo porque la beca doctoral de CONICET no permite tener otro trabajo. De todas formas, ahora que terminé el doctorado y ya no tengo la beca, tengo que decidir cuál será “el siguiente paso”, decidir si trabajaré en el sector privado o si continuaré por el camino de la investigación, por ejemplo, realizando un postdoc en el exterior por unos años.

– ¿Por qué es recomendable cursar el Doctorado en Ciencias de la Computación?

-Depende de la personalidad de cada persona lo que puede adaptarse mejor a cada uno. En mi caso, además de siempre tener ganas de aprender cosas nuevas, soy una persona muy curiosa a la cual no le gusta utilizar algo sin querer saber cómo funciona o por qué funciona, constantemente estoy indagando y profundizando al respecto. Eso me dio a entender que tengo un perfil que encaja bien con el perfil científico. En el caso de la computación, siempre estoy indagando por cómo todo funciona, intentando comprender cada vez más y más todos los niveles de abstracción involucrados en lo que conocemos como “la computadora”, desde los transistores hasta lo más abstracto, como la Inteligencia Artificial. El Doctorado en Ciencias de la Computación podría ser recomendable para las personas que sean curiosas, que les guste indagar, aprender y profundizar en el tema de investigación abordado. También para personas que les gusten los grandes desafíos, ya que probablemente tendrán que trabajar en el límite de lo que puede, o no, ser resuelto computacionalmente, buscando aportar ese granito de arena que permita expandir dicho límite un poco más, para finalmente, como científico, brindarle a la humanidad ese conocimiento generado por medio de, por ejemplo, publicaciones de artículos científicos y/o materializado en forma de software.

Una nueva Defensa de Tesis Virtual: Doctorado en Ciencias de la Computación

Jan Strappa Figueroa defendió su Tesis de Posgrado de la carrera Doctorado en Ciencias de la Computación, carrera que se dicta en el Departamento de Informática de la Facultad de Ciencias Físico Matemáticas y Naturales.

La investigación se tituló “Diseño de Algoritmos de Optimización para el Aprendizaje de Estructuras en Redes de Markov” y la defensa se realizó de manera virtual a través del Sistema de Videoconferencia de la FCFMyN – Webex.

El comité evaluador fue presidido por el Ing. Alfredo Debattista e integrado por el Dr. Marcelo Falappa, Dra. Marcela Printista, y Dra. Olinda Gagliardi, quienes consideraron que el trabajo presentado por Strappa Figueroa constituye un aporte sólido dentro de la Ciencias de la Computación, respaldado por una intensa actividad científica y por un signficativo número de publicaciones.

Jan comentó cómo fue su experiencia en el cursado del Doctorado y explicó su investigación en la siguiente entrevista:

– ¿Qué significa haber finalizado esta etapa en este contexto virtual?

-Al principio creía que iba a ser mucho más fácil que en un contexto presencial, por no tener que viajar y porque me resulta más cómodo hablar en público con una pantalla de por medio. Sentía que tenía alguna especie de ventaja injusta por las circunstancias. Pero al final entendí que el esfuerzo y el logro son los mismos, solo que los desafíos son ligeramente diferentes. Por ejemplo, ya teniendo la preparación adecuada, me preocupaba mucho más que fallaran el audio o el video (y el jurado no pudiera seguir la defensa o, peor aún, esta se pospusiera) que equivocarme en alguna parte de la presentación. La exigencia es la misma y las defensas siguen siendo públicas, por streaming. También tuve dificultades para practicar la presentación con mi director de tesis y colegas, y para conseguir la calidad de conectividad necesaria. Después de aprobar la defensa, pude compartir momentos muy lindos con familiares, y virtualmente con colegas y amistades. Antes tenía la ilusión de celebrar conociendo un poco más de San Luis, de tener alguna reunión con mi grupo de investigación y otra con mis demás amistades. Aunque todo eso tendrá que esperar, la alegría es enorme.

-¿Cómo fue la experiencia del cursado con los viajes desde Mendoza?

-A veces fue difícil organizarme con los viajes, el alojamiento y los trámites, pero por suerte muchos de los cursos ofrecidos por la facultad son intensivos y requieren un solo viaje. En otros casos me han permitido saltearme algunas clases, estudiando los contenidos por mi cuenta y haciendo consultas virtualmente.

– ¿Cómo explica el tema investigado? ¿En dónde se aplicará?

-El tema tiene que ver con un tipo de modelos probabilísticos, los modelos loglineales, los cuales sirven para representar ciertos conjuntos de independencias probabilísticas. Son muy utilizados, y por esto existen diversos algoritmos de aprendizaje automático de estas estructuras a partir de datos. Para evaluar la calidad del aprendizaje de estos algoritmos es necesario comparar estructuras aprendidas con estructuras «correctas». El problema es que hasta ahora esa comparación se hacía con medidas indirectas que tienen limitaciones. El aporte de mi tesis es un método que permite comparar las estructuras de independencias de distintos modelos de forma directa, y con ciertas garantías teóricas. Esto permitirá realizar una evaluación de algoritmos más precisa, y puede contribuir al diseño de nuevos algoritmos y a su selección para determinadas aplicaciones.

– ¿Por qué razones recomienda cursar la carrera?

-Por un lado, la cantidad, calidad y contenido de los cursos son excelentes, así como la flexibilidad al hacer la carrera de forma no estructurada. También valoro mucho la atención que me brindaron a lo largo del doctorado y la cuidadosa organización para permitirme defender mi tesis con el mínimo de dificultades, las cuales fueron puramente técnicas.

-¿En dónde se desempeña actualmente?

-Formo parte del grupo DHARMa (Desarrollo de Herramientas de Razonamiento y Aprendizaje con Máquinas), un grupo de investigación en la Universidad Tecnológica Nacional, Facultad Regional Mendoza.

– Ya contando con la Ingeniería en Sistemas y el Doctorado en Ciencias de la Computación, ¿su próximo objetivo tiene que ver con lo académico o investigación?

-Me interesa seguir investigando. Por el momento estoy terminando de preparar algunas publicaciones relacionadas con mi tesis, y también comenzando con un nuevo tema con el que voy a trabajar durante mi beca postdoctoral de CONICET.