Visualización y análisis de datos
La Dra. Luján Ganuza, es investigadora asistente del CONICET y profesora del Departamento de Ingeniería y Ciencias de la Computación de la Universidad Nacional del Sur. Su trabajo se centra en la visualización de datos, computación gráfica y tecnologías inmersivas. Desde hace varios años colabora con docentes del Departamento de Informática de la Facultad.
Este año, dictó un curso de posgrado y brindó una charla abierta para interesados/as en la temática. Ganuza viene desarrollando desde hace tiempo, un vínculo de trabajo colaborativo con profesores locales. En diálogo con la Facultad, relató cómo surgió la relación institucional, qué actividades vienen desarrollando y también nos detalla qué tareas de investigación está llevando a cabo actualmente.
Mi vínculo con la Universidad Nacional de San Luis nació hace tiempo y viene por partida doble. Con mi grupo de investigación llevamos años en contacto y colaboración con Roberto Guerrero, director del Laboratorio de Investigación y Desarrollo en Computación Gráfica. Él es un experto en temáticas relacionadas con la computación gráfica y las tecnologías inmersivas, y siempre es un placer coincidir con su grupo en enriquecedoras colaboraciones y discusiones.
Por otra parte, en un curso de posgrado que dicté para la Especialización en Inteligencia de Datos Orientada a Big Data de la Facultad de Informática de la UNLP, tuve el gusto de conocer a la Esp. Mercedes Barrionuevo, docente de la UNSL. Tuve el honor de dirigir su excelente trabajo final de la especialización. En el marco de este trabajo, se estrechó una relación de colaboración muy amena con Mercedes, y luego de finalizar su destacado desempeño, logramos publicar un artículo en el Congreso Argentino de Ciencias de la Computación en 2023. A partir de esta primera colaboración, continuamos trabajando juntas, y con la Dra. Marcela Printista, me invitaron formalmente a dictar un curso de posgrado en la FCFMyN.
Durante mi estadía en la FCFMyN de la UNSL, dicté una charla para la comunidad académica referida a mis temáticas de investigación, impartí el curso de posgrado y pude reunirme con docentes de la universidad para conversar sobre las posibilidades de aplicación de técnicas de visualización en sus áreas de interés. El objetivo principal del curso de posgrado consistió en que los alumnos adquirieran los conocimientos teóricos, los detalles prácticos y las herramientas necesarias para construir visualizaciones que permitan el análisis visual de grandes volúmenes de datos. Para ello, nos enfocamos primero en una introducción al análisis visual de datos y a los procesos involucrados en la tarea de visualización, exploramos las componentes fundamentales involucradas en el proceso y, en cada etapa, presentamos los conceptos, las tecnologías básicas, las técnicas y los algoritmos en uso hoy en día. La experiencia del curso fue excelente y mi estadía, sumamente enriquecedora.
Cómo informática ¿cómo te interesaste en el análisis virtual de datos? ¿Hubo algún/a docente o referente que haya sido un estímulo para que escojas este camino dentro de la investigación?
Durante mi paso por la Universidad Nacional del Sur, cursé la asignatura de Computación Gráfica bajo la cátedra de la Dra. Silvia Castro. Ella era la directora del Laboratorio de Investigación y Desarrollo en Visualización y Computación Gráfica y en ese momento, la Dra. Castro nos invitó a los alumnos a considerar la posibilidad de solicitar becas de iniciación a la investigación para estudiantes avanzados.
Las temáticas relacionadas con la computación gráfica siempre despertaron un gran interés en mí, y cuando Silvia me habló sobre la Visualización de Datos, mi entusiasmo se acrecentó aún más. Fue entonces cuando decidí, a la primera oportunidad, aplicar para una de estas becas, la cual me fue adjudicada. A partir de ese momento, tuve el privilegio de formar parte del laboratorio, trabajando en fascinantes proyectos vinculados a la visualización de datos, computación gráfica y tecnologías inmersivas.
Centrándonos en este tema ¿qué implica el análisis visual de datos? ¿qué herramientas emplean desde la informática para facilitar esa lectura y análisis? ¿con qué tipo particular de datos trabajas y por qué?
El análisis visual de datos implica el uso de representaciones gráficas para explorar, analizar y comunicar información compleja de manera intuitiva y efectiva. Esta poderosa herramienta permite identificar patrones, tendencias y relaciones que podrían pasar desapercibidas en grandes conjuntos de datos. Desde el ámbito de la informática, existen diversas herramientas y técnicas que facilitan el análisis visual de datos. Desde el punto de vista de aplicación o generación de gráficos, podemos distinguir tres grandes grupos. En primer lugar, las herramientas configurables, como Tableau, Power BI, entre otras, permiten crear visualizaciones interactivas, paneles de visualización y visualizaciones personalizadas a partir de diferentes conjuntos de datos, brindando una gran versatilidad. En segundo lugar, las librerías de visualización, como Matplotlib, Plotly, Bokeh para Python, D2.js para javascript, ggplot2 para R, entre otras, ofrecen la posibilidad de programar una amplia variedad de gráficos y visualizaciones, proporcionando un alto grado de personalización. Finalmente, existen las soluciones diseñadas específicamente para resolver un problema en particular. En esta última categoría es donde nos especializamos con nuestro grupo de investigación. Trabajamos arduamente en el diseño y desarrollo de soluciones de análisis visual para datos multidimensionales en general, y provenientes de las ciencias geológicas y de dispositivos de seguimiento ocular en particular, intentando abordar desafíos complejos de manera innovadora.
¿Cuáles son las aplicaciones que tiene?
La visualización de datos es una disciplina transversal que permea prácticamente todos los dominios de aplicación. Se trata de una ciencia multidisciplinaria que estudia alternativas de resolución de problemas complejos a partir de representaciones visuales intuitivas y poderosas. Siempre que exista un desafío que pueda ser abordado mediante un conjunto de datos, la visualización de datos tiene el potencial de hacer una contribución significativa.
Las aplicaciones de la visualización de datos son verdaderamente vastas y abarcan una amplia gama de disciplinas, desde las ciencias naturales y la investigación académica hasta los negocios, la inteligencia empresarial y el periodismo de datos. Incluso en ámbitos aparentemente alejados, como las artes y las humanidades, la visualización de datos ha demostrado ser una herramienta invaluable para explorar y comunicar ideas complejas de manera accesible y atractiva.
En definitiva, la visualización de datos es una ciencia versátil y poderosa que, mediante la combinación de técnicas avanzadas y un enfoque centrado en el usuario, tiene el potencial de resolver problemas complejos en prácticamente cualquier dominio, siempre que existan datos subyacentes que puedan ser analizados y representados visualmente.
Trabajas también en el desarrollo de técnicas de visualización de datos de seguimiento ocular. ¿Podrías contarnos de qué se trata? ¿Cuáles son sus aplicaciones?
Desde hace algunos años nos enfocamos en el análisis visual de un tipo específico de datos espacio-temporales: los datos provenientes de un registrador de movimientos oculares, conocido como eye-tracker (ET). El ET registra y graba, durante un determinado tiempo y a una determinada frecuencia, tanto la posición ocular como otras variables adicionales, como la velocidad, la aceleración y el diámetro de la pupila, entre otras.
El seguimiento de los movimientos oculares permite analizar la información adquirida por una persona durante la realización de diversas actividades, tales como la lectura, la observación de una imagen, la conducción de un vehículo, etc. Sin importar si se utilizan métodos estadísticos o visuales para el análisis de los datos obtenidos mediante ET, durante los experimentos realizados se genera una gran cantidad de datos.
Si bien los métodos estadísticos proveen resultados cuantitativos, las técnicas de visualización permiten que los investigadores analicen y exploren diferentes niveles y aspectos de los datos generados en sus experimentos llevados a cabo con el ET. Las técnicas de visualización ayudan a analizar tanto los aspectos espacio-temporales de los datos generados por el ET como las complejas relaciones que puedan existir entre los diversos datos y tipos de datos obtenidos. Esta exploración de características más cualitativas también colabora en la construcción de hipótesis que podrían ser posteriormente investigadas con métodos estadísticos.
Debido a la creciente complejidad de las tareas y estímulos posibles en los experimentos de eye-tracking, consideramos que la visualización jugará un rol cada vez más relevante en el análisis de experimentos con ET. En particular, en lo que respecta a movimientos oculares, se está trabajando en el desarrollo de técnicas de visualización innovadoras para analizar la información adquirida por una persona durante la realización de actividades como: Lectura de oraciones, observación de una imagen con el objetivo de responder determinadas preguntas y conducción de un vehículo sujeta a determinadas restricciones.
Estas técnicas de vanguardia permitirán a los investigadores obtener una comprensión más profunda de los complejos procesos cognitivos involucrados en estas tareas, abriendo nuevas oportunidades para avanzar en el conocimiento y la práctica en diversos campos.