Estudiantes desarrollaron algoritmos de inteligencia artificial que permiten acceder al archivo de Abuelas

Contiene más de 10 mil noticias de diarios y revistas reunidos a lo largo de 45 años; fueron convocados por la Fundación Sadosky

25 de julio, 2023 | 00.05

Aunque la inteligencia artificial (IA) despierta temores, los aportes de estudiantes de todo el país distinguidos este lunes en el edificio Cero+Infinito de la Ciudad Universitaria permiten apreciar una aplicación ciertamente virtuosa de esta tecnología. Allí, en una emotiva ceremonia, se entregaron los premios del “Desafío Inteligencia Artificial por la Identidad”, convocatoria lanzada en marzo pasado por la Fundación Sadosky en conjunto con Abuelas de Plaza de Mayo para digitalizar y hacer accesible el archivo de más de 10.000 recortes periodísticos reunidos durante 45 años.

Tercer puesto para Oscar Matías Bonfanti de la UTN Facultad Regional Resistencia; Matías Naranjo Harper de la Universidad Nacional de Rosario y Joel Stanich, del Instituto Politécnico Provincial de Córdoba

Los ganadores fueron tres equipos, cada uno de cuyos participantes recibió una computadora con procesadores de alto rendimiento y memoria RAM de gran capacidad. En primer lugar, se ubicó “Les Cigarres”, integrado por Julieta Goria, Sofía Goy y Francisco Sandalinas, de la Facultad de Ciencias Exactas y Naturales (UBA). El segundo fue para “Ana Teresa Diego”, compuesto por Agostina Filócomo, Ezequiel Pássaro, y Adolfo Simaz Bunzel, de la Universidad Nacional de La Plata. Y el tercero, para "Three Data Scientists", integrado por Oscar Matías Bonfanti de la UTN Facultad Regional Resistencia; Matías Naranjo Harper de la Universidad Nacional de Rosario y Joel Stanich, del Instituto Politécnico Provincial de Córdoba.

No sé bien por qué está la idea de que los científicos, y en especial los que nos dedicamos a las ciencias ‘duras’, estamos desconectados de las problemáticas sociales y de derechos humanos. Ojalá sirva este evento para mostrar que no es así, que todo lo que pasa en relación con los derechos humanos le pasa a la Argentina, y a nosotros como científicos y científicas con mucha intensidad”, dijo Fernando Schapachnik, director ejecutivo de la Fundación Sadosky.

Guillermo Durán, decano de Exactas, y Fernando Schapachnik, de la Fundación Sadosky

Schapachnik contó que se encontraron con una colección de recortes periodísticos que habían sido escaneados, pero a la que no se podía acceder y en la que era muy difícil buscar. “Era como un archivo en papel o más incómodo”, comentó.

Convocados por “Abuelas”, los científicos se pusieron manos a la obra. El “Desafío…” (no quisieron llamarlo “concurso” o “competencia”, porque la intención fue que se trabajara en equipo) retó a los participantes a desarrollar algoritmos de inteligencia artificial que permitieran consultarlo con más facilidad en una versión digital. La tarea no fue fácil.

“Hasta casi sus últimos días, nuestra abuela Raquel [Radio de Marizurrena] se tomó el trabajo de sentarse en un escritorio todos los días a leer los diarios y a recortar cada artículo que tenía que ver con los derechos humanos, que luego fueron guardados en carpetas, carpetas y más carpetas –contó Juan Pablo Moyano, nieto recuperado–. Entonces, hicimos como siempre, como aprendimos de ellas, que cuando no sabían o no encontraban la forma de hacer algo, pedían ayuda a la sociedad y les aportaban conocimiento, trabajo, tiempo al servicio de su búsqueda, que es colectiva. El fin, aparte de seguir encontrando a nuestros hermanos, es también que la gente pueda continuar conociendo a través de los años la obra magnífica que hicieron”.

Victoria Dumas

En un primer momento, cerca de 60 personas tuvieron que “etiquetar” manualmente cada recorte; es decir, indicarle al software qué parte era la nota propiamente dicha, cuál el título, cuál el texto, cuál la bajada. “Fue un trabajo que tomó muchas horas y que nosotros no hubiéramos podido abordar por la cantidad de cuestiones que iban surgiendo de la exploración misma de los datos. Ese constituyó el primer gran desafío y lo encararon ‘de diez’ –explica Victoria Dumas, líder del equipo de IA de la Fundación–. Lo que se pidió que hicieran los algoritmos fue distinguir esas partes en la imagen escaneada y poner esa información en un formato amigable para hacer búsquedas. Los participantes ‘entrenaron’ el programa con un conjunto de noticias que había sido previamente etiquetado y nos dieron el código para poder ejecutarlo. Hubo mucho trabajo conjunto, porque estos algoritmos lo que requieren es que uno tenga un buen cuerpo de ejemplos para poder ‘entrenar’ el sistema. Aparte, armamos un conjunto de imágenes de noticias que el algoritmo no había visto y que iba a tener que "leer" (es decir, identificar sus partes). Sobre la base de ese corpus que no conocían los participantes, nosotros testeamos el código”.

Segundo puesto para Agostina Filócomo, Ezequiel Pássaro, y Adolfo Simaz Bunzel, de la Universidad Nacional de La Plata

Se anotaron más de 200 postulantes de 13 provincias. Después de la etapa de etiquetado, se presentaron 22 equipos y finalmente llegaron a la final 12.

Trabajaron muy intensamente. Recuerdo que cuando empezamos a hacer el etiquetado surgían tantas dudas que dependiendo de la decisión que se tomara se podía llegar a mejorar mucho la utilización posterior de esos datos y se decidió postergar un par de semanas la entrega –destaca Dumas–. De hecho, sabemos que algunos equipos estaban muy interesados en participar, pero no les dio el tiempo”.

Una de las dificultades que debieron enfrentar consistió en que las  notas más antiguas presentaban menor legibilidad, incluso por parte de humanos. “Por eso, tratamos de darles a los distintos equipos una cantidad equilibrada, entre notas más antiguas y más nuevas, más largas y más cortas, y de diferentes orígenes, porque cuantas más imágenes se le den al sistema, más chances hay de que pueda detectar después con mayor fiabilidad cada parte”.

La diferencia entre el primero, el segundo y el tercer premio radicó  no tanto en qué tan bien reconocían los artículos, porque llegaron a resultados muy parecidos, sino más bien en cómo respetaron la consigna. “Hubo equipos que explicaron mejor cómo funcionaba el algoritmo, que eso era algo que nos interesaba, que fuera explicable –subraya Dumas–. Otros hicieron algún trabajo de ‘limpieza’ previo, que en estos casos es bastante importante; otros agregaron algunos pasos intermedios que también ayudaban a mejorar la calidad final. Así se dieron las diferencias que establecieron el ranking, pero los tres equipos hicieron un muy buen trabajo”.

Así es el material periodístico con el que hubo que trabajar

Durante el acto, se recibieron mensajes de agradecimiento por la iniciativa de Estela de Carlotto, presidenta de “Abuelas” (desde México, donde había quedado varada en el aeropuerto) y de Tati Almeida. “No me equivoco al decir que estamos tranquilas porque ustedes son el recambio”, dijo esta última, de la ONG Madres de Plaza de Mayo Línea Fundadora.

"Este trabajo es por la identidad de todos. Todas las personas tienen derecho a saber quiénes son, de dónde vienen y quién es su familia. Soy chilena, pero quiero agradecerle a la sociedad argentina. Tenemos muchos nietos que encontrar antes de que nos vayamos las últimas que quedamos, que somos muy poquitas", dijo Buscarita Roa, vicepresidenta de “Abuelas”.

Y en el final, el Ministro de Ciencia, Daniel Filmus, mencionó que la relación entre éstas y la ciencia siempre hubo una relación virtuosa. “Muchas veces las iniciativas partieron de ellas. Hicieron un aporte reconocido en el mundo al promover el desarrollo del 'índice de abuelidad’”, destacó.

El archivo está accesible ahora en versión “prototipo” armado sobre la base del equipo ganador en este link: http://buscador-ia-por-la-identidad.fundacionsadosky.org.ar. Pero los científicos ahora quieren seguir avanzando y desarrollar un buscador que permita explorarlo con más facilidad.