Una docena de países de América Latina unieron esfuerzos para crear el primer lenguaje de inteligencia artificial de gran tamaño que entiende las particularidades de la región y cuya primera versión será lanzada en septiembre, anunciaron el martes autoridades chilenas.

La iniciativa Latam-GPT de código abierto está coordinada por el estatal Centro Nacional de Inteligencia Artificial (CENIA) de Chile en conjunto con más de 30 instituciones de toda la región como espacio colaborativo.

"Creemos puede ser un elemento democratizador de la inteligencia artificial y un acelerador del uso de IA en distintos espacios", dijo a periodistas la ministra chilena de Ciencias, Aisén Etcheverry.

"En el caso de Chile estamos partiendo con los municipios, pero ¿por qué no soñar con las escuelas, los hospitales? (...) que tengan acceso a un modelo de lenguaje que no es importado y que refleja nuestro idioma?", agregó.

El proyecto arrancó en enero de 2023 con financiamiento reducido de cada participante con el objeto de corregir las usuales inexactitudes y límites de desempeño de otros modelos generados en inglés y para el contexto global, detallaron los responsables.

Las autoridades aclararon que el modelo es un motor de datos sobre los que se pueden desarrollar aplicaciones y otras soluciones, como los conocidos chatbots.

"No es comparable el Latam-GPT con DeepSeek o ChatGPT y el resultado de esto también es muy distinto porque no es un producto que yo voy a ir a comprar sino que es un motor que va a quedar disponible", afirmó Etcheverry.

El modelo latinoamericano además busca la conservación de lenguas originarias, ya que incluso se generó el primer traductor de la lengua nativa de la turística Isla de Pascua, lo que pretenden extender a otras culturas ancestrales del resto de los países.

La intención con el lenguaje es desarrollar asistentes virtuales para servicios públicos, sistemas educativos personalizados o traductores de lenguas originarias. Ya se han iniciado pilotos en municipios chilenos para aplicaciones de soluciones locales.

Técnicamente, el modelo es un versión de Llama 3 de 70.000 millones de parámetros cuyo entrenamiento se realiza en una estructura de supercómputo regional incluyendo el centro de la universidad chilena de Tarapacá y cómputo en la nube. Además contó con el apoyo del banco de fomento regional CAF.

Pese a no contar con un presupuesto para su impulso, el jefe del CENIA, Álvaro Soto, confía en que a medida que se muestren las capacidades del sistema se tenga acceso a mayores recursos.

"No me veo compitiendo con lo que está haciendo ChatGPT o estas empresas que están poniendo unas cantidades de dinero que realmente por mucho que juntemos no es la cantidad de dinero que podemos levantar", dijo.

El proyecto posee además una alianza con Amazon Web Services y el Data Observatory que le habilita una mayor capacidad de cómputo de datos.

En tanto, el CENIA está activamente buscando la recolección de datos inéditos a lo largo de la región para alimentar el modelo, aunque reconoce que la generación de datos de algunas zonas como el Caribe llevaría más tiempo debido a la brecha digital que persiste muchas naciones del continente.

