Desde LuzIA al PERTE de la Lengua o la RAE, son varias las iniciativas que aprovechan la Inteligencia Artificial en el uso del leguaje español.
TEXTO: ARANTXA HERRANZ
MarIA, LuzIA… Si estos nombres no te suenan, guárdalos en tu memoria, porque tienen mucho que decir en lo que a Inteligencia Artificial en español se refiere. Aunque es cierto que la mayoría de los desarrollos de la Inteligencia Artificial, como de cualquier tecnología, se produce en inglés, el español es, por derecho propio, otro de los idiomas en los que más se está avanzando en IA. Algo a lo que contribuye no solo el hecho de que el nuestro sea uno de los cinco idiomas más hablados del mundo (el ranking depende de qué listado se consulte), sino porque también desde empresas, tanto públicas como privadas, de nuestro país se están poniendo los cimientos para que la IA hable el lenguaje de Cervantes.
MarIA, desde lo oficial
Tras varios meses de pruebas y diferentes tipos de entrenamiento, el gobierno ponía en marcha MarIA, el primer sistema masivo de Inteligencia Artificial en lengua española capaz de generar sus propios textos y resumir los existentes. MarIA es un proyecto que consta de tres actores principales: la Secretaría de Estado de Digitalización e Inteligencia Artificial como impulsor, el Centro Nacional de Supercomputación encargado del desarrollo y los archivos web de la Biblioteca Nacional de España (BNE) como base para esta IA.
Se trata, según el gobierno, del primer sistema de inteligencia artificial experto en comprender y escribir en español. Como parte del Plan de Impulso de las Tecnologías del Lenguaje, esta herramienta pretende contribuir al desarrollo de una economía digital en español, gracias al potencial que los desarrolladores pueden encontrar en él.
La primera versión de MarIA se desarrolló con RoBERTa, una tecnología que crea modelos lingüísticos de tipo «codificador», capaces de generar una interpretación que puede utilizarse para categorizar documentos, encontrar similitudes semánticas en distintos textos o detectar los sentimientos expresados en ellos.
Sin emabrgo, la última versión de MarIA se ha desarrollado con GPT-2, una tecnología más avanzada que crea modelos generativos decodificadores y añade funcionalidades al sistema. Gracias a estos modelos decodificadores, la última versión de MarIA es capaz de generar un nuevo texto a partir de un ejemplo anterior, lo que resulta muy útil para resumir, simplificar grandes cantidades de información, generar preguntas y respuestas e incluso mantener un diálogo.
El objetivo es que MarIA pueda convertirse en una herramienta que, con una formación adaptada a tareas específicas, sea de gran utilidad para desarrolladores, empresas y administraciones públicas. Cabe señalar que MarIA se ha entrenado con 135.733.450.668 palabras procedentes de millones de páginas web recopiladas por la Biblioteca Nacional, que ocupan un total de 570 Gigabytes de información. Para el entrenamiento se ha utilizado el superordenador MareNostrum del Centro Nacional de Supercomputación de Barcelona, que ha requerido una potencia de cálculo de 9,7 billones de operaciones (969 exaflops).
Teniendo en cuenta que uno de los primeros pasos en el diseño de un modelo lingüístico es construir un corpus de palabras y frases que sirva de base de datos para entrenar al propio sistema, en el caso de MarIA fue necesario realizar una criba para eliminar todos los fragmentos de texto que no fueran «lenguaje bien formado» (elementos numéricos, gráficos, frases que no terminan, codificaciones erróneas, etc.) y así entrenar correctamente a la IA.
Un PERTE de la Lengua
No es el único impulso que, desde el ámbito estatal, se le está dando a la IA en español. Así, uno de los conocidos como planes de recuperación PERTE (proyectos estratégicos para la recuperación y transformación económica, con un importante potencial de arrastre para la economía española) lleva por nombre el PERTE Nueva Economía de la Lengua).
Con La Rioja como epicentro (puesto que es en el Monasterio de San Millán de la Cogolla donde está registrado el primer manuscrito en nuestro idioma y se considera como cuna de nuestra lengua), se espera que el español sea motor de la inteligencia artificial y del desarrollo económico, tanto de La Rioja como de toda España y Latinoamérica.
Este proyecto Valle de la Lengua tiene 85 millones de euros de inversiones comprometidas hasta 2025 y se espera, tras alcanzar la consideración de PERTE (Proyecto Estratégico para la Recuperación y Transformación Económica), que genere muchas más, tanto públicas como privadas, a lo largo de varios años.
LuzIA, la IA que puede usar cualquiera
Pero el impulso también tiene una vertiente privada. LuzIA es la historia de tres emprendedores que se unen para crear una IA que pueda utilizar cualquiera, una “una herramienta sencilla pero potente, que les ayude tanto en la generación de textos, como en la transcripción de audios o la generación de imágenes”, en palabras de Javier Andrés, uno de los fundadores.
Con apenas dos meses de vida ya han recabado más de 2,5 millones de euros en financiación para seguir desarrollando este asistente que funciona en Whatsapp y Telegram y que, al menos de momento, es gratuito para todos los usuarios. Cabe señalar que detrás de este dinero hay fondos tan potentes como los que en su día apostaron por empresas como Dropbox o Airbnb.
Si se le pregunta asegura que es “una asistente personal en WhatsApp. Soy amigable, divertida y empática, siempre lista para ayudarte”. Para ello, utiliza tecnología de procesamiento de lenguaje natural (NLP) y aprendizaje automático (machine learning) para entender y responder a los mensajes en WhatsApp, auqnue también puede generar imágenes y transcribir audio. “Soy el producto del trabajo de un equipo de desarrolladores y expertos en inteligencia artificial. No tengo padres específicos, pero fui creado por un grupo de personas talentosas”, señala.
Los usuarios utilizan esta herramienta para obtener información, hacer preguntas, recibir recomendaciones, jugar juegos de palabras, obtener ayuda con tareas y recordatorios, entre otras cosas.
Todos estos impulsos pretenden que el español gane aún más peso y relevancia en el desarrollo de una tecnología tan fundamental como la Inteligencia Artificial. Un peso que, según algunos cálculos, ronda ahora el 30% de todos los avances.