Lanzamiento de ALIA, la nueva IA del Gobierno español
El Gobierno de España ha dado un paso relevante, anunciado ya desde 2019 y que igualmente analizamos en este blog de OpenExpo Europe con una alianza con IBM, para impulsar la Inteligencia Artificial desde la administración. Desde ayer, se puede acceder de manera pública a las primeras versiones de ALÍA, un modelo de IA que se ofrece bajo administración y mantenimiento estatales, completamente abierto y accesible. Este proyecto ya está en marcha a través del sitio web oficial: alia.gob.es.
Algunos aspectos de Alía
Alía se sustenta en una arquitectura avanzada de procesamiento del lenguaje natural, fruto de un entrenamiento que abarca más de 25.000 millones de parámetros. Gracias a esta magnitud, se sitúa en un plano competitivo respecto a otros grandes modelos de IA a escala mundial. Se ha desarrollado principalmente a partir de un conjunto de datos en español que reúne textos tan diversos como literatura clásica, documentos oficiales y contenido científico, lo cual quiere y pretende proporcionarle un entendimiento profundo de nuestro idioma y de los matices culturales de España.
Entre sus funcionalidades más destacadas ( generalistas en esta versiones iniciales ) se encuentran:
- Procesamiento avanzado de lenguaje natural
Capaz de comprender y generar texto con bastante coherencia y exactitud. - Compatibilidad multimodal
También se va más allá del texto, pudiendo, del mismo modo, analizar imágenes y otros formatos que se irán ampliando en futuras versiones. - Seguridad y ética
Se ha diseñado, haciendo especial hincapié en reducir al mínimo cualquier sesgo y salvaguardar datos sensibles, además de prevenir sus usos con fines malintencionados. Una característica a tener en cuenta, de modo especial, por su patrocinio público.
Origen y finalidad
El nombre “Alía” nace como acrónimo de Artificial Linguistic Intelligence for Administration, reforzando el objetivo de servir de “aliada” (en el juego de palabras entre español y acrónimo inglés) tanto a la ciudadanía como a los organismos públicos. El proyecto se inscribe en el Plan Nacional de IA, que cuenta con un presupuesto de 600 millones de euros hasta 2025 y busca reforzar la soberanía tecnológica en el país, fomentando la innovación en sectores clave.
La creación de Alía está liderada por el Instituto Nacional de Tecnología y Desarrollo (INTD), en colaboración con varias universidades públicas y empresas tecnológicas españolas como Indra y Telefónica. Este equipo multidisciplinar pretende combinar el conocimiento académico con la experiencia del sector privado para intentar potenciar un modelo de calidad y adaptado a necesidades reales.
Acceso y uso
Alía se ofrece de manera gratuita en la plataforma oficial del Gobierno, disponible en alia.gob.es. Quien lo desee puede interactuar con el modelo mediante una interfaz, quizás aún no tan sencilla como las del tipo ChatGPT, o bien utilizar la API para integrarlo en proyectos propios.
El propósito de este desarrollo es contribuir en labores administrativas, educativas y de investigación, así como brindar apoyo a las pymes en su proceso de digitalización. Los ejemplos que se nos proponen desde la administración central son:
- Ciudadanía: asistencia en la redacción de documentos, traducción de textos o resolución de dudas administrativas.
- Empresas: automatización de tareas, como la atención al cliente o el análisis de datos, etc…
- Educación e investigación: acceso a un buscador optimizado y generación de contenido académico.
Ahora mismo se han liberado cinco modelos bajo licencia Apache 2.0, que tenemos disponibles en Hugging Face o GitHub y accesibles en alia.gob.es. El tipo de licencia elegida permite que desarrolladores y cualquier persona interesada descarguen los modelos y los ajusten a sus necesidades específicas. No obstante es importante señalar que, de momento, sus usos no son tan directos como abrir una aplicación de chat, ya que se requieren ciertos conocimientos técnicos para ponerlos en funcionamiento.
Estos son los modelos disponibles:
- ALIA-40B
Un modelo de lenguaje de gran tamaño, con 40.000 millones de parámetros, entrenado desde cero con 9,2 billones de tokens y que admite 36 idiomas. - Salamandra-7b
Es también de gran tamaño, con 7.000 millones de parámetros, entrenado desde cero con 7,8 billones de tokens y compatibilidad con 36 idiomas distintos. - Salamandra-7b-instruct
Entrenado con 276.000 instrucciones en inglés, castellano y catalán, obtenidas de varios corpus abiertos. - Salamandra-2b
Un modelo con 2.000 millones de parámetros, entrenado desde cero con 7,8 billones de tokens, que comprende 35 idiomas. - Salamandra-2b-instruct
Entrenado con 276.000 instrucciones en inglés, castellano y catalán, que igual que en caso anterior son procedentes de varios corpus abiertos.
Tipo de licencia y apertura a la comunidad
Como ya hemos mencionado el tipo de licencia elegida es la Apache 2,0, vieja conocida de los aficionados al Open Source y software libre. Y es que uno de los rasgos que pretende dar marchamo a Alía es el mantenimiento de su licencia abierta. Conviene recordar que esto posibilita que desarrolladores y expertos en tecnología contribuyan a su mejora o, lo que puede ser más importante con tanta variedad en el mercado, a su adaptación y personalización. Gracias a ello, se busca fomentar un ecosistema de colaboración y asegurar que el proyecto evolucione de forma constante.
Críticas y retos
A pesar de sus avances, Alía no está libre de críticas, lógicamente y como no podía ser de otro modo real. Algunos especialistas han detectado deficiencias al manejar contextos complejos, en estas primeras versiones de lanzamiento. Por otro lado hay sectores que han cuestionado la sostenibilidad de su mantenimiento a largo plazo. Cuestiones que son de un lado de ámbito técnico y otras de ámbito más político que se irán entrelazando e irán dándonos, con el tiempo, el potencial de esta nueva herramienta.
Perspectivas de futuro
No hay duda de que la presentación de Alía marca el inicio de una IA pública que coloca a España en el panorama de la innovación tecnológica internacional en un ámbito tan crucial y en boga. Aunque todavía queda muchísimo camino por recorrer, las posibilidades para agilizar la interacción con la administración y la tecnología pueden tener un puente con iniciativas como esta, pero ello dependerá de como se trate el proyecto y el interés que siga suscitando en esta y, por supuesto , en futuras administraciones que serán las encargadas de darle validez más allá del lanzamiento. Desde OpenExpo Europe, continuaremos pendientes de su evolución y de hasta donde pueda llegar su contribución al avance del país, que siempre deseamos y alentamos.