Gaia-X y la nueva economía del dato en Europa
Gaia-X y la nueva economía del dato en Europa
Para quienes todavía no conozcan esta iniciativa, ¿qué es Gaia-X y cuál está siendo la implicación de España?
Gaia-X nace en el otoño del 2019 como una iniciativa franco-alemana destinada a crear una infraestructura de datos federada que garantizase la seguridad, interoperabilidad y soberanía de los datos que se producen y comparten en Europa, y la manera en que se procesan. El objetivo es crear una serie de estándares y especificaciones que ofrezcan un marco común al ecosistema de desarrolladores, empresas y entidades públicas que conforman la emergente economía del dato en Europa. Eso incluye a usuarios y a proveedores de aplicaciones, datos e infraestructuras cloud. Gaia-X se está centrando tanto en articular ese ecosistema a diferentes niveles, como en producir una arquitectura de referencia, los componentes open source básicos y los mecanismos de certificación necesarios para crear una primera versión operativa.
Gaia-X es a día de hoy una iniciativa en la que colaboran tanto Estados miembro de la UE como representantes de la industria y de centros de innovación, y que se enmarca en la Estrategia Europea de Datos publicada en febrero de 2020 por la Comisión Europea. La intención de esa estrategia es la de sentar las bases para que Europa logre una posición de liderazgo en la innovación en torno a los datos y la Inteligencia Artificial. Entre otras cosas, se espera de Gaia-X que defina las reglas y procesos necesarios para que en un futuro próximo, y de manera fiable, segura y transparente, un usuario pueda combinar aplicaciones, datos e infraestructura cloud de diferentes proveedores tecnológicos y realizar una tarea determinada en base a una serie de criterios concretos. Esos criterios podrían ser no sólo legales sino también de coste, latencia, ubicación física de ese proceso, o consumo energético.
Involucración de las empresas españolas en el proyecto
Varias empresas españolas hemos estado involucradas en el proyecto desde principios de 2020. En el caso de OpenNebula, a través de nuestro proyecto europeo ONEedge hemos participado desde los primeros momentos en la elaboración de la documentación técnica, apoyando la creación formal de la Asociación Gaia-X a nivel europeo, y patrocinando eventos anuales como la Gaia-X Summit 2021. A finales de 2020 los miembros españoles en la Asociación Gaia-X comenzamos a conversar sobre la necesidad de establecer en España, al igual que estaba sucediendo en otros países, un Hub nacional. El proceso se aceleró enormemente en 2021 gracias al compromiso de la Secretaría de Estado de Digitalización e Inteligencia Artificial (SEDIA) y al apoyo que el equipo de Carme Artigas ha brindado al grupo promotor del Hub español de Gaia-X a lo largo del año.
A la Manifestación de Interés que lanzó el verano pasado el Ministerio de Asuntos Económicos y Transformación Digital le siguió el acto de presentación oficial y varias sesiones de trabajo conjuntas para poner en marcha la Asociación Gaia-X España, elaborar sus Estatutos y elegir la ubicación de su futura sede. En paralelo, se han ido definiendo varios grupos de trabajo sectoriales durante los últimos meses para dar cabida a todas las empresas y entidades españolas interesadas en el proyecto, tengan o no presencia en Gaia-X a nivel europeo. La SEDIA y la Oficina del Dato están promoviendo activamente la creación de estos grupos a través de la convocatoria de encuentros híbridos como el que tuvo lugar en FITUR durante el mes de diciembre, o los dedicados recientemente a Movilidad (Valencia) e Industria (Bilbao). A la celebración de la primera Asamblea General, prevista para mediados de marzo, tendrán que seguir necesariamente una serie de actividades para difundir esta iniciativa a lo largo de todo el territorio nacional, y hacerla accesible a empresas y organizaciones de todos los tamaños.
¿A qué retos se enfrenta la puesta en marcha de Gaia-X en Europa?
Gaia-X se enfrenta a varios retos tecnológicos, de estandarización, ciberseguridad, calidad de los datos, y portabilidad, pero también de gobernanza y de cumplimiento del marco regulatorio europeo, tanto del actual (e.g. GDPR) como de los nuevos elementos que se definirán en los próximos meses y años (e.g. DMA). A las complejidades propias de una infraestructura de datos federada formada por un conjunto creciente y muy heterogéneo de proveedores de aplicaciones, datos e infraestructuras cloud hay que añadir la importancia de que se garantice la interoperabilidad entre diferentes plataformas, en especial con las que dominan el mercado en estos momentos.
Se ha generado una cierta polémica por el protagonismo que están teniendo en Gaia-X algunas grandes empresas tecnológicas extracomunitarias, pero hay que recordar que a día de hoy son precisamente esas plataformas las que albergan un mayor porcentaje de los datos que generamos en Europa. Si su participación implica asumir una serie de reglas de juego definidas por Gaia-X, y además obtenemos pasarelas de interconexión con los proveedores europeos, seguramente eso contribuya a solucionar los profundos desequilibrios en el mercado cloud. A esto hay que añadir la nueva normativa que definirá en su momento la DMA, esperemos que limitando prácticas habituales de algunos proveedores, como la de ofrecer programas Free Tier inasumibles por competidores más pequeños, o el de imponer a sus clientes precios elevados para trasladar sus datos a otras plataformas—las temidas egress fees.
La complejidad de un proyecto tan ambicioso como Gaia-X viene también impuesta por la necesidad de evitar que unas determinadas barreras de entrada no acaben siendo simplemente sustituidas por otras. De nada serviría crear una solución multicloud que ayude a evitar el vendor lock-in de determinados proveedores, si a cambio lo que obtenemos es una herramienta tecnológica de un uso tan complejo que tan solo esté al alcance de grandes empresas y agencias gubernamentales. Debemos asegurarnos de que tanto en Gaia-X como en otras iniciativas como el IPCEI de Infraestructuras y Servicios en la Nube la tecnología que produzcamos resulte realmente accesible tanto a las PYMEs como a los niveles más locales de la Administración Pública.
Mientras se ponen en marcha en Europa las medidas necesarias para combatir la falta de personal técnico cualificado y la importante brecha de género en el ámbito tecnológico, las empresas europeas de cualquier sector—y de cualquier tamaño—deben tener disponibles las herramientas adecuadas para poder empezar a aprovechar cuanto antes las ventajas competitivas que proporcionan estas nuevas tecnologías. Es ahí donde el open source nos ofrece un modelo a seguir para desarrollar proyectos realmente sostenibles en el tiempo y en donde los servicios profesionales que emerjan alrededor de esas herramientas se ajusten al perfil de los usuarios. En su momento tendremos que definir los incentivos y mecanismos concretos para que aquellas empresas y organismos públicos con más recursos puedan contribuir activamente a la mejora constante de esa nueva generación de tecnologías open source europeas que estamos desarrollando.
¿Cómo contribuirá Gaia-X a la economía del dato?
Hay que tener en cuenta que hoy en día la economía del dato está esencialmente constituida como una industria extractiva. Las grandes plataformas tecnológicas—de un modo similar a como operaban las economías coloniales—obtienen en Europa sus materias primas (los datos) y ‘manufacturan’ fuera del continente los servicios tecnológicos avanzados que consumimos después diariamente los ciudadanos, empresas y administraciones públicas. Gracias a estos servicios y productos, esas grandes corporaciones facturan anualmente cifras desorbitadas. Está en nuestras manos revertir la situación actual y lograr que la economía digital se convierta en una actividad redistributiva, algo que va probablemente mucho más allá de fijar impuestos mínimos globales para estas multinacionales.
Salvando las distancias, el papel que en el siglo XIX jugaban las grandes inversiones en infraestructuras ferroviarias para el transporte de materias primas lo desempeñan en estos momentos en Europa los proyectos de digitalización financiados con recursos públicos—desde el despliegue de fibra óptica y 5G en zonas rurales hasta los cursos de alfabetización digital en los que los participantes acaban engrosando la base de usuarios de las grandes plataformas tecnológicas. Se da la paradoja de que para que una pequeña empresa lance, por ejemplo, una sencilla campaña de marketing digital en su propia localidad, no tiene otro remedio que utilizar los servicios comerciales de esas multinacionales, que monetizan así los datos que los propios vecinos del municipio han proporcionado. En muchas ocasiones, esos datos ‘locales’ se encuentran almacenados a decenas de miles de kilómetros en grandes centros de datos corporativos.
El desarrollo alternativo de la economía del dato que propone la Comisión Europea pasa por crear los llamados espacios comunes de datos, empezando por sectores estratégicos como el de sanidad, industria, movilidad, turismo o agricultura. Se espera que este mecanismo incentive la compartición segura de datos públicos y también de los datos no personales que actualmente albergan todo tipo de entidades, y que en muchas ocasiones ni siquiera se explotan internamente—y mucho menos para crear nuevas líneas de negocio. La idea es que los datos que se generen en Europa se almacenen y exploten dentro del continente, y que eso ayude a consolidar el tejido empresarial y la innovación asociada a esa emergente economía del dato.
Tomemos como ejemplo el sector de la agricultura: ¿cómo podría afectar a la cadena de valor actual, y al modelo de negocio de pequeños y medianos productores, el que pusieramos a su disposición a través de Gaia-X las herramientas para que ofrecieran de manera directa a analistas, inversores y empresas del sector alimenticio los datos que a modo de ‘producto secundario’ generan sus explotaciones? Imaginemos las posibilidades de poder ofrecer información y modelos predictivos en tiempo real sobre, por ejemplo, condiciones del suelo, temperatura, niveles de precipitación, presencia de plagas, expectativas de producción, o condiciones del mercado local. ¿Y si además desplegamos sobre el terreno los recursos de computación mínimos necesarios para que esos datos nunca abandonen el lugar en el que se producen? El modelo de edge computing al que nos encaminamos contribuirá a que cualquier procesamiento por parte de un tercero tenga lugar garantizando la soberanía sobre los datos originales. También servirá para reducir los consumos energéticos y los riesgos de seguridad asociados a la transferencia de toda esa información hasta un cloud público.
¿Qué papel juegan los ciudadanos en todo esto?
Es de esperar que el foco que Gaia-X pone en el concepto de soberanía del dato también contribuya a evitar que el individuo, en todo este proceso de expansión de la economía del dato, acabe convirtiéndose—consentimientos de privacidad aparte—en un agente meramente pasivo. Puede que en algún momento los ciudadanos europeos comiencen a exigir a sus responsables públicos y a la industria digital que vayan más allá de la promesa de una captación, compartición y utilización masiva de datos destinada a mejorar supuestamente los servicios que reciben. A fin de cuentas, una gran cantidad de la materia prima que sustentará esa nueva economía del dato proviene en última instancia de las acciones, e interacciones, que cada uno de nosotros realizamos en el día a día, tanto en el mundo físico como en el digital.
Definir los datos como “el nuevo petróleo” de la Era Digital quizás no logre reflejar, entre otros matices, el hecho de que, a diferencia de los combustibles fósiles, muchos de esos datos provienen de las acciones que, como seres vivos, cualquiera de nosotros llevamos a cabo diariamente por el mero hecho de estar viviendo este momento histórico concreto. Pensemos, por ejemplo, en los muchos datos que generamos cualquiera de nosotros a día de hoy mediante la simple acción de ir a comprar a un supermercado. Sea cual sea el medio de transporte elegido—incluso en desplazamientos a pie—las decisiones más mundanas pueden dejar tras de sí un valioso reguero de datos. Aunque se trate en muchos casos de datos no personales, esta información es recolectada por diferentes entidades públicas y privadas, y en ocasiones incluso monetizada, sin el consentimiento expreso de los sujetos implicados.
Puede que dentro de no mucho veamos cómo las innovaciones en torno a la economía del dato y a la soberanía de los datos personales empiezan a afectar también a cuestiones sociales de calado como, por ejemplo, el debate sobre la Renta Básica Universal. Quién sabe si en un futuro no tan lejano puedan llegar a plantearse modelos mixtos en los que la carga presupuestaria de semejante medida se vea aligerada por las compensaciones que reciban los ciudadanos periódicamente por su contribución diaria en forma de datos (personales o no personales) a los datasets que acaben teniendo un uso comercial. Quizás el principio de “no tratar a los clientes como a un número” llegue algún día a tener implicaciones interesantes en la nueva economía digital…
¿Edge computing y espacios de datos se complementan mutuamente?
Uno de los grandes objetivos que se ha marcado la Comisión Europea para esta década es el de evitar que la nueva economía del dato sirva para consolidar aún más la actual posición dominante de los grandes proveedores cloud extracomunitarios. Algo así cerraría definitivamente la puerta a este mercado a los competidores europeos. La preocupación es más que fundada, porque se espera que la creación de los espacios comunes de datos provoque un aumento considerable en la cantidad de datos que se producen y comparten en el continente. Esto va a requerir nuevos recursos de almacenamiento en el cloud y también mayores capacidades de procesamiento para los sistemas de Inteligencia Artificial. El reto, por tanto, consiste en que este despegue de los espacios comunes europeos de datos no acabe creando nuevas dependencias con los grandes proveedores de infraestructura cloud.
Tanto a nivel geoestratégico, como de sostenibilidad medioambiental, ese proceso debe darse en paralelo al cambio de paradigma del cloud centralizado al edge computing. Como parte de la Estrategia Industrial de la UE, la Comisión estima que para el año 2025 el 80% de todos los datos se procesarán en el edge—cerca de los usuarios y de los dispositivos que generan muchos de esos datos—y no en los grandes centros de datos que actualmente conforman el cloud público. Es por eso que en las Metas Digitales para el 2030 la Comisión ha incluído el objetivo de que Europa cuente para ese año con un despliegue de al menos 10.000 nuevos nodos edge que ofrezcan una infraestructura cloud federada alternativa a la que domina el mercado en la actualidad.
Durante los próximos años tendremos que encontrar la manera de sincronizar las muchas iniciativas que están teniendo lugar en Europa, y de demostrar al mundo que existen modelos alternativos para desarrollar la economía digital. Debemos asegurarnos de que esa nueva infraestructura edge federada europea proporcione el almacenamiento que necesitan los espacios comunes de datos y también las capacidades de procesamiento distribuido que requiere la Inteligencia Artificial. Sólo con un modelo open source podremos garantizar una innovación colaborativa y sostenible en el tiempo, y que las tecnologías de nueva generación que desarrollemos a lo largo de esta década estén realmente al alcance de todos. ¡Son tiempos realmente emocionantes!
Sobre el autor
El autor del artículo es Alberto P. Martí, VP of Open Source Community Relations en OpenNebula.
Alberto ha desarrollado la mayor parte de su carrera profesional en España y en Reino Unido, tanto en el Sector TIC (FLOSS) como en el mundo académico. Como VP of Open Source Community Relations en OpenNebula, una de sus principales tareas consiste en coordinar la relación estratégica con proveedores cloud/edge, con otros proyectos open source, y con partners tecnológicos y de innovación. Alberto también coordina la participación de OpenNebula en iniciativas internacionales como SovereignEdge.EU, Linux Foundation, LF Edge, y CNCF, así como las contribuciones al proyecto Gaia-X, al IPCEI-CIS, y a la European Alliance for Industrial Data, Edge and Cloud.