Open Source en la inteligencia artificial
Cada día vemos diferentes ejemplos en prensa de cómo el código abierto aporta su granito de arena en hacer un mundo mejor. Pequeños municipios adoptan soluciones basadas en código abierto para sustituir otras soluciones propietarias con el fin de ahorrar costes, aprovechar el hardware existente, implementar nuevas funciones, etc. Hospitales migran sus servidores para optimizar sus recursos utilizando código abierto para ofrecer un mejor servicio. Científicos lo usan para analizar grandes cantidades de datos y construir modelos de predicción. Y la cosa no queda solo ahí también gobiernos se han dado cuenta del potencial que ofrecen las tecnologías abiertas para su ciudadanía y desarrollo.
El más reciente ejemplo lo podemos encontrar en el gobierno de una de las naciones más poderosas del mundo. Me refiero, por supuesto, a Estados Unidos. Este gobierno, apartadas sus reticencias iniciales, usa cada vez más el software de código abierto como una forma de ahorrar dinero y desplegar mejor tecnología. Es realmente interesante cómo este país está impulsando desde su administración el desarrollo de inteligencia artificial.
Podemos pensar que los tiros van, haciendo un poco de broma, encaminados a mejorar las capacidades bélicas desde la preparación para el combate hasta los programas de mantenimiento naval de este país, pero en realidad, el uso de la inteligencia artificial es mucho más transversal de lo que podemos creer y abarca todo el grueso de su administración.
Desde que la Oficina de Presupuesto de Administración lanzó su política de código abierto en 2016. El objetivo es que el gobierno tenga un código más compartible y reutilizable y que deje de licenciar el mismo código propietario una y otra vez. Un claro ejemplo de estrategia de ahorro de costes.
Pero recordemos que el código abierto no siempre es gratuito, especialmente no del tipo que se necesita para iniciativas de misión crítica en el gobierno, el ejército o las empresas. Y la inteligencia artificial se basa en buenos datos para obtener buena inteligencia. 😉
Antes de decidir sobre el código abierto y la IA, cualquier agencia gubernamental, o incluso una empresa del sector privado, debe, como se describe en política, hacer varias preguntas para determinar si el código abierto es la selección correcta.
¿Es realmente gratis?
El software de código abierto tiene un amplio espectro de precios, desde gratuito hasta muy costoso. Quiero decir, hay una razón por la que IBM recientemente pagó 34 mil millones de dólares por Red Hat, el mayor proveedor de soluciones basadas en código abierto. Y en política se requiere que las agencias examinen el costo total del ciclo de vida de las compras de TI.
Aunque estemos acostumbrados a pensar que el “open source es gratis” en el mundo empresarial no es del todo así. La mayoría de las veces contamos con dos versiones de un mismo software, la edición empresarial que incluye una licencia comercial y una «edición comunitaria» simplificada con una licencia gratuita.
Si bien minimizar los gastos de capital mediante la adquisición de software de código abierto «gratuito» es atractivo, el costo inicial de cualquier esfuerzo de software representa sólo una fracción del desembolso total durante el ciclo de vida de propiedad y uso. Y si bien la rentabilidad es importante, debe compararse cuidadosamente con la efectividad de su aplicación.
Además, el soporte del producto es crítico. Cuando las empresas licencian software comercial, generalmente compran un nivel de soporte junto con él. En una comunidad de código abierto, no hay una única fuente obligada a ayudar a los usuarios. El soporte de software de código abierto viene a través de foros, chat y otros recursos liderados por la comunidad y es voluntario. Los proveedores ofrecen opciones de soporte, pero vienen con una etiqueta de precio.
¿Cuáles son sus problemas técnicos?
Un mito común sobre el código abierto es que sobrevive del altruismo y el trabajo desinteresado de algunos miembros de la comunidad. Puede haber sido cierto al principio, pero ya no lo es. Muchas personas pueden ver los beneficios del código abierto desde una perspectiva tecnológica, pero el código abierto ha tenido un impacto más profundo en las personas, la cultura y nuestra sociedad.
El software de código abierto ha impulsado una revolución, y la idea de «hazlo tu mismo» es muy atractiva pero dependiendo de lo que pretendamos hacer podemos encontrarnos en un callejón sin salida si no contamos con los recursos técnicos necesarios. Quiero decir, no es lo mismo configurar nuestra Raspberry Pi para que funcione como un sencillo servidor web a pretender implementar y mantener una distribución Linux completa o un sistema completo de gestión con un reducido equipo de voluntarios.
El software de código abierto generalmente requiere de un desarrollo único para satisfacer las demandas y complejidad de los proyectos de función crítica del gobierno. Por lo tanto, si las cosas no se planifican adecuadamente lo único que podemos estar haciendo es trasladar el ahorro en costo del software a la categoría de mano de obra e integración.
Sin embargo el código abierto presenta una interesante ventaja pues permite a los usuarios ver cómo funciona el software, aprender de este y realizar mejoras para optimizar el software.
¿Son confiables los datos que alimentan nuestra IA?
Los datos son el alma de la IA. Sin datos, la IA no puede aprender y hacer predicciones. Si la IA se basa en datos no confiables, la IA hará predicciones no confiables.
Las bases de datos de código abierto pueden requerir una administración adicional para garantizar la seguridad de los datos, un buen gobierno de los datos y un acceso rápido a los datos críticos.
Cualquier fuerza militar, por ejemplo, debe integrar datos complejos a través de los límites de la organización para descubrir ideas procesables que promuevan una presencia hacia adelante sostenible. Esto requiere una vista más completa, segura y gobernada de los datos críticos a través del comando para entregar fuerzas listas para el combate. Pero hablemos de algo menos bélico y más cercano.
El buen gobierno de los datos significa que existe la seguridad de que los datos no se han cambiado o, si se ha cambiado, de que hay un registro de cuándo, cómo y por quién. Las políticas de gobierno de datos, incluidas las políticas de privacidad, deben permanecer con los datos para que, a medida que los datos se muevan, las políticas sigan vigentes.
Al evaluar las capacidades de gobernanza de datos, se requiere una revisión completa de todo lo involucrado, incluida la integración, la confiabilidad de los datos y la preparación de la inteligencia artificial, al decidir el código abierto o no.
En este aspecto la tecnología de cadena de bloques o blockchain tiene mucho que aportar.
Estas redes actúan como una inmensa base de datos que se distribuye entre varios participantes. Es decir, actúan como un libro de registro (ledger en inglés) inmutable que contiene la historia completa de todas las transacciones que se han ejecutado en la red. A cada participante se le llama nodo, que en realidad viene a ser un ordenador más o menos potente que recoge y actualiza los datos de cada transacción en tiempo real.
Su fortaleza reside en la práctica imposibilidad de falsear los datos y transacciones ya que requeriría un ataque en extremo difícil ya que implicaría engañar a un significativo número de nodos a la vez.
“Blockchain se inventó en un principio para sustentar una moneda digital: BitCoin. Fue la primera criptodivisa descentralizada no emitida por un banco central.”
Open Source, Inteligencia Artificial y datos para cambiar el mundo.
Hablaba antes de la importancia de dejar en claro las bases por las que el código abierto se fundamenta, sus pros y contras, la importancia del correcto acceso a datos y cómo la inteligencia artificial se combina para generar la oportunidad de cambiar el mundo.
Claramente, el software de código abierto tiene un lugar en los gobiernos del mundo sean del color que sean. La ausencia de una etiqueta de precio no significa que el código abierto no tenga ningún coste, por supuesto, pero la necesidad de trabajar con datos de alta calidad y su gestión compensan el esfuerzo a llevar a cabo. El futuro es prometedor. Las tecnologías abiertas basadas en Machine Learning son la antesala de lo que la IA está por ofrecer.
Desde modelos que predigan el cambio climático, planificación de urbes inteligentes que conecten personas en un entorno colaborativo, mejora en la detección temprana de enfermedades y su tratamiento. Estos son algunos ejemplos.
La necesidad de contar con datos fiables, su gestión para alimentar a la IA será uno de los paradigmas a resolver en nuestro presente. Dicho de otro modo. Si las agencias no tienen los datos integrados, confiables y accesibles que necesitan para cumplir con los objetivos de la misión, los proyectos y el éxito estarán en riesgo. Nuestro presente exige garantizar el futuro de generaciones futuras. Ese futuro será con IA o no será, por supuesto, y las tecnologías basadas en código abierto serán sin lugar a duda su principal pilar.