Reflexiones sobre «los datos»
Llevamos unos años en los que se ha instalado la fiebre por recoger enormes volúmenes de datos, analizarlos, interpretarlos y presentarlos en un bonito informe bien coloreado y entendible. Para ello, tecnologías con un carácter exponencial se han desarrollado, imponiéndose en nuestra tecnificada sociedad. Todo empezó con el Business Intelligence, pero actualmente Big Data, los grandes Data Lakes, los mini datacenters que recopilan datos más cercanos al ciudadano y en tiempo real, gracias a Internet de las cosas y de la industria y que terminan siendo controlados y almacenados por metaservidores de grandísimas corporaciones, nos están permitiendo encontrar una aguja en un pajar. Es normal. Se ha dicho hasta la saciedad, que el dato es el petróleo de este S.XXI. Por lo tanto, se ha invertido mucho dinero y recursos logrando que diariamente, tengamos estadísticas sobre cualquier tema en un brevísimo período de tiempo, con la intención de optimizarlo todo.
La importancia del análisis de datos
Si el volumen de datos es tan inmenso, se supone que deberíamos tener más elementos de análisis para lograr un mayor conocimiento y entendimiento de un problema y así encaminarnos a una mejor solución en un tiempo récord. Y esa es una de las esperanzas que podría tener la Humanidad, con la colaboración de tecnologías disruptivas, que además trabajan de forma transversal en todos los sectores y en un punto de cooperación y colaboración nunca antes visto. Aquí es donde se puede ver la auténtica dimensión del dato y utilizarlo con la perspectiva de nuestra especie para que estadísticas, informes, estudios e investigaciones nos proporcionen las mejores tomas de decisiones, para afrontar el futuro de las próximas décadas y nos ayuden a predecir con suficiente antelación, movimientos migratorios, catástrofes climáticas o pandemias. Por eso, pongo el acento, no sólo en la recogida de datos, sino sobre todo en el análisis e interpretación de los mismos.
Si lo pensamos bien, el dato nos democratizaría como sociedad, ya que aparecen varias interpretaciones en los diversos análisis realizados sobre unos mismos datos, que han sido recogidos de la misma forma. O no?. Lenguajes de programación como R, Python o Rubi son muy potentes y nos permiten realizar algoritmos que procesan grandes volúmenes de datos, a través de Machine Learning, como cada vez más, mediante Deep Learning. Lo primero que debe tener en cuenta alguien que recopila datos es, para qué quiere esos datos y qué solución va a lograr con ellos. Pero ya me adelanto a decir que siempre por encima, debería existir un nivel de supervisión y detección de disfunciones que vele por el total cumplimiento de la ley, derechos y libertades. Si ese órgano de control fuese independiente sería genial, pero y si lo controlasen también las inteligencias artificiales?, pues tendríamos al zorro cuidando de las gallinas.
El problema que estamos viendo es la interpretación y análisis de dichos datos, que en muchos casos generan desacuerdos entre distintos estudios en un porcentaje que no debería ser asumible. Una cosa es mostrar una estadística sobre un acontecimiento que deje entrever un resultado dispar pero asumible en una horquilla y otra cosa es que dicho resultado u objetivo sea radicalmente diferente. En este último caso, la interpretación ha ganado a un análisis fidedigno. Y este análisis no debe denotar sesgo, pero si va adherido con su dosis de interpretación adulterada, se corre el riesgo que ese algoritmo, creado por humanos, se desarrolle y aprenda con sesgos, que pueden llegar a ser discriminatorios y decididamente injustos.
¿Qué tiene que ver la ética en todo esto?
Esto nos tiene que hacer reflexionar profundamente. Los parlamentos deben introducir en la sociedad el debate sobre la ética en el uso de algoritmos, que cada vez más, van a ir influyendo en el día a día de nuestras vidas. Debates que muestren a la sociedad la calidad de vida y bienestar que representan los derechos y libertades fundamentales que disfrutamos. Quizás estamos perdiendo esa perspectiva?. Debe configurarse un marco de trabajo común entre los profesionales del sector donde se están recogiendo dichos datos, al ser ellos los que formulan las preguntas y entienden “esa aguja” que se quiere encontrar y los profesionales de las estadísticas, que serán los que conduzcan el estudio para lograr refinar dichos datos y conseguir lo que el profesional del sector va buscando, sin vulnerar ni agredir los derechos y libertades de la sociedad.
Sin embargo, si las empresas, organismos, corporaciones o gobiernos, únicamente utilizasen profesionales de estadística, ciencia de datos, informáticos, etc… y no incluyesen perfiles relacionados con las humanidades como, filósofos, historiadores, lingüistas, psicólogos y sociólogos, nos podríamos encontrar que los algoritmos anteriormente mencionados, puedan ir desarrollando y aprendiendo de forma automática para mejora de los resultados de la empresa, sector o gobierno, pero a la vez, incorporando cada vez sesgos más profundos y discriminatorios para la ciudadanía. Porque quizás estamos pecando de falta de reflexión en la aplicación de tecnologías exponenciales.
Datos, estados y ciudadanos
Cualquier dato utilizado para medir niveles de producción, consumo, hábitos, salud, educación, etc… tiene detrás a personas, y por eso es tan delicado hacer estadísticas frías que puedan alejarse del verdadero interés que deberían mostrar. Si algo nos está mostrando la pandemia actual, es que los Estados están incorporando distintos servicios aplicándoles tecnologías disruptivas con el fin de facilitar el acceso online a los ciudadanos, reducir costes y cubrir las necesidades de forma eficiente. Y todo ello, genera ingentes cantidades de datos, que por supuesto, manejan todo tipo de empresas, pero que la capacidad que tienen las grandes corporaciones tecnológicas nativas digitales, nada tiene que ver con la que tienen las empresas tradicionales y que han sufrido o están sufriendo procesos de transformación digital. Pero no debemos perder de vista, que el fin último es el beneficio a los ciudadanos y la tecnología siempre debe estar al servicio de éstos y no al revés.
Las estadísticas bien utilizadas son una herramienta muy poderosa, por lo que sería muy interesante, que en las escuelas, principalmente en los últimos cursos de ESO o en Bachillerato, se incorporara en el programa educativo la asignatura de Introducción a la Ciencia de Datos. En un futuro, sería muy bueno y necesario conocer esta disciplina, por lo menos, desde un nivel básico. Porque el alumno estaría analizando datos reales y a su vez, programando. Sería una forma que el gran público pudiese mapear la información que le rodea de una forma fácil. Podríamos estar en un punto en el que los grandes especialistas alcancen un gran nivel, pero luego otra clase de personas dentro de la población pueda tomar diferentes conjuntos de datos, aplicando los mismos principios establecidos de forma genérica, y usar estas herramientas para sus propios propósitos profesionales, personales o sociales. Es decir, alfabetizar a los ciudadanos en el mundo de la información y el dato.
Hoy en día, las redes ya son muy populares y continuamente se están generando interacciones. De hecho, se crean comunidades de cualquier especialidad que tienen un denominador común en su colaboración. Sin embargo, la tecnología está avanzando a un nivel tan rápido que los propios especialistas tienen problemas para no quedarse obsoletos. Es importante tener en cuenta que el gran volumen de datos que se manejan, en su gran mayoría son datos no estructurados, o lo que podríamos llamar ruido, y necesitamos normalizar esos datos, lo que lleva mucho tiempo, constancia y formación.
La diversidad es síntoma de buena salud
Así como en nuestra microbiota, la diversidad es síntoma de buena salud, también en la información, la diversidad es síntoma de buena salud en la sociedad.
Si no logramos, a través de la educación de los más jóvenes, insuflar un espíritu crítico sobre este asunto, nos podemos encontrar que varias generaciones se desarrollen y configuren una sociedad totalmente distinta a la que hemos conocido hasta ahora. Decisiones controvertidas e injustas tomadas por algoritmos y no asumidas por una escasa población crítica, que puedan generar en esas personas sentimientos de ansiedad, angustia, soledad, o de rechazo por no encajar en el sistema que cada vez más, modelan algoritmos. Nuestra sociedad debe protegerse para no perder su capacidad de reacción y dignidad como entidad colectiva. Inteligencias artificiales que puedan estar coordinando equipos de trabajo en diferentes partes del mundo y que en un momento dado puedan impartir instrucciones discriminatorias o incluso que puedan poner en peligro a seres humanos, algoritmos que aprueben presupuestos, elijan a magistrados y controlen cada una de nuestras transacciones y movimientos. Podríamos ser sustituidos perdiendo nuestro valor económico que hemos podido tener en el sistema de producción conocido hasta ahora, pero que como decía al principio del artículo, lo que ahora manda es el dato y nuestra información es lo que nos hace ser producto. Dejaremos de tener interés o valor, en un futuro sistema?
Todos los días, cada uno de nosotros estamos generando más datos que el día anterior. Redes sociales y canales de comunicación, wearables, smartphones con sus millones de aplicaciones, sensores, cámaras de reconocimiento facial y biométricas, alimentan los grandes metaservidores, no para vigilarnos a cada uno de nosotros individualmente, que creo sinceramente que eso no interesa, sino para conseguir estudiar tendencias, movimientos, pensamientos y deseos de forma colectiva.
No debemos sorprendernos si para cuando seamos ancianos nos podemos descargar toda nuestra vida de una red que nos conozca mejor que nosotros mismos y al detalle.