Extracción de conocimiento automático de imágenes satelitales en Agencia Espacial Europea
El reto consistía en integrar por primera vez información proveniente de imágenes satelitales con información de fuentes externas en una aplicación end to end capaz de analizar automáticamente grandes volúmenes de datos para mejorar la calidad en la identificación de masas de agua. Minsait dio respuesta con una solución Big Data y Analytics para integrar y analizar la información suministrada por la ESA. La información se almacenaba en HDFS y el equipo Data Science de Minsait trabajaba con los datos utilizando notebooks de Zepplin empleando python, scala y spark sql.
Cada imagen tenía 120 millones de píxeles. La información presentada en cada imagen se transformaba en una “matriz dispersa”, en la que cada registro era un píxel. Se hicieron análisis a dos niveles:
A nivel píxel, mostrando la evolución de presencia de agua en cada pixel, su frecuencia absoluta y mensual.
A nivel masa de agua, explicando la evolución temporal de la misma. Así por ejemplo se podía ver como dos masas de agua inicialmente independientes, crecen y acaban convirtiéndose en la misma.