SORA o como OpenAI entra de lleno en la generación de vídeos por IA
Ayer, en la tarde para Europa del 15 de febrero de 2024, nos maravillábamos con el anuncio oficial de OpenAI sobre Sora, destacando su capacidad para crear vídeos complejos y emocionalmente ricos a partir de textos descriptivos. Este anuncio completa la oferta de OpenAI para liderar la creación de contenido de IA, complementando a sus ya conocidos ChatGPT y Dall-E, que continúan ofreciendo mejoras y lanzamientos. Aunque sólo es un anuncio oficial, hemos querido ofrecerte, desde ya, una visión general de Sora en el blog de OpenExpo Europe, cuya edición más esperada en este 2024 tendrá como lema “The Power of GenAI”.
Introduciéndonos en Sora
Sora se posiciona en la vanguardia de las tecnologías de inteligencia artificial generativa (GenAI) con su capacidad para convertir descripciones textuales en anmaciones de vídeo detalladas. Esta herramienta, desarrollada por OpenAI, representa un avance significativo en la generación de contenido audiovisual, permitiendo la creación de escenas complejas con múltiples personajes e interacciones dinámicas. La habilidad de Sora para interpretar y visualizar conceptos en una amplia gama de estilos, desde realistas hasta fantásticos, busca marcar un hito en la producción de medios impulsada por IA. En este artículo puedes ver algunas de las demos que nos ofrece OpenAI en su página de lanzamiento, donde también puedes consultar los prompts que las generaron.
Video demo:
Desarrollo y Equipo detrás de Sora
El equipo de OpenAI, conocido por sus innovaciones en el campo de la IA, lidera el desarrollo de Sora. Aunque los detalles específicos sobre este equipo y los costos de desarrollo no han sido divulgados, OpenAI ha querido estar, a la mayor brevedad, en la carrera de las grandes firmas en estos avances de la inteligencia artificial a través de proyectos que empujan los límites de la creatividad y la generación de contenido. La organización continúa invirtiendo en investigación y desarrollo, destacando su papel como uno de los grandes personajes de esta historia de la GenAI con sus ya conocidos ChatGPT y Dall-E.
Capacidades de Sora
La capacidad de Sora para generar vídeos de hasta un minuto de duración a partir de descripciones textuales es notable, en las demos ofrecidas. Este modelo de IA maneja con destreza la colocación de objetos y personajes, la generación de movimiento y la creación de fondos y, algo que el equipo destaca como «emociones detalladas». Además, Sora entiende las leyes físicas del mundo real, lo que le permite construir escenas complejas y relaciones causa-efecto con un realismo sorprendente. La herramienta también puede mejorar y extender vídeos existentes, llenando huecos en secuencias de imágenes para producir narrativas visuales coherentes.
Y, sobre todo y ante todo, muestran una capacidad descomunal para mantener la coherencia entre fotogramas, el que hasta ahora era el talón de Aquiles de la creación de vídeo mediante IA. Su desarrollo se basa en la misma tecnología que hay detrás de DALL·E 3, lo que permite a Sora manejar una amplia variedad de tipos de vídeo, resoluciones, y duraciones, superando a modelos anteriores en complejidad y realismo.
Licencia y Disponibilidad
Aunque OpenAI no ha especificado, en este primer anuncio, si Sora se ofrecerá como software privativo o bajo una licencia de código abierto, la organización tiene un historial de adoptar enfoques variados para el licenciamiento de sus tecnologías. Bajo este criterio han usado varias licencias y cambiadas a mitad de camino para, según justifican, “equilibrar la innovación abierta con la seguridad y la protección de la propiedad intelectual”. Los detalles sobre la licencia y la disponibilidad de Sora serán clave para su adopción y uso futuro.
Privacidad, Seguridad y Ética
La privacidad y la seguridad son consideraciones centrales en el desarrollo de Sora, según la información de lanzamiento, con OpenAI comprometiéndose a implementar evaluaciones rigurosas para identificar y mitigar posibles riesgos. La inclusión de «red teamers» y la colaboración con artistas visuales y cineastas para probar y refinar el modelo deberían ser una buena noticia en el sentido de un compromiso con la responsabilidad y la ética en la IA.
Vídeo demo:
Comparativa y Posicionamiento en el Mercado
Sora se quiere distinguir de otras herramientas de generación de vídeo por IA por su profundidad de comprensión y la calidad de las animaciones generadas. Aunque no se ofrecen comparaciones directas, la innovación y las capacidades de Sora sugieren que puede superar a herramientas existentes en términos de creatividad y flexibilidad. Es pronto para decirlo a tan solo horas de su anuncio, pero el ritmo vertiginoso de la IA generativa hará que sean cuestiones que podamos comparar en muy poco tiempo.
Futuro y roadmap de Sora
El futuro de Sora parece prometedor, con OpenAI ofreciendo su promesa de continuar innovando y expandiendo las capacidades del modelo. Aunque los detalles específicos del roadmap no han sido divulgados, la comunidad tecnológica y creativa está expectante ante las futuras actualizaciones y mejoras que marcarán, sin duda, el curso de la generación de contenido digital. Con su lanzamiento, OpenAI no solo amplía las fronteras de lo posible en términos de creación de medios a través de IA, sino que también pretende establecer “un nuevo estándar en la intersección de la tecnología, el arte y la narrativa”.
Sora, y por tanto OpenAI, nos prometen revolucionar la manera en que concebimos y creamos vídeos. Su desarrollo y su próxima disponibilidad para el gran público serán eventos clave a seguir para cualquier interesado o interesada en el futuro de la inteligencia artificial y la producción de medios. Mantenerse informado sobre las actualizaciones de OpenAI será esencial para comprender la evolución de Sora y su impacto en el ámbito de la creación de contenido digital. Y de ello daremos buena cuenta en el blog de OpenExpo y en la edición 2024 de OpenExpo Europe by My Public Inbox: The Power of GenAi.