El vídeo como nuevo campo de batalla de la GenAI
El mundo de la creación de vídeo no está permaneciendo, ni mucho menos ajeno a la revolución de la inteligencia artificial generativa. Los grandes actores tecnológicos como, por ejemplo, Google u OpenAI están liderando una, recién comenzada, batalla por ofrecer las herramientas más sofisticadas y accesibles para los creadores de contenido. Este nuevo campo de batalla se caracteriza por la innovación constante, la competencia feroz y un potencial enorme para democratizar la producción audiovisual. Pero no sólo de modelos de generación a través de texto vive la creación audiovisual asistida por IA, sino que esta se ha colado de lleno en los motores neuronales de los editores tradicionales, de los cuales nos servirá como botón de muestra, para este artículo en el blog de OpenExpo Europe, el lanzamiento esta semana de DaVinci Resolve 19.
Google y OpenAI: Generación por texto y estrategias diferentes
La apuesta de Google dice tener el foco puesto en dos factores: la accesibilidad y la colaboración. Destacan herramientas como:
La nueva Vids, en pack con Imagen 2de Google:
- Basado en scripts automatizados.
- Genera guiones gráficos.
- Selecciona estilos.
- Propone escenas a partir de imágenes y vídeos de archivo.
- Permite personalizar la voz narrativa.
- Ajusta la producción final sin intercambios de archivos complicados.
- Promueve un entorno de trabajo colaborativo y seguro.
- Integración con Google Workspace.
- Genera vídeos cortos de alta calidad a partir de texto.
- Ofrece la mayor ventana contextual disponible para los desarrolladores.
- Permite generar contenidos visuales animados ideales para equipos creativos y de marketing.
Por su parte,OpenAI se centra en la calidad y la fiabilidad con:
- Genera vídeos de hasta un minuto de duración a partir de descripciones textuales.
- Diseñado para evaluar áreas críticas en busca de daños o riesgos.
- Recibe feedback de artistas visuales, diseñadores y cineastas.
- Promete revolucionar la creación de contenido audiovisual con un nivel de realismo impresionante.
- Enfrenta desafíos como la precisión y la coherencia visual en secuencias extendidas.
Implicaciones y desafíos
La competencia entre Google y OpenAI (hay más actores, aunque hemos simplificado a efectos de brevedad) no sólo impulsa la innovación, sino que también plantea importantes preguntas sobre el acceso y la adopción de estas tecnologías. Es evidente que la privacidad y la seguridad son campos que se convierten en más resbaladizos, si cabe, cuando hablamos de iamgenes y del tratamiento de estas y sus origenes o fuentes.
Por otra parte será muy interesante ver las diferentes implementaciones pues la integración de Google en Workspace facilita el acceso, mientras que OpenAI se centra en la calidad y la fiabilidad.
Ambas estrategias subrayan la importancia de la IA generativa en el ámbito del vídeo, donde la capacidad de generar contenido de alta calidad rápidamente y con bajos costos podría, de hecho lo está haciendo, democratizar la producción audiovisual.
Sin embargo, en un estadio temprano como es el actual en la GenAI sobre vídeo surgen muchos retos, entre los que destacamos sólo dos como fotograma de muestra y a efectos de resumir los que más llaman la atención en este momento de cosas, as ber:
- La precisión y coherencia visual en secuencias extendidas (de más de un minutos aproximadamente) y
- Las cuestiones éticas y de seguridad que conllevan estas tecnologías como ya ehmos apuntado antes.
La IA en editores de vídeo tradicionales: DaVinci Resolve 19, como ejemplo
Más allá de las herramientas puramente generativas, los editores de vídeo tradicionales como DaVinci Resolve en su versión 19, lanzado esta misma semana, también están adoptando fuertemente la IA para mejorar sus capacidades. DaVinci Resolve 19 incorpora herramientas como:
- Modo de reducción de ruido impulsado por la IA.
- Limpia el ruido digital mientras mantiene la claridad de la imagen.
- Utiliza la tecnología de redes neuronales convolucionales para identificar y eliminar el ruido de fondo no deseado.
- Permite ajustar la intensidad de la reducción de ruido.
- Utiliza la IA para detectar cortes de escena automáticamente.
- Facilita la edición al identificar transiciones naturales entre tomas.
- Analiza los cambios en la iluminación, el movimiento y el sonido para determinar los puntos de corte.
- Permite ajustar manualmente las detecciones de corte de escena.
- Automatiza el proceso de coincidencia de colores entre diferentes tomas.
- Basado en aprendizaje automático para identificar y ajustar automáticamente la paleta de colores de una toma para que coincida con otra.
- Utiliza algoritmos de aprendizaje profundo para analizar la distribución de color en cada toma.
- Permite ajustar manualmente la coincidencia de colores.
- Incorpora herramientas de IA para el ajuste automático de diálogos y otros elementos sonoros.
- Mejora la postproducción de audio al identificar y ajustar automáticamente el volumen, la ecualización y la compresión de diferentes pistas de audio.
- Utiliza algoritmos de aprendizaje automático para analizar las características acústicas de cada pista de audio.
- Permite ajustar manualmente los ajustes de audio.
Estas herramientas demuestran cómo la IA se está integrando en los flujos de trabajo tradicionales, no solo para competir con las nuevas herramientas generativas, sino también para ofrecer a los profesionales del vídeo funcionalidades antes impensables.
Un futuro emocionante para la creación de vídeo
Y es que aquí también, la incorporación de la GenIA en la creación de vídeo está transformando rápidamente el panorama, ofreciendo a los creadores una gama más amplia de herramientas y opciones para producir contenido visual de alta calidad.
De ello hablaremos mucho, sin duda, en la más esperada edición deOpenExpo Europe, este 13 de Junio en la Nave (Madrid) y online, bajo el lema “The power of GenAI”. Te animamos a adquirir ya tus pases aquí .
Nos vemos en OpenExpo Europe, para hablar y compartir también de IA para la generación de vídeo.