Google DeepMind Revoluciona la Creación de Bandas Sonoras con IA

El laboratorio de Inteligencia Artificial de Google, DeepMind, está desarrollando una tecnología innovadora que promete transformar la creación de bandas sonoras y diálogos para videos. Este avance, denominado ‘V2A’, es un sistema que co

25/06/2024Santiago JacquatSantiago Jacquat

El laboratorio de Inteligencia Artificial de Google, DeepMind, está desarrollando una tecnología innovadora que promete transformar la creación de bandas sonoras y diálogos para videos. Este avance, denominado ‘V2A’, es un sistema que comprende píxeles sin procesar y utiliza indicaciones de texto para generar efectos de sonido acordes a las escenas visuales.

¿Qué es ‘V2A’?

A través de una reciente publicación en su blog, el equipo de DeepMind presentó ‘V2A’, una inteligencia artificial capaz de analizar videos, audios y anotaciones generadas por IA, aprendiendo a asociar sonidos específicos con diferentes escenas. Este sistema ha sido entrenado con una amplia variedad de datos que incluyen descripciones detalladas de sonidos y transcripciones de diálogos, lo que le permite crear efectos sonoros precisos y contextualmente apropiados para lo que ocurre en la pantalla.

Google DeepMind Revoluciona la Creación de Bandas Sonoras con IA

Aplicaciones de ‘V2A’

La IA ‘V2A’ no solo puede generar bandas sonoras para videos modernos, sino que también tiene la capacidad de añadir sonido a películas mudas y cualquier otro tipo de video sin audio. Los usuarios pueden introducir indicaciones positivas para dirigir la creación de sonidos específicos o negativas para evitar ciertos efectos sonoros. Por ejemplo, se puede utilizar una serie de indicaciones como «Cinemática, thriller, película de terror, música, tensión, ambiente, pisadas sobre hormigón» para generar una banda sonora adecuada para una escena de suspenso.

Integración y Futuro

DeepMind ha compartido su progreso en la tecnología ‘V2A’ y su potencial para integrarse con herramientas de creación de video como Google Veo y Sora de OpenAI. Esta combinación podría facilitar la producción de contenido audiovisual de alta calidad, ampliando las posibilidades creativas para cineastas y creadores de contenido.

Pruebas y Seguridad

A pesar de los avances significativos, los investigadores de DeepMind están conscientes de las limitaciones actuales de ‘V2A’, como posibles caídas en la calidad del audio debido a distorsiones en los videos de origen y desafíos en la sincronización de labios para generar diálogos. Por ello, el equipo se compromete a someter la tecnología a rigurosas evaluaciones y pruebas de seguridad antes de su lanzamiento oficial, asegurando que cumpla con los estándares de calidad y fiabilidad.

Compromiso con la Innovación

El desarrollo de ‘V2A’ representa un paso adelante en el uso de la inteligencia artificial para la creación de contenido audiovisual. DeepMind continúa su compromiso con la innovación, buscando soluciones que no solo mejoren la productividad de los creadores, sino que también ofrezcan nuevas formas de expresión artística y narrativa.

Lo más visto

Suscríbete al newsletter para recibir periódicamente las novedades en tu email