Durante la conferencia Google I/O 2025, Google presentó Veo 3, una impresionante evolución en el uso de inteligencia artificial para la creación de videos.
La novedad va más allá de las imágenes: ahora, la herramienta también es capaz de generar bandas sonoras completas, con efectos de sonido, ruidos ambientales e incluso diálogos sincronizados con los personajes creados. Todo esto a partir de un simple comando de texto o imagen.
De forma simplificada, puedes describir una escena, por ejemplo, dos personajes conversando en un parque, y Veo 3 se encarga de crear el video con imágenes, sonidos y diálogos, todo generado por IA.
Esta nueva versión es considerada un gran avance en relación con Veo 2, especialmente en la calidad de las escenas generadas y en la integración de audio.
El CEO de DeepMind, Demis Hassabis, llegó a decir que estamos dejando atrás la «era del cine mudo» en la creación de videos con IA.
Veo 3 ya está disponible para usuarios del plan Google AI Ultra, que cuesta US$ 249,99 por mes y puede ser accesado dentro de la app Gemini, el asistente con inteligencia artificial de la empresa.
Aunque las herramientas de generación de video con IA se están volviendo cada vez más comunes, con empresas como OpenAI, Runway y Pika también lanzando sus soluciones, el gran diferencial de Veo 3 es la capacidad de crear y sincronizar el sonido de forma automática, analizando cada detalle visual de la escena.
La tecnología detrás de esta innovación fue desarrollada por DeepMind, el laboratorio de investigación en IA de Google. La empresa no reveló de dónde vinieron los datos usados en el entrenamiento del modelo, pero hay indicios de que contenidos de YouTube puedan haber sido utilizados.
Para evitar el uso indebido de la tecnología, como la creación de videos falsos (deepfakes), Google confirmó que Veo 3 inserta una marca de agua invisible en cada frame generado, usando su tecnología propietaria llamada SynthID.
A pesar del potencial creativo, la llegada de herramientas como Veo 3 preocupa a parte del mercado, especialmente a los profesionales del sector audiovisual.
Un estudio reciente estima que más de 100 mil empleos ligados a la industria del cine y la animación en EE.UU. pueden ser impactados hasta 2026 con el avance de estas tecnologías. Aun así, Google continúa ampliando el ecosistema de Veo.
La versión anterior, Veo 2, también recibió actualizaciones y ahora consigue interpretar movimientos de cámara y aceptar imágenes como referencia visual para mantener consistencia entre escenas.