Un simple intercambio de mensajes entre ejecutivos de Google llamó la atención de la comunidad de tecnología e inteligencia artificial esta semana.
Todo comenzó cuando un usuario de la red X (antes Twitter) pidió poder convertir sus vídeos creados con Veo 3 en un juego interactivo.
En respuesta, Demis Hassabis, CEO de DeepMind, dijo: “ahora eso sería algo”, sugiriendo que esta posibilidad puede no estar tan lejos de la realidad.
Poco después, Logan Kilpatrick, responsable de Google AI Studio y de la API de Gemini, respondió con emojis enigmáticos, reforzando el clima de misterio.
Aunque la empresa no ha hecho ningún anuncio oficial, el intercambio de mensajes generó discusiones sobre el potencial del modelo Veo 3 más allá de la generación de vídeos, especialmente en la creación de mundos jugables e interactivos.
Para entender mejor, es importante diferenciar dos tipos de tecnologías. Veo 3 es un modelo de generación de vídeo capaz de crear escenas realistas con audio y movimiento, basándose en la física del mundo real.
Por otro lado, los llamados modelos de mundo, como el Genie 2 de la propia DeepMind, son capaces de simular entornos dinámicos, donde una inteligencia artificial puede predecir y reaccionar a acciones dentro de un escenario.
En otras palabras, los modelos de mundo no solo muestran un vídeo, sino que permiten que el usuario interactúe con él como si fuera un juego.
El camino hacia un juego completo requiere más que gráficos realistas. Es necesario que el sistema sea interactivo, coherente en tiempo real y receptivo.
Por lo tanto, la combinación de tecnologías como Veo 3 y Genie 2 podría ser un paso estratégico para Google. La empresa también tiene planes ambiciosos con el Gemini 2.5 Pro, un modelo multimodal que, en el futuro, podría simular incluso aspectos del cerebro humano.
Si Google decide seguir por este camino, podría entrar en una nueva disputa en el sector de la IA contra nombres como Microsoft, Runway, Scenario, Pika e incluso OpenAI, con su modelo de vídeo Sora.