Genie 3 es el nuevo modelo de Google DeepMind que crea mundos 3D interactivos en tiempo real

Rene Fraga
3 minutos de lectura

Principales aspectos destacados:

  • Genie 3 permite generar entornos tridimensionales con interacción en tiempo real.
  • El usuario puede explorar y modificar el mundo con comandos simples.
  • El modelo está orientado a pruebas y entrenamientos en IA, aún sin acceso público.

Google DeepMind acaba de presentar una nueva generación de modelos de inteligencia artificial orientados a la creación de mundos digitales interactivos.

Llamado Genie 3, el sistema es capaz de generar entornos 3D en tiempo real, permitiendo que el usuario explore e interactúe con elementos del escenario con simples comandos de texto.

La novedad representa un avance significativo en relación con el Genie 2, lanzado a finales de 2024, y es una apuesta más de la empresa en el camino hacia la llamada inteligencia artificial general (AGI).

Genie 3: Creating dynamic worlds that you can navigate in real-time

Una IA que genera y responde en tiempo real

A diferencia de las versiones anteriores, el Genie 3 no solo crea mundos visuales a partir de descripciones, sino que también permite que el usuario modifique e interactúe con estos espacios de forma dinámica.

El modelo ofrece videos en 720p con audio y soporte a comandos continuos durante varios minutos, lo que DeepMind llama «horizonte de interacción».

Esto significa que el entorno reacciona a las acciones del usuario, creando una sensación de inmersión poco común para sistemas basados únicamente en indicaciones de texto o imágenes estáticas.

Ejemplos impresionantes que recuerdan a juegos interactivos

En las demostraciones divulgadas por la empresa, es posible ver escenas en las que brazos virtuales pintan paredes y el entorno mantiene estos cambios a lo largo del tiempo.

También hay simulaciones en colinas cubiertas de nieve o dentro de museos, con objetivos definidos por texto.

Estas interacciones recuerdan experiencias de videojuegos con narrativa no lineal, lo que sugiere posibles aplicaciones en el desarrollo de juegos, simulaciones educativas o entrenamientos corporativos con el uso de realidad virtual.

Aún en pruebas y con limitaciones técnicas

A pesar del entusiasmo, DeepMind deja claro que el Genie 3 está en una fase inicial. El sistema aún no puede recrear lugares reales con precisión geográfica y su duración de uso está limitada a unos pocos minutos por interacción.

Además, el acceso al modelo está restringido a un pequeño grupo de evaluadores, mientras la empresa estudia cómo poner la tecnología a disposición de manera más amplia en el futuro.

Aun así, el Genie 3 marca un paso importante hacia entornos digitales más dinámicos, donde la IA y la interacción se encuentran de manera cada vez más natural.

Seguir:
Renê Fraga es fundador de Google Discovery y editor en jefe de Eurisko, un ecosistema editorial independiente dedicado a la tecnología, la ciencia y la innovación. Profesional del marketing digital, con posgrado por la ESPM, sigue de cerca a Google desde la década de 2000 y escribe desde hace más de 20 años sobre tecnología, productos digitales e inteligencia artificial. Fundó Google Discovery en 2006, convirtiéndolo en uno de los principales sitios especializados en Google en Brasil, y fue columnista de TechTudo (Globo.com).
No hay comentarios