Principales aspectos destacados:
- Genie 3 permite generar entornos tridimensionales con interacción en tiempo real.
- El usuario puede explorar y modificar el mundo con comandos simples.
- El modelo está orientado a pruebas y entrenamientos en IA, aún sin acceso público.
Google DeepMind acaba de presentar una nueva generación de modelos de inteligencia artificial orientados a la creación de mundos digitales interactivos.
Llamado Genie 3, el sistema es capaz de generar entornos 3D en tiempo real, permitiendo que el usuario explore e interactúe con elementos del escenario con simples comandos de texto.
La novedad representa un avance significativo en relación con el Genie 2, lanzado a finales de 2024, y es una apuesta más de la empresa en el camino hacia la llamada inteligencia artificial general (AGI).
Una IA que genera y responde en tiempo real
A diferencia de las versiones anteriores, el Genie 3 no solo crea mundos visuales a partir de descripciones, sino que también permite que el usuario modifique e interactúe con estos espacios de forma dinámica.
El modelo ofrece videos en 720p con audio y soporte a comandos continuos durante varios minutos, lo que DeepMind llama «horizonte de interacción».
Esto significa que el entorno reacciona a las acciones del usuario, creando una sensación de inmersión poco común para sistemas basados únicamente en indicaciones de texto o imágenes estáticas.
Ejemplos impresionantes que recuerdan a juegos interactivos
En las demostraciones divulgadas por la empresa, es posible ver escenas en las que brazos virtuales pintan paredes y el entorno mantiene estos cambios a lo largo del tiempo.
También hay simulaciones en colinas cubiertas de nieve o dentro de museos, con objetivos definidos por texto.
Estas interacciones recuerdan experiencias de videojuegos con narrativa no lineal, lo que sugiere posibles aplicaciones en el desarrollo de juegos, simulaciones educativas o entrenamientos corporativos con el uso de realidad virtual.
Aún en pruebas y con limitaciones técnicas
A pesar del entusiasmo, DeepMind deja claro que el Genie 3 está en una fase inicial. El sistema aún no puede recrear lugares reales con precisión geográfica y su duración de uso está limitada a unos pocos minutos por interacción.
Además, el acceso al modelo está restringido a un pequeño grupo de evaluadores, mientras la empresa estudia cómo poner la tecnología a disposición de manera más amplia en el futuro.
Aun así, el Genie 3 marca un paso importante hacia entornos digitales más dinámicos, donde la IA y la interacción se encuentran de manera cada vez más natural.