DeepMind, la división de inteligencia artificial de Google, anunció Genie 2, un modelo capaz de generar mundos 3D interactivos a partir de simples descripciones textuales o imágenes.
Imagina escribir algo como “un robot humanoide en un bosque” y, en segundos, explorar un entorno jugable creado a partir de esa idea.
Genie 2 es una evolución del modelo lanzado a principios de este año y puede crear escenarios con un nivel impresionante de detalle.
Estos mundos no solo son visualmente ricos, sino que permiten acciones como saltar, nadar e interactuar con objetos, utilizando el teclado o el ratón.
Todo esto es posible gracias a un entrenamiento basado en videos, que le otorgó al modelo la capacidad de simular física, iluminación, reflejos e incluso personajes con comportamientos propios.
A pesar de su similitud con juegos de alta calidad (los llamados juegos AAA), el objetivo de Genie 2 no es competir directamente con ellos.
Dado que los mundos generados son temporales, con una duración de solo 10 a 20 segundos en la mayoría de los casos, el modelo está más enfocado en la investigación y la creación de prototipos creativos.
Los diseñadores pueden usarlo para transformar arte conceptual en entornos interactivos, mientras que los investigadores exploran nuevas formas de probar agentes de inteligencia artificial.
Sin embargo, este avance también plantea preguntas éticas. Hay indicios de que el entrenamiento de Genie 2 incluyó videos de juegos populares, lo que genera dudas sobre derechos de autor y el uso de datos sin autorización.
DeepMind evita comentar detalles sobre el origen de sus datos, pero el debate sobre la legalidad de estas prácticas promete ganar protagonismo a medida que la tecnología avanza.