OpenAI está desarrollando una actualización para su modelo de lenguaje generador de imágenes DALL-E, llamada DALL-E 3.
Esta nueva versión, actualmente accesible para alrededor de 400 usuarios, supera al modelo anterior de OpenAI y a sus competidores reconocidos, como Midjourney o Stable Diffusion XL, según aquellos que han tenido acceso al avance.
El YouTuber MattVidPro AI demostró las capacidades de DALL-E 3 en un video reciente, mostrando que puede generar imágenes similares a fotografías o pinturas complejas sin seguir reglas de censura.
Además, logró generar imágenes de contenido violento y protegido por derechos de autor (lo cual probablemente estará limitado en la versión final cuando sea lanzada al público).
Por ejemplo, creó una pintura de un Jesucristo zombi comiendo un sándwich de Subway, en un estilo muy similar a la pintura de Francisco de Goya «Saturno devorando a un hijo».
El YouTuber destacó la mejora de DALL-E 3 en la comprensión de las indicaciones y en la generación de texto, especialmente en la generación de imágenes de manos.
En comparación con el último modelo de Midjourney, DALL-E 3 se adhiere mejor a las reglas de las indicaciones y proporciona imágenes de mayor calidad.
Este desarrollo desafía, por supuesto, a empresas como Midjourney, Microsoft, Google y Adobe a actualizar sus propias versiones de modelos de lenguaje generadores de imágenes para seguir el progreso de OpenAI.