▷ DALL-E 3 podría llevar la generación de imágenes con IA al siguiente nivel

Estás leyendo la publicación: DALL-E 3 podría llevar la generación de imágenes con IA al siguiente nivel

AbiertoAI

OpenAI podría estar preparando la próxima versión de su generador de texto a imagen DALL-E AI con una serie de pruebas alfa que ahora se han filtrado al público, según el Descifrador.

Un filtrador anónimo en Discord compartió detalles sobre su experiencia, al tener acceso al próximo modelo de imagen OpenAI conocido como DALL-E 3. Apareció por primera vez en mayo y le dijo al canal Discord basado en intereses que era parte de una prueba alfa para OpenAI, probando un nuevo modelo de imágenes de IA. Compartió las imágenes que generó en ese momento.

¡NUNCA hemos visto una generación de imágenes tan buena! | ESCURRIR EL BULTO

La versión de prueba alfa de mayo tenía la capacidad de generar imágenes de múltiples relaciones de aspecto dentro del modelo de imagen. YouTuber, MattVidPro AI Luego mostró varias de las imágenes que se generaron en una relación de aspecto de 16:9. Esta versión también mostró la destreza del modelo para la producción de texto de alta calidad, lo que sigue siendo un problema para los modelos rivales, incluso para los mejores generadores como Stable Diffusion y Midjourney.

Algunos ejemplos mostraban imágenes, como texto fundido en una pared de ladrillos, un letrero de neón con palabras, un cartel publicitario en una ciudad, la decoración de un pastel y un nombre grabado en una montaña. El modelo sostiene que DALL-E es bueno para generar personas. Una de esas imágenes mostraba a una mujer comiendo espaguetis en una fiesta desde el punto de vista de un ojo de pez.

El filtrador regresó al canal Discord a mediados de julio con más detalles y nuevas imágenes. Afirmó ser parte de una versión de prueba “alfa cerrada” que incluyó aproximadamente 400 sujetos. Agregó que fue invitado a la prueba por correo electrónico y que también fue incluido en las pruebas del DALL-E y DALL-E 2 originales. Esto es lo que llevó a la conclusión de que la prueba alfa podría ser para DALL-E 3, aunque no ha sido confirmado.

El modelo se ha actualizado considerablemente entre mayo y julio. El filtrador mostró esto compartiendo imágenes generadas en base al mismo mensaje, que muestran cuán poderoso se ha vuelto DALL-E 3 con el tiempo. El mensaje dice un

El alfa de mayo produce la escena general que afecta a la mayoría de los puntos del mensaje. Hay una pequeña distorsión en las manos que se conectan y las ruedas de las bicicletas son amarillas en lugar de estar hechas de queso. Sin embargo, el alfa de julio es mucho más detallado, con el bufón rosa y el panda claramente chocando los cinco y las ruedas de bicicleta hechas de queso en varias generaciones.

Mientras tanto, en Midjourney, el bufón no está en escena, los pandas están en motocicletas en lugar de bicicletas. Hay caminos, en lugar de barro. Los pandas están felices en lugar de enojados.

Hay una gran cantidad de ejemplos de imágenes alfa del 3 de julio de DALL-E que muestran el potencial del modelo. Sin embargo, como la prueba alfa no está censurada, el filtrador señaló que también tiene el potencial de generar escenas de “violencia y desnudez o material protegido por derechos de autor, como logotipos de empresas”.

Algunos ejemplos incluyen una chica de anime sangrienta, un personaje, una portada, un Jesús zombi comiendo un sándwich Subway, que también sugiere sangre leve, y Shrek siendo desenterrado de una excavación arqueológica, entre otros.

MattVidPro AI notó que el modelo de imagen genera imágenes como si tuvieran un estilo específico.

DALL-E 2 se lanzó en abril de 2022, pero estaba fuertemente regulado con una lista de espera debido a su popularidad y preocupaciones sobre ética y seguridad. El generador de imágenes de IA estuvo disponible para el público en septiembre de 2022.

DALL-E 3 podría llevar la generación de imágenes con IA al siguiente nivel

Otros temas interesantes: