Investigadores de Stanford han desarrollado un modelo de Inteligencia Artificial (IA), EG3D, que puede generar imágenes aleatorias de caras y otros objetos con alta resolución…

Estás leyendo la publicación: Investigadores de Stanford han desarrollado un modelo de Inteligencia Artificial (IA), EG3D, que puede generar imágenes aleatorias de caras y otros objetos con alta resolución…

Los modelos de inteligencia artificial han avanzado recientemente hasta el punto de que los usuarios pronto podrán utilizar estos modelos para construir y alterar inmediatamente escenarios tridimensionales casi fotorrealistas desde la comodidad de sus computadoras portátiles. Dado que estas tecnologías simplifican la generación de avatares hiperrealistas, revolucionarán la forma en que los artistas que trabajan en videojuegos y CGI para películas abordan su trabajo. Durante bastante tiempo, las IA han podido crear imágenes 2D realistas. Sin embargo, los escenarios 3D han demostrado ser más desafiantes debido a la enorme potencia informática necesaria. El modelo de IA EG3D, creado por un equipo de académicos de Stanford, puede usarse para producir imágenes aleatorias de alta resolución de caras y otras cosas que tienen una estructura geométrica subyacente. Este modelo es uno de los primeros modelos 3D actualmente en uso para alcanzar una calidad de renderizado cercana al fotorrealismo.

EG3D y sus precursores utilizan un método de aprendizaje automático muy popular conocido como red adversarial generativa (GAN) para crear gráficos. Al utilizar una red neuronal para crear imágenes y otra para evaluar su precisión, estos sistemas enfrentan dos redes neuronales entre sí. Hasta que el resultado sea factible, este proceso se realiza varias veces. Los investigadores crearon un componente que puede transformar estas imágenes para el espacio 3D al combinar características de GAN 2D de alta resolución ya existentes. Este edificio de dos piezas logra dos objetivos a la vez. Además, es lo suficientemente rápido para operar en tiempo real en una computadora portátil y puede usarse para crear diseños 3D complejos. Es compatible con las arquitecturas actuales y tiene un rendimiento informático eficiente.

🔥 Recomendado:  Actualizaciones de administración: garantizar que obtiene el mejor ROI de Brandwatch

Aunque es posible usar herramientas como EG3D para crear imágenes 3D que son casi reales, todavía existe el problema de cuán difícil es alterarlas en el software de diseño. Esto se debe a que, a pesar de que el resultado es una imagen que se puede ver, no está claro cómo la crearon las GAN. Un modelo de aprendizaje automático llamado GiraffeHD desarrollado por investigadores de la Universidad de Wisconsin-Madison puede ser útil en esta situación. Este modelo es efectivo para eliminar características manipulables de imágenes 3D. Permite al usuario elegir numerosos elementos, incluida la forma, el color y la escena o el fondo de la imagen. GiraffeHD fue entrenado usando innumerables fotografías. Para construir estas imágenes de manera que todos estos aspectos se comporten como variables controlables, el modelo busca factores latentes en la imagen. Los usuarios podrán modificar con precisión las características de los escenarios deseados mediante la edición de estos aspectos controlables en fotografías generadas en 3D en el futuro. Una tendencia más significativa es el empleo de IA para hacer fotos en 3D, incluidas EG3D y Giraffe HD. Sin embargo, todavía queda mucho trabajo por hacer con respecto al sesgo algorítmico y una aplicabilidad más amplia. El tipo de datos de entrenamiento de alimentación aún restringe estos modelos. Todavía se están realizando investigaciones para abordar estos problemas.

Aunque todavía está en sus primeras etapas, esta investigación abre posibilidades para imágenes y modelos 3D más realistas. Será interesante ver hacia dónde va esta línea de investigación y cómo se puede aplicar en el futuro. Me encantaría escuchar sus pensamientos sobre este nuevo enfoque en nuestro Subreddit de aprendizaje automático.

🔥 Recomendado:  36 Reciba mensajes de bienestar para clientes, compañeros de trabajo, empleados y su jefe

Este artículo está escrito como un artículo resumido por el personal de Marktechpost basado en el documento ‘Redes antagónicas generativas 3D conscientes de la geometría eficientes‘. Todo el crédito de esta investigación es para los investigadores de este proyecto. Revisar la papel, github y artículo de referencia.

Por favor no olvides unirte Nuestro subreddit de ML

Echa un vistazo a https://aitoolsclub.com para encontrar 100 de Cool AI Tools