Estás leyendo la publicación: Quick Take on Text to Image Conversion with AI — usando Stable… – Hacia la IA
Publicado originalmente en Hacia la IA, la empresa líder mundial en noticias y medios de IA y tecnología. Si está creando un producto o servicio relacionado con la IA, lo invitamos a considerar convertirse en patrocinador de la IA. En Hacia la IA, ayudamos a escalar las empresas emergentes de IA y tecnología. Permítanos ayudarlo a dar rienda suelta a su tecnología a las masas.
Toma rápida de conversión de texto a imagen con IA: uso de difusión estable
Si bien las herramientas de conversión han existido durante años, Stable Diffusion literalmente hace posible que para crear arte fotorrealista!
¿Qué es el modelo de conversión de texto a imagen?
De manera simplista, es un modelo que produce imágenes que coinciden con la descripción del texto proporcionado lo más cerca posible. Cae bajo el dominio de la IA generativa y es uno de los casos de uso para el aprendizaje profundo.
IA generativa
La inteligencia artificial, aunque se encuentra en su etapa inicial, ha recorrido un largo camino para penetrar la forma en que interactuamos, participamos y expresamos. La IA generativa es una faceta de esta evolución que permite que los algoritmos imaginen palabras y voces en imágenes y expresiones. Crea resultados imparciales, que generalmente resultan de pensamientos y experiencias humanas.
La IA generativa se refiere a modelos de inteligencia artificial que pueden usar contenido existente como texto, archivos de audio o imágenes para crear nuevo contenido creíble.
Los modelos de IA generativa se basan principalmente en técnicas como redes antagónicas generativas (GANS), transformadores y codificadores automáticos variacionales.
IA en el arte
Aunque no entiendo mucho cuando se trata de arte, definitivamente me fascina la idea de que una IA lo haga por mí.
Recientemente hubo mucho revuelo en torno a un arte generado por IA que ganó una competencia internacional. Aunque tales artes nunca superarán el legado y la era de varios artistas de todo el mundo a lo largo de la historia, creo que definitivamente harán que el arte sea más accesible para las masas y forjará su propio nicho.
Lea el artículo completo en Los Tiempos de la Ciudad Nueva York.
Esta obra de arte del Sr. Allen fue creada con Midjourney, otro programa de inteligencia artificial que convierte el texto en gráficos hiperrealistas.
¿Qué es la difusión estable y cómo funciona?
Los convertidores de texto a imagen existen desde hace bastante tiempo, pero las herramientas lanzadas este año (2022), como DALL-E 2, Imagen, Midjourney y Stable Diffusion, hacen posible que casi cualquier persona cree obras fotorrealistas simplemente escribiendo algún texto.
Si bien existen varios programas que admiten la conversión de texto a imagen, en este artículo exploramos Stable Diffusion como uno de los modelos.
Cree su propio arte proporcionando indicaciones en el espacio público de demostración para Difusión estable modelo.
Desde la perspectiva del usuario, eso es bastante sencillo. Escribes en tu imaginación en palabras, y el modelo producirá un arte interesante. Utiliza un complejo proceso de “difusión” para convertir texto en imágenes.
En el caso de la conversión de texto a imagen, el modelo intenta aprender el patrón subyacente de la entrada y luego usa esa información para generar imágenes ajustadas. Es posible que no siempre produzca una nueva imagen, sino que intenta alcanzar el resultado más cercano mezclando y combinando las imágenes que ya tiene.
Posibilidades infinitas
Intenté dar algunas indicaciones al modelo Stable Diffusion, y así es como me sorprendió:
“Gato con gafas de sol en el bar”.
“Horizonte colorido en el Océano Índico. Un barco navegando junto a una manada de delfines.
“Zanahoria en un cinturón de kárate”.
PD: El arte solo mejora con la expresividad de tu imaginación en palabras. Entonces, ¡escribe mejor! ?
Algunas imágenes generadas por los usuarios de los blogs de Stable Diffusion:
Cortesía: https://stability.ai/blog/stable-diffusion-public-release
Desafíos: bloqueadores convencionales
La mayoría de los modelos se entrenan mediante raspado web de imágenes en general y, por lo tanto, no se someten a ningún escrutinio. A día de hoy, mientras se escribe este artículo, esto puede dar lugar a un uso indebido potencial, resultados impredecibles y otros problemas éticos con el uso generalizado de esta tecnología.
Aunque no estamos lejos de una etapa en la que la IA sea capaz de realizar la mayoría de las tareas humanas, el desafío de modelar la ética en su núcleo sigue siendo un rompecabezas sin resolver.
Conclusión
La IA generativa es un dominio que se está convirtiendo rápidamente en la corriente principal en este momento. Con sus casos de uso cada vez mayores, como conversión de texto a imagen, conversión de imagen a imagen, mejoras de resolución de imagen, envejecimiento facial, fotos a emojis, síntesis de audio, análisis de sentimientos y evaluación de tendencias, es una bendición para nosotros.
Es probable que aumenten los avances, y es probable que las técnicas de diseño generativo faculten a las máquinas para hacer más que solo trabajo manual y asumir tareas creativas.
Envolviendolo
¿Compartir en los comentarios? sus pensamientos sobre este modelo de arte generativo súper genial, su futuro y cómo le gustaría usarlo más.
También comparte conmigo el interesante arte que generas con Difusión estable. ?
- ? — envía algunos aplausos si este resumen rápido te ayudó de alguna manera
- ? — comparte este artículo con personas curiosas que buscan explorar
- ➕ — presione seguir para sintonizar más cosas simplificadas,
Conéctate conmigo en LinkedIn.
Quick Take on Text to Image Conversion with AI: using Stable Diffusion se publicó originalmente en Towards AI en Medium, donde las personas continúan la conversación resaltando y respondiendo a esta historia.
Publicado a través de Hacia la IA