Ingeniería rápida: cómo hablar con la IA para obtener lo que desea

Estás leyendo la publicación: Ingeniería rápida: cómo hablar con la IA para obtener lo que desea

¿Es la ingeniería rápida un proceso que trata de obtener respuestas precisas, lógicas y consistentes de un modelo de lenguaje de IA? ¿O es una forma de encontrar las fallas en un modelo de lenguaje y luego corregirlas para lograr el modelo de inteligencia artificial perfecto, que mata la “ingeniería rápida”?

En este artículo, nos concentraremos en ChatGPT porque es el modelo más popular en este momento. Pero en caso de que esta herramienta de inteligencia artificial sea nueva para usted, le sugiero que lea primero nuestro artículo “ChatGPT para principiantes”. También veremos indicaciones para generadores de imágenes como DALLE 2.

He escrito algunos artículos sobre este LLM (modelo de lenguaje grande) y aprendí que no es tan inteligente. ChatGPT comete errores e incluso puede sufrir alucinaciones (es por eso que debes aprender a optimizar para la IA).

Al mismo tiempo, fui testigo del proceso de reparación, al que probablemente contribuyeron los ingenieros rápidos.

OpenAI, los creadores de ChatGPT, solicitan comentarios de los usuarios, siguen reseñas y críticas y toman medidas. Los problemas que tenía ChatGPT hace cuatro a seis semanas ahora han desaparecido (y esta iteración y mejora constante realmente ha ayudado a ChatGPT a seguir creciendo).

Mi comida para llevar es pedir ayuda para arreglar ChatGPT. Pero, ¿lograrán las indicaciones crear un modelo de lenguaje perfecto a partir de ChatGPT? Solo el futuro lo dirá.

¿Qué es Ingeniería Rápida?

Hoy, en el contexto de los modelos de lenguaje de IA, la “ingeniería de avisos” se refiere al diseño de avisos o entradas efectivos que se pueden usar para generar resultados deseados y consistentes a partir de un modelo.

Los modelos de lenguaje son sistemas de inteligencia artificial que procesan el lenguaje natural y generan texto en respuesta a indicaciones o entradas.

La ingeniería práctica de avisos implica seleccionar el tipo correcto de aviso, refinar la redacción y la estructura del aviso, y ajustar otros parámetros como la duración del aviso, la temperatura de la salida generada y la diversidad de las respuestas generadas.

Al diseñar cuidadosamente las indicaciones, los modelos de lenguaje de IA se pueden usar para diversas tareas, como la traducción de idiomas, la respuesta a preguntas y la generación de texto.

Y la IA se vuelve más inteligente y eficiente cada día que pasa. De manera lenta pero segura, la IA parece estar comenzando a creer que puede responder cualquier pregunta y completar cualquier tarea. Sin embargo, si bien esto puede parecer razonable, también tiene su lado negativo. Por ejemplo, la IA generativa es impredecible y, a menudo, produce galimatías o divagaciones.

En resumen, la ingeniería rápida es esencial hoy en día para desarrollar y utilizar modelos de lenguaje de IA.

¿Cómo redactar indicaciones?

Esta guía cubre el uso de avisos con LLM como ChatGPT. Las indicaciones son una excelente manera de interactuar con los LLM y hacer que generen texto sobre un tema en particular.

Nota: dado que OpenAI mejora continuamente ChatGPT, no hay garantía de que su aviso perfecto y efectivo de hoy brinde las mismas respuestas mañana o en el futuro.

Durante mi investigación, leí muchos artículos y documentos. Algunos incluyeron ejemplos y, en muchos casos, las respuestas de ChatGPT ahora son diferentes de lo que eran cuando se publicaron los artículos.

En general, se espera que intente repetidamente hasta que obtenga una respuesta lo más cercana posible a lo que espera. Un aviso efectivo es como un conjunto de instrucciones o una pregunta que le haces a un modelo. También puede incluir otra información, como entradas o ejemplos.

Un aviso estándar tiene el siguiente formato ; también puede tomar el formato de una pregunta y respuesta.

P: ?
A:

Es preferible instruir el modelo de IA de forma sencilla y dar algunos ejemplos. Este tipo de aviso se conoce como “aviso de pocas tomas”.

Sea explícito con respecto al formato de la salida. Como puede ver, digo: “Por favor, siga los ejemplos”. Si omito esa línea, ChatGPT responde de la siguiente manera:

Pero un buen aviso puede tomar muchas formas, dependiendo de la tarea. Puede contener un:

  • Instrucción – una tarea que el modelo de IA tiene que realizar.
  • Contexto – información que le ayudará a producir una mejor respuesta.
  • Datos de entrada – entrada o una pregunta que necesita ser respondida.
  • Indicador de salida – el formato de la salida.
🔥 Recomendado:  El surgimiento del apilamiento: ¿Cómo está transformando la industria de la inteligencia artificial (IA) la naturaleza autorreferencial del apilamiento en modelos de lenguaje extenso?

No todos estos componentes son necesarios. Exploraremos algunos ejemplos concretos más adelante.

Principios básicos para la escritura rápida

Ahora concentrémonos en algunos principios básicos para escribir indicaciones.

Empezar de forma sencilla – Si desea obtener mejores resultados, comience con indicaciones simples y agregue más elementos y contexto. Al hacer esto, irás mejorando gradualmente tus resultados.

Instrucción – Para diseñar avisos efectivos para tareas simples, puede usar comandos como “Escribir”, “Clasificar”, “Resumir”, “Traducir”, “Ordenar”, etc. Estos comandos instruyen al modelo de lenguaje grande sobre qué tarea desea. actuar. Sin embargo, es esencial experimentar con diferentes palabras clave, contextos y datos para ver qué funciona mejor para su caso de uso específico.

El contexto debe ser relevante y específico para la tarea que está tratando de realizar. Cuanto más detallado y relevante sea el contexto para la tarea, más efectivo será el aviso. Al experimentar con diferentes instrucciones, palabras clave y datos, puede encontrar el mejor enfoque para su tarea en particular.

Se específico – Ser específico sobre lo que desea que haga el modelo de aprendizaje automático es fundamental para obtener buenos resultados.

Cuanto más detallada y descriptiva sea la indicación, mejor. Esto es especialmente importante si tiene en mente un resultado deseado o un estilo de generación.

Ningún token o palabra clave específica garantiza mejores resultados; tener un formato adecuado y un indicador descriptivo es más importante.

Proporcionar ejemplos en un buen aviso es una forma efectiva de obtener el resultado deseado en formatos específicos.

Sea directo y preciso – Explique sus expectativas tanto como pueda. Por ejemplo, indique con precisión cuánto tiempo desea que sea el resultado e incluya las palabras clave esperadas.

Indicaciones para generadores de arte DALLE-2 y Midjourney

Esas solicitudes procesaron mucho arte y claramente tienen un excelente conocimiento de las artes. En consecuencia, puede ser bastante fácil para esos modelos crear arte porque el vocabulario necesario para crear arte es relativamente menor.

Las aplicaciones anteriores crean representaciones 2D de obras de arte 2D y 3D.

Si está listo para generar algo de arte de IA. Aquí hay algunos consejos.

  • Las indicaciones pueden ser solo unas pocas palabras, como “guerreros de terracota sentados alrededor de una mesa”.
  • DALL-E 2 tiene una mentalidad artística, lo que significa que la IA ha procesado mucho arte. Eso significa que ciertos trucos pueden dar resultados interesantes. Mencionar un tipo específico de estilo artístico alentará a DALL-E 2 a inspirarse en el período en que ese estilo estaba de moda, como el “surrealismo”. Otros ejemplos incluyen diesel-punk, post-apocalíptico y cyberpunk.
  • Si eres fotógrafo, ¡DALL-E 2 es la herramienta perfecta! Incluya vistas específicas, ángulos, distancias, iluminación y técnicas de fotografía (o incluso lentes) para ver cómo responderá DALL-E 2.
  • Los generadores de IA tienen problemas con las caras a menos que tengan un aviso específico. Si no le gusta el rostro de la imagen, puede volver a intentarlo y agregar más detalles sobre el rostro, como qué tipo de expresión desea, hacia dónde debe mirar el rostro, etc.
  • Las imágenes se pueden editar de muchas maneras, dependiendo de su objetivo. Puede cortar y pegar elementos para cambiar la composición o eliminar objetos que no desea en la imagen. Con las herramientas adecuadas, incluso puedes cambiar el fondo de una imagen para darle un nuevo aspecto.

Si está interesado en las ilustraciones de IA, le sugiero que lea la sección Recursos de ingeniería rápidos.

Consejos y trucos

  • Concéntrese en decir lo que quiere que haga y NO lo que no quiere que se incluya. Esto fomentará una mayor especificidad y se centrará en los detalles que conducen a buenas respuestas del modelo.
  • Use personas o roles para obtener respuestas enfocadas de ChatGPT, como “Eres un estudiante universitario…” o “Eres un maestro…”
  • Inyección rápida es una técnica para secuestrar la salida de un modelo de lenguaje. (Podemos hacer que los modelos ignoren la primera parte del mensaje). Los usuarios de Twitter rápidamente descubrieron que podían inyectar su texto en el bot para que dijera lo que quisieran. Esto funciona porque Twitter toma el tweet de un usuario y lo concatena con su mensaje para formar el mensaje final que pasan a un LLM. Esto significa que cualquier texto que el usuario de Twitter inyecte en su tweet pasará al LLM.
  • Fuga rápida – puede probar y extraer el aviso original de una aplicación como AIPRM agregando su instrucción a la entrada que espera el aviso. Por ejemplo, en AIPRM, si desea que la aplicación genere una estrategia de palabras clave para “Zapatillas para correr”, agregue la oración como se ve en la imagen.
🔥 Recomendado:  Cómo mejorar las habilidades de escritura con estos 18 consejos

En este ejemplo, AIPRM le da acceso al aviso original para modificarlo según sus necesidades específicas.

Fuga rápida en Marmof:

La inyección rápida y la fuga rápida exponen los puntos débiles de un bot. Conociendo los puntos débiles, se pueden modificar las indicaciones para proteger a los chatbots de este tipo de ataques.

Nota: Parece que el escenario AIPRM anterior ahora se ha solucionado; no pude reproducirlo cuando lo intenté unos días después.

Los ingenieros rápidos pueden identificar fallas de IA

Un ingeniero rápido sabe en qué son buenos los modelos de IA y sus fallas. Usan este conocimiento para crear instrucciones llamadas “indicaciones”.

Es como darle a un robot inteligente una lista de cosas que hacer y asegurarse de que use sus puntos fuertes para hacerlas bien. El ingeniero puntual es como un entrenador para el robot, ayudándolo a hacer su mejor trabajo mientras encuentra sus fallas al mismo tiempo.

Nadie sabe cómo responderán los sistemas de IA a las indicaciones; Los modelos generativos de inteligencia artificial a menudo pueden generar docenas de respuestas contradictorias. Esto indica que las respuestas de los modelos no se basan en la comprensión sino en imitar burdamente el habla para resolver tareas que no entienden.

En otras palabras, los modelos nos dicen lo que creen que queremos escuchar o lo que ya hemos dicho, incluso si es vergonzoso.

Las empresas se han apresurado a contratar artesanos rápidos para descubrir capacidades ocultas. Pero básicamente, un ingeniero puntual toca al oso de diferentes maneras para ver cómo reacciona.

Una parte crítica del trabajo implica:

  • Averiguar cuándo y por qué la herramienta de IA se equivoca o falla inesperadamente.
  • Trabajar para abordar las debilidades subyacentes.
  • Sellado de vulnerabilidades de IA con filtros de palabras y bloques de salida.

Los ingenieros constantemente presionan y desafían la herramienta para tratar de aprender cómo enfocar su atención y trazar dónde están sus límites.

En conclusión, algunos ingenieros de prontas son contratados para encontrar fallas, evitarlas en sus prontas y de esta manera lograr resultados eficientes y consistentes.

Ejemplos de ingeniería rápida

  • Resumen de texto – Los modelos de lenguaje pueden crear resúmenes de artículos y conceptos que son rápidos y fáciles de leer. Esto podría ahorrar mucho tiempo a las personas ocupadas que necesitan obtener información de un artículo largo pero que no tienen tiempo para leerlo todo. Puede indicarle al modelo cuánto tiempo desea que sea el resumen, pero recuerde verificar los hechos (y también consulte nuestra revisión de Long Shot AI;).
  • Extracción de información – Los modelos de lenguaje son como las navajas suizas del mundo de la PNL. Se pueden utilizar para diversas tareas, entre ellas, la extracción de información. Esta flexibilidad los convierte en herramientas esenciales para cualquier proyecto de PNL.
  • Clasificación de texto – aquí hay una demostración de clasificación de texto:
  • Respuesta a preguntas – Como se mencionó anteriormente, una de las mejores formas de hacer que su modelo responda con respuestas específicas es mejorar el formato de la indicación. Un aviso podría combinar instrucciones, contexto, entrada e indicadores de salida para obtener mejores resultados. Sin embargo, estos componentes no son necesarios. En cambio, es una buena práctica ser específico con las instrucciones para lograr mejores resultados. A continuación se muestra un ejemplo de cómo se vería esto si se sigue un mensaje más estructurado.
  • Conversación – Puede lograr algunas cosas interesantes con ingeniería rápida, incluida la instrucción del sistema LLM sobre cómo comportarse, su intención y su identidad. Esto es especialmente útil cuando se construyen sistemas conversacionales como chatbots de servicio al cliente.

Recursos de ingeniería rápidos

Cuando realiza una búsqueda en Google sobre “Recursos de ingeniería de avisos”, encontrará una tonelada de artículos que lo dirigirán a los avisos de ChatGPT y DALL-E 2.

  • Listas de recursos para avisos
  • Libros
  • Vídeos en YouTube
  • Cursos
  • Extensiones de cromo
🔥 Recomendado:  Estudio revela las 20 principales criptomonedas y proyectos Web3 que son tendencia en Twitter

Puede comprar avisos o buscar servicios para escribir avisos para usted en Fivver.

Estos son algunos de mis recursos favoritos para ChatGPT:

Recursos para DALL-E 2

Extensión AIPRM para ChatGPT

La extensión AIPRM, que mencioné en mi artículo “Más de 7 formas en que puede usar ChatGPT para SEO: consejos prácticos para mejorar su clasificación”, le brinda acceso a una biblioteca de plantillas de solicitud seleccionadas para ChatGPT. Hoy hay más de 460 indicaciones divididas en diez categorías.

Los ingenieros de avisos publican sus mejores avisos para usted, para que pueda encontrar fácilmente los que necesita. AIPRM cubre muchos temas como SEO, ventas, atención al cliente y estrategia de marketing.

Estas indicaciones lo ayudarán a optimizar su sitio web y mejorar su clasificación en los motores de búsqueda.

AIPRM (Metáfora aleatoria impulsada por inteligencia artificial) ahora ofrece un Plan Premium con nuevas funciones para mejorar la escritura, que incluyen múltiples avisos próximos, Avisos verificados de AIPRM, guardado y ocultación de avisos, encendido personalizado continúa, estilos y tonos de escritura personalizados, y más avisos públicos para avisos. ingenieros

¡Recuerde siempre verificar cada resultado de un indicador AIPRM! En el siguiente ejemplo, la instrucción era reformular el párrafo de entrada.

Y como AIPRM ha trasladado muchas de sus funciones a premium, es posible que le interesen algunas alternativas que siguen siendo gratuitas y tienen muchas de las mismas funciones:

Ingeniería rápida como trabajo

El surgimiento del ingeniero rápido es el resultado directo de la popularidad de los chatbots como ChatGPT de OpenAI. Estos chatbots han creado una nueva forma para que las personas interactúen con las computadoras y revolucionaron nuestra forma de pensar sobre la comunicación.

Si bien estas herramientas pueden brindar algunos beneficios, también pueden estar sesgadas, generar información errónea y, en ocasiones, molestar a los usuarios con respuestas crípticas.

Así nació el oficio del ingeniero puntual.

Entonces, si los modelos de IA generativa y los chatbots son el futuro, tal vez te preguntes: “¿Debería convertirme en un ingeniero rápido?”

Mi respuesta es un rotundo NO. Como he aprendido de mi interacción con los chatbots, avanzan a diario, lo que significa que muchos expertos e ingenieros ya están trabajando duro para mejorarlos. En mi opinión, esta tecnología de IA se perfeccionará en los próximos tres a cinco años y la demanda de ingenieros rápidos se reducirá drásticamente.

Conclusiones clave

Como ChatGPT es la última tendencia, también lo es Prompt Engineering.

  • ¿Cuál es tu enfoque deseado?
  • ¿En qué estilo quieres el texto?
  • ¿Quién es su público objetivo?
  • ¿Qué longitud debe tener el producto terminado?

Todas estas son preguntas críticas que debe considerar antes de escribir y lo guiarán mientras trabaja. Además, si tiene una perspectiva específica desde la que desea que se escriba el texto, asegúrese de mencionarla. Y finalmente, si hay algún requisito particular, como no usar jerga, asegúrese de incluirlo también.

La mayoría de los chatbots populares se basan en OpenAI. OpenAI está trabajando intensamente para corregir fallas en su modelo. Como resultado, y como podemos ver en el gráfico anterior, la tendencia de Ingeniería Rápida es a la baja.

GPT-4 fue lanzado hace unos días. Será interesante ver qué giros toma el futuro. Aquí está lo último en ChatGPT Plus vs ChatGPT vs herramientas alternativas.