▷ Curso de ingeniería rápida y desafíos: hacia la IA

Estás leyendo la publicación: Curso de ingeniería rápida y desafíos: hacia la IA

Introducción

Las capacidades y la accesibilidad de los modelos de lenguaje extenso (LLM) están avanzando rápidamente, lo que lleva a una adopción generalizada y al aumento de la interacción humano-IA. Reuters informó recientemente de una investigación que estimaba que ChatGPT de OpenAI ya alcanzó los 100 millones de usuarios mensuales en enero, ¡solo dos meses después de su lanzamiento! Esto plantea la importancia de la pregunta; ¿Cómo hablamos con modelos como ChatGPT y cómo les sacamos el máximo partido? Esto es ingeniería rápida. Si bien esperamos que el significado y los métodos evolucionen, creemos que podría convertirse en una habilidad clave e incluso podría convertirse en un título de trabajo independiente común a medida que la IA, el aprendizaje automático y los LLM se integren cada vez más en las tareas cotidianas.

Este artículo explorará qué es la ingeniería rápida, su importancia y sus desafíos, y brindará una revisión detallada del curso de guía de aprendizaje diseñado para la aplicación práctica de la guía para estudiantes de todos los niveles (¡se espera un conocimiento mínimo del aprendizaje automático!).

Learn Prompting es un curso interactivo de código abierto dirigido por @SanderSchulhoff y contribuido por Towards AI y toneladas de generosos contribuyentes. Towards AI también se está asociando con Learn Prompting para lanzar la competencia HackAPrompt, la primera competencia de piratería rápida. Los participantes no necesitan conocimientos técnicos y serán desafiados a piratear varias indicaciones cada vez más seguras. Estén atentos en nuestra comunidad Learn AI Discord o en el Comunidad Discord de Learn Prompting para detalles completos e información sobre premios y fechas!

¿Qué es incitar?

Los modelos generativos de IA interactúan principalmente con el usuario a través de la entrada de texto. Los usuarios pueden instruir el modelo en la tarea proporcionando una descripción textual. Lo que los usuarios le piden al modelo que haga en un sentido amplio es un “inmediato”. “Incitación” es cómo los humanos pueden hablar con la inteligencia artificial (IA). Es una forma de decirle a un agente de IA lo que queremos y cómo lo queremos utilizando un lenguaje humano adaptado. Un ingeniero rápido traducirá su idea de su lenguaje conversacional habitual a instrucciones más claras y optimizadas para la IA.

La salida generada por los modelos de IA varía significativamente según el indicador diseñado. El propósito de la ingeniería de avisos es diseñar avisos que obtengan la respuesta más relevante y deseada de un modelo de lenguaje grande (LLM). Implica comprender las capacidades del modelo y crear indicaciones que las utilizarán de manera efectiva.

Por ejemplo, en el caso de modelos de generación de imágenes, como Difusión estable, el indicador es principalmente una descripción de la imagen que desea generar. Y la precisión de ese indicador afectará directamente la calidad de la imagen generada. Cuanto mejor sea el indicador, mejor será la salida.

¿Por qué es importante incitar?

Las indicaciones sirven como puente entre los humanos y la IA, lo que nos permite comunicarnos y generar resultados que alinearse con necesidades específicas. Para aprovechar al máximo las capacidades de la IA generativa, es esencial saber qué preguntar y cómo hacerlo. He aquí por qué es importante incitar:

Al proporcionar un aviso específico, es posible guiar el modelo para generar resultados que sean más relevantes y coherentes en el contexto.
Las indicaciones permiten a los usuarios interpretar el texto generado de una manera más significativa.
Las indicaciones son una técnica poderosa en la IA generativa que puede mejorar la calidad y la diversidad del texto generado.
Las indicaciones aumentan el control y la interpretabilidad, y reducen los sesgos potenciales.
Diferentes modelos responderán de manera diferente a la misma indicación, y comprender el modelo específico puede generar resultados precisos con la indicación correcta.
Los modelos generativos pueden alucinar conocimientos que no son fácticos o incorrectos. Las indicaciones pueden guiar al modelo en la dirección correcta al pedirle que cite las fuentes correctas.
Las indicaciones permiten la experimentación con diversos tipos de datos y diferentes formas de presentar esos datos al modelo de lenguaje.
Las indicaciones permiten determinar cómo deberían ser los resultados buenos y malos al incorporar la meta en la indicación.
Las indicaciones mejoran la seguridad del modelo y ayudan a defenderse contra la piratería inmediata (usuarios que envían indicaciones para producir comportamientos no deseados del modelo).

En el siguiente ejemplo, puede observar cómo las solicitudes afectan la salida y cómo los modelos generativos responden a diferentes solicitudes. Aquí, se instruyó al modelo DALLE para que creara un astronauta, un cohete y una computadora de estilo low-poly. Este fue el primer aviso para cada imagen:

Cohete blanco y azul de baja poli disparando a la luna frente a un prado verde escaso
Computadora blanca y azul de baja poli sentado en un prado verde disperso
Astronauta blanco y azul polivinílico bajo sentado en un prado verde escaso con montañas polivinílicas bajas en el fondo

Esta imagen fue generada por el aviso anterior:

Aunque los resultados son decentes, el estilo no era consistente. Aunque, después de optimizar las indicaciones para:

Un mundo polivinílico bajo, con un cohete blanco y azul que despega de un prado verde disperso con montañas polivinílicas bajas en el fondo. Altamente detallado, isométrico, 4K.
Un mundo de baja poli, con una piedra preciosa azul brillante flotando mágicamente en el medio de la pantalla sobre un prado verde y disperso con montañas de baja poli en el fondo. Altamente detallado, isométrico, 4K.
Un mundo de baja poli, con un astronauta con un traje blanco y visor azul, está sentado en un prado verde disperso con montañas de baja poli en el fondo. Altamente detallado, isométrico, 4K.

Esta imagen fue generada por el aviso anterior:

Estas imágenes tienen un estilo más consistente, y la conclusión principal es que las indicaciones son muy iterativas y requieren mucha investigación. Es importante modificar las expectativas y las ideas a medida que continúa experimentando con diferentes indicaciones y modelos.

Aquí hay otro ejemplo (en un modelo de texto, específicamente fue con ChatGPT) de cómo las indicaciones pueden optimizar los resultados y ayudarlo a generar resultados precisos.

Desafíos y preocupaciones de seguridad con las indicaciones

Si bien las indicaciones permiten la utilización eficiente de la IA generativa, su uso correcto para obtener resultados óptimos enfrenta varios desafíos y pone de relieve varios desafíos de seguridad.

Solicitar modelos de lenguaje grande puede presentar varios desafíos, como:

Logrando los resultados deseados en el primer intento.
Encontrar un punto de partida apropiado para un aviso.
Garantizar que la salida tenga sesgos mínimos.
Controlar el nivel de creatividad o novedad del resultado.
Comprender y evaluar el razonamiento detrás de las respuestas generadas.
Interpretación incorrecta del significado previsto del aviso.
Falta del equilibrio adecuado entre proporcionar suficiente información en el mensaje para guiar al modelo y dejar espacio para respuestas novedosas o creativas.

El auge de las indicaciones ha llevado al descubrimiento de vulnerabilidades de seguridad, como:

Inyección inmediata, donde un atacante puede manipular la indicación para generar una salida maliciosa o dañina.
Filtrar información confidencial a través de la salida generada.
Hacer jailbreak al modelo, donde un atacante podría obtener acceso no autorizado a los estados y parámetros internos del modelo.
Generar información falsa o engañosa.
La capacidad del modelo para perpetuar los sesgos sociales si no se entrena con datos diversos y mínimamente sesgados.
Genere texto realista y convincente que pueda usarse con fines maliciosos o engañosos.
El modelo puede generar respuestas que violen leyes o reglamentos.

Instrucciones de aprendizaje: detalles del curso

A medida que avanza la tecnología, la capacidad de comunicarse de manera efectiva con los sistemas de inteligencia artificial (IA) se ha vuelto cada vez más importante. Es posible automatizar una amplia gama de tareas que actualmente consumen grandes cantidades de tiempo y esfuerzo con IA. AI puede completar o proporcionar un punto de partida sólido para todas las tareas, desde escribir correos electrónicos e informes hasta codificar. Este recurso está diseñado para proporcionar a los estudiantes no técnicos y a los ingenieros avanzados las habilidades prácticas necesarias para comunicarse de manera efectiva con los sistemas de IA generativa.

Sobre el curso

Learn Prompting es un curso interactivo de código abierto con técnicas y conceptos de ingeniería aplicados. Está diseñado tanto para principiantes como para profesionales experimentados que buscan expandir sus habilidades y adaptarse a las tecnologías emergentes de IA. El curso se actualiza con frecuencia para incluir nuevas técnicas, lo que garantiza que los alumnos se mantengan actualizados con los últimos avances en el campo.

Además de aplicaciones y ejemplos del mundo real, el curso proporciona demostraciones interactivas para ayudar al aprendizaje práctico. Una de las características únicas de Learn Prompting es su estructura no lineal, que permite a los alumnos profundizar en los temas que más les interesan. Estos artículos están clasificados por dificultad y etiquetados para facilitar el aprendizaje, lo que facilita encontrar el nivel correcto de contenido. La progresión gradual del material también lo hace accesible para aquellos con poca o ninguna formación técnica, lo que les permite comprender incluso conceptos avanzados de ingeniería rápida.

Learn Prompting es el curso perfecto para cualquiera que busque obtener técnicas prácticas y de aplicación inmediata para sus propios proyectos.

Aspectos destacados del curso

El curso Learn Prompting ofrece una experiencia de aprendizaje única que se centra en técnicas prácticas que los alumnos pueden aplicar de inmediato. El curso incluye:

Artículos en profundidad sobre conceptos básicos e ingeniería de prontitud aplicada (PE)
Capítulos de aprendizaje especializado para técnicas avanzadas de educación física
Una descripción general de las indicaciones aplicadas utilizando modelos generativos de IA
Un curso inclusivo y de código abierto para estudiantes no técnicos y avanzados
Un modelo de aprendizaje a su propio ritmo con demostraciones interactivas de educación física aplicada
Un modelo de aprendizaje no lineal diseñado para hacer que el aprendizaje sea relevante, conciso y agradable
Artículos clasificados por nivel de dificultad para facilitar el aprendizaje
Ejemplos del mundo real y recursos adicionales para el aprendizaje continuo

Incitación al aprendizaje: Resumen del capítulo

Aquí hay un breve resumen de cada capítulo:

1.Conceptos básicos
Es una lección introductoria para estudiantes que no están familiarizados con el aprendizaje automático (ML). Cubre conceptos básicos como inteligencia artificial (IA), indicaciones, terminologías clave, instrucciones de IA y tipos de indicaciones.

2. Intermedio
Este capítulo se centra en los diversos métodos de ayuda. Entra en más detalles sobre indicaciones con diferentes formatos y niveles de complejidad, como la cadena de pensamiento, la indicación de cadena de pensamiento Zero-Shot y el enfoque de conocimiento generado.

3. Incitación aplicada
Este capítulo cubre el proceso de ingeniería de solicitud de un extremo a otro con demostraciones interactivas, ejemplos prácticos utilizando herramientas como ChatGPT y resolviendo preguntas de discusión con IA generativa. Este capítulo permite a los alumnos experimentar con estas herramientas, probar diferentes enfoques de indicaciones, comparar los resultados generados e identificar patrones.

4. Aplicaciones Avanzadas
Esta lección cubre algunas aplicaciones avanzadas de indicaciones que pueden abordar tareas de razonamiento complejas mediante la búsqueda de información en Internet u otras fuentes externas.

5. Confiabilidad
Este capítulo cubre técnicas para hacer que las terminaciones sean más confiables e implementar verificaciones para garantizar que los resultados sean precisos. Explica métodos sencillos para eliminar el sesgo de las indicaciones, como el uso de varias indicaciones, la autoevaluación de los modelos de lenguaje y la calibración de los modelos de lenguaje.

6. Indicación de imagen
Esta guía explora los conceptos básicos de las técnicas de indicación de imágenes y proporciona recursos externos adicionales para un mayor aprendizaje. Profundiza en los conceptos fundamentales de las indicaciones de imágenes, como los modificadores de estilo, los potenciadores de calidad y los métodos de indicación como la repetición.

7. Hackeo rápido
Este capítulo cubre conceptos como la inyección rápida y la fuga rápida y examina las posibles medidas para prevenir dichas fugas. Destaca la importancia de comprender estos conceptos para garantizar la seguridad y privacidad de los datos generados por los modelos de lenguaje.

8. Solicitar IDE
Este capítulo proporciona una lista completa de varias herramientas de ingeniería rápida, como GPT-3 Playground, Dyno, Dream Studio, etc. Profundiza en las características y funciones de cada herramienta, brindando a los alumnos una comprensión de las capacidades y limitaciones de cada una.

9. Recursos
El curso ofrece recursos educativos integrales para un aprendizaje posterior, incluidos enlaces a artículos, blogs, ejemplos prácticos y tareas de ingeniería rápida, expertos relevantes a los que seguir y una plataforma para contribuir al curso y hacer preguntas.

Cómo navegar

El curso Learn Prompting ofrece un modelo de aprendizaje no lineal para que el aprendizaje sea práctico, relevante y divertido. Puede leer los capítulos en cualquier orden y profundizar en los temas que más le interesen.

Si eres un novato completo, comienza con la sección de Conceptos básicos. Puede comenzar con la sección Intermedia si tiene experiencia en ML.

Los artículos están clasificados por nivel de dificultad y están etiquetados:

? Muy fácil: no requiere programación

? Fácil: se requiere programación simple, pero no se necesita experiencia en el dominio

? Medio: se requiere programación y se necesita algo de experiencia en el dominio para implementar las técnicas discutidas (como calcular la probabilidad logarítmica)

? Difícil: se requiere programación y se necesita una sólida experiencia en el dominio para implementar las técnicas discutidas (como los enfoques de aprendizaje por refuerzo)

Tenga en cuenta: aunque la experiencia en el dominio es útil para artículos medios y difíciles, aún podrá comprenderla.

El futuro del curso.

Planeamos mantener este curso actualizado con Sander y todos los colaboradores (¿quizás usted?). Más específicamente, queremos seguir agregando secciones relevantes para nuevas técnicas de solicitud, pero también para nuevos modelos, como ChatGPT, DALLE, etc., compartiendo los mejores consejos y prácticas para usar esos nuevos y poderosos modelos. Aún así, todo esto no sería posible sin SU ayuda…

Aportando al curso

La idea de aprender se nutre del crecimiento mutuo como comunidad. Damos la bienvenida a las contribuciones y alentamos a las personas a compartir sus conocimientos a través de esta plataforma.

Contribuya al curso aquí.

Junto con las contribuciones, sus comentarios también son vitales para el éxito de este curso. Si tiene preguntas o sugerencias, comuníquese con las sugerencias de aprendizaje. Puede crear un problema aquí, enviar un correo electrónico o conectarse con nosotros en nuestro servidor de la comunidad Discord.

Encuentra el curso completo aquí.

Competición HackAPrompt: un paso hacia una mayor seguridad de los avisos

Los avances recientes en los modelos de lenguaje extenso (LLM) han permitido una fácil interacción con la IA a través de indicaciones. Sin embargo, esto también ha llevado a la aparición de vulnerabilidades de seguridad, como la piratería rápida, la inyección rápida, las filtraciones y el jailbreak.

La creatividad humana generalmente superó los esfuerzos para mitigar la piratería rápida. Para abordar este problema, estamos ayudando a Learn Prompting a organizar la primera competencia de piratería rápida. Los participantes serán desafiados a piratear varias indicaciones progresivamente seguras. La ingeniería rápida es una actividad no técnica, lo que significa que personas diversas pueden practicarla, desde profesores de inglés hasta científicos de IA. Esta competencia tiene como objetivo motivar a los usuarios a intentar piratear un conjunto de indicaciones para recopilar un conjunto de datos completo y de código abierto para la investigación de seguridad. Esperamos recopilar diversos conjuntos de ataques humanos creativos que se pueden usar en la investigación de seguridad de IA.

Estén atentos en nuestra comunidad Learn AI Discord o en el Comunidad Discord de Learn Prompting para detalles completos e información sobre premios y fechas!

Conclusión

La ingeniería rápida se está convirtiendo en una habilidad cada vez más importante para las personas en todos los campos. El curso Learn Prompting enfatiza la practicidad y la aplicación inmediata. Uno de los aspectos emocionantes de este curso es que estamos aprendiendo sobre él colectivamente, y solo podemos comprender completamente las técnicas a través de la exploración.

A medida que continuamos experimentando con la IA generativa, debemos priorizar la seguridad para garantizar que todos puedan acceder a los beneficios de la IA. La competencia HackAPrompt es un paso hacia la mejora de la seguridad rápida, ya que tiene como objetivo crear un gran conjunto de datos de código abierto de entradas contradictorias para la investigación de seguridad de IA.

Para mantenerse informado sobre los últimos desarrollos en IA, considere suscribirse al boletín Hacia la IA y unirse a nuestra comunidad Learn AI Discord o Comunidad Discord de Learn Prompting.

Learn Prompting 101: Prompt Engineering Course & Challenges se publicó originalmente en Hacia la IA en Medium, donde las personas continúan la conversación destacando y respondiendo a esta historia.

Tabla de Contenido

Curso de ingeniería rápida y desafíos: hacia la IA