Estás leyendo la publicación: Una nueva investigación de IA presenta un nuevo marco de solicitud mejorado para la generación de texto
El campo de la creación del lenguaje natural se transforma por completo con los modelos de lenguaje grande (LLM). Los enfoques tradicionales de ajuste fino para responder a las tareas posteriores requieren acceso a los parámetros de los LLM, lo que limita su uso en potentes LLM de caja negra (como ChatGPT) que solo brindan API. Debido a esto, la investigación reciente se ha centrado en gran medida en las técnicas de impulso que dirigen la generación de resultados al ofrecer muchas instrucciones y demostraciones específicas de la tarea, lo que demuestra que el impulso puede influir considerablemente en los resultados resultantes y, por lo tanto, requiere un diseño cuidadoso.
Aunque la incitación es, en principio, un método flexible, la forma en que normalmente se usa hoy en día es algo estricta. Pero este no es el caso con el aprendizaje de idiomas; una persona puede mejorar sus habilidades lingüísticas al recibir y responder comentarios positivos y negativos.
Un nuevo estudio de la Universidad del Noreste de China, Microsoft Research Asia, Microsoft Azure Translation y NiuTrans Research invita a los LLM a reconsiderar y aprender a detectar cualquier falla en su producción para determinar si evoluciona la capacidad de deliberación y cómo. Para facilitar la identificación de errores antes de la generación, diseñaron una nueva plantilla de aviso llamada Deliberate then Generate (DTG) que incluye instrucciones y posibles resultados.
Determinar el candidato es una parte importante del diseño del DTG. El uso de datos de un segundo sistema de línea de base es una opción simple porque su salida suele ser de buena calidad y solo necesita pequeños ajustes para usarse de manera efectiva. Por lo tanto, es incapaz de promover una deliberación efectiva. Los investigadores sugieren usar texto no relacionado con el material de origen, como una selección de texto aleatoria o incluso una cadena nula. DTG se puede adaptar fácilmente a varios trabajos de producción de texto con solo modificaciones menores en las indicaciones, ya que este método activa con éxito la capacidad de deliberación de los LLM sin recurrir a otros sistemas de generación de texto para proporcionar ejemplos de corrección. Desde un punto de vista psicológico, este trabajo se inspira en el caso canónico de la adquisición del lenguaje, que considera la evidencia negativa en el desarrollo de la competencia lingüística.
El equipo llevó a cabo extensos experimentos para demostrar que las indicaciones DTG propuestas mejoran de manera confiable el rendimiento del modelo en relación con las indicaciones tradicionales en GPT3.5 (text-DaVinci-003) y GPT4. Esto es cierto en siete tareas de generación de texto y más de 20 conjuntos de datos. La traducción automática, la simplificación y la creación con sentido común son solo algunas de las tareas de generación de texto en las que GPT impulsado por DTG logra un rendimiento de vanguardia con numerosos conjuntos de datos. La indicación de DTG sugerida permite la capacidad deliberada y la evitación de errores antes de la generación, como lo demuestran los extensos estudios de ablación y el análisis estadístico de errores.
Los investigadores planean aprovechar el conocimiento del dominio específico de la tarea en el trabajo futuro para mejorar aún más la eficacia de las indicaciones de DTG.