Estás leyendo la publicación: El ascenso y ascenso de los agentes de IA
La ola de agentes de IA que comenzó con AutoGPT y AgentGPT ahora se ha convertido en una de las facetas más interesantes de la innovación moderna de IA. Estos llamados agentes usan LLM para completar tareas de forma autónoma, y muchos los llaman los precursores de AGI.
Además, con la introducción de llamadas a funciones en las API de OpenAI, la implementación de modelos con comportamiento agente ahora es más fácil que nunca. Reunir el poder de GPT-4 con programas de automatización escritos a medida ha creado una cosecha completamente nueva de agentes de IA, incluidos algunos que podrían cambiar la forma en que interactuamos con la web.
Con el desarrollo reciente en el ecosistema que rodea a los agentes de IA, como la actualización de llamadas de función, así como las mejoras en LangChain, estos agentes se están volviendo cada vez más poderosos. Ahora, los nuevos agentes pueden ir más allá de la creación de estrategias rápidas: pueden generar bases de código completas y escribir novelas de varios capítulos en cuestión de minutos. Con el aumento de la infraestructura y las tuberías que lo acompañan, estamos viendo una nueva cosecha de agentes de IA superpoderosos.
Construyendo sobre un legado
En pocas palabras, los agentes de IA utilizan las capacidades de procesamiento del lenguaje natural de los LLM para realizar una tarea determinada de forma autónoma. Al ver el potencial de los agentes de IA, los líderes del mercado como OpenAI y Hugging Face comenzaron lentamente a construir el ecosistema a su alrededor. Por ejemplo, LangChain, que permitió una forma temprana de comportamiento agente al conectar LLM con datos externos, ahora ha desarrollado sus características de llamada de funciones.
Con esta actualización, LangChain no solo ha agregado soporte para las llamadas a funciones de OpenAI, sino también la capacidad de convertir las herramientas de LangChain en funciones. Esto permite una amplia variedad de casos de uso, abriendo la posibilidad de combinar LLM con aún más programas.
Uno de los nuevos agentes de IA más notables es GPT Engineer, una colección de sistemas de IA que pueden construir un sistema completo desde cero. De acuerdo con su página de GitHub, puede generar un código base completo basado en un aviso y algunas aclaraciones. Además, el agente incluso recordará la retroalimentación proporcionada por el humano a lo largo del tiempo. El repositorio tiene alrededor de 24.4k estrellas en el momento de escribir este artículo.
De manera similar, el programador Matt Shumer creó un agente llamado GPT-Author. Esta colección de modelos de IA puede escribir un libro completo en solo minutos e incluso generar una portada adecuada y publicarla en Kindle. Si bien esto ya ha generado preocupaciones, el producto ha sido de código abierto, lo que permite conectarlo a más sistemas si es necesario. Shumer declaró: “GPT-author es un agente restringido, lo que significa que su comportamiento está altamente controlado, lo que genera mejores resultados que los agentes abiertos”.
Esta podría ser la clave para crear agentes de IA que realmente cumplan un objetivo de manera más rápida y eficiente que un ser humano. Los agentes de IA a menudo son criticados por ser inherentemente iterativos. Esto significa que no pueden crear algo creativamente nuevo como lo hacen los humanos. Sin embargo, los agentes de IA restringidos parecen ser capaces de alcanzar niveles similares a los humanos mientras reducen los errores y se mantienen en el tema.
El pasado y el futuro de los agentes de IA
Mustafa Suleyman, cofundador de DeepMind, ha declarado en entrevistas que las IA de mente estrecha son más adecuadas para casos de uso limitados. Hablando sobre el nuevo producto de IA de su compañía, Pi, afirmó: “Dado que no hacemos cosas como la generación de código… poemas, cartas legales y hojas de canciones, básicamente podemos liberar mucho del modelo de lenguaje para enfocarnos solo en lo general. conocimientos, trivialidades y un estilo conversacional”.
Podría decirse que la tendencia de los agentes de IA comenzó con AutoGPT, lanzado en marzo de este año. El repositorio de GitHub obtuvo rápidamente más de 100 000 estrellas y recibió excelentes críticas de personas como Andrej Karpathy.
Aclamados como la “próxima frontera en ingeniería rápida”, los agentes de IA comenzaron a ganar popularidad. Los desarrolladores usaron AutoGPT para automatizar el raspado de datos, para escribir y autodepurar código, e incluso encontrar formas de apresurarse en Internet para ganar algo de dinero extra. El éxito de AutoGPT resultó en un montón de otros agentes de IA, como AgentGPT, AutoGPT, Do Anything Machine y más.
Una mirada al feed de Twitter de LangChain muestra cuánta funcionalidad ha agregado esta actualización. Los desarrolladores han creado bots que pueden extraer datos de repositorios de GitHub para responder preguntas, un servicio para crear sitios web desde cero e incluso una base de datos inteligente para agricultores.
Cuando se combinan con la API de OpenAI actualizada y más barata, los agentes de IA han creado un gran revuelo en la comunidad de desarrolladores. Ahora parece que los desarrolladores están más ansiosos por jugar con LLM, lo que resulta en el lanzamiento de algunos agentes interesantes. Este podría ser el camino hacia los agentes de IA que realmente podemos usar. De manera similar a la predicción de Tim Berners-Lee de que todos tendrán sus propios asistentes de IA en el futuro, una colección de agentes de IA restringidos podría convertirse en la forma en que interactuamos con la web.