Estás leyendo la publicación: Investigadores de Microsoft presentan TaskMatrix.AI: un nuevo ecosistema de IA que conecta modelos básicos con millones de API para completar tareas
Una característica definitoria que diferencia a los humanos de otros animales es nuestra capacidad para comunicarnos a través del lenguaje y usar herramientas para realizar tareas complejas. Si bien los avances recientes en IA han arrojado resultados impresionantes, incluida la creación de modelos básicos que pueden generar resultados de texto similares a los humanos, todavía hay desafíos que superar antes de lograr la inteligencia artificial general (AGI). Por ejemplo, si bien estos modelos sobresalen en el procesamiento de grandes cantidades de datos sin etiquetar, pueden tener problemas con tareas específicas del dominio, como los cálculos matemáticos. Esto ha llevado a algunos a sugerir que puede ser necesario un mayor desarrollo de herramientas especializadas para ayudar a estos modelos a dar el siguiente paso.
Los investigadores de Microsoft han presentado TaskMatrix.AI, un nuevo enfoque para crear un sistema de IA más versátil y capaz. El concepto implica la integración de modelos básicos con millones de modelos existentes y API de sistemas, lo que da como resultado una “super-IA” que puede realizar diversas tareas digitales y físicas. Si bien los modelos y sistemas de IA están diseñados actualmente para abordar dominios específicos de manera efectiva, la diversidad en sus implementaciones y mecanismos de trabajo puede dificultar el acceso a los modelos básicos. Este nuevo ecosistema tiene como objetivo superar estos obstáculos proporcionando un marco unificado para conectar estos modelos y sistemas de IA.
El equipo de investigación de Microsoft describe los beneficios de TaskMatrix.AI, incluida la capacidad de realizar tareas digitales y físicas. Para lograr esto, el modelo de base actúa como un sistema central que puede comprender varias entradas (texto, imagen, video, audio y código) y generar código para llamar a las API para completar tareas. Además, la plataforma tiene un repositorio de API integral con documentación consistente, lo que facilita a los desarrolladores agregar nuevas API. TaskMatrix.AI también puede seguir aprendiendo y ampliando sus capacidades agregando nuevas API con funciones específicas a su plataforma de API. Finalmente, el sistema está diseñado para proporcionar una mejor interpretabilidad de sus respuestas al hacer que tanto la lógica de resolución de tareas como los resultados de las API sean fáciles de entender.
TaskMatrix.AI se basa en cuatro componentes principales, que trabajan juntos para permitir que el sistema comprenda los objetivos del usuario y ejecute códigos ejecutables basados en API para tareas específicas. El Modelo básico conversacional multimodal (MCFM) sirve como interfaz principal para la comunicación del usuario y puede comprender el contexto multimodal. La plataforma de API proporciona un esquema de documentación de API unificado y un lugar para almacenar millones de API. Un selector de API utiliza la comprensión de MCFM de los objetivos del usuario para recomendar API relacionadas. Por último, el API Executor ejecuta los códigos de acción generados por las API relevantes y devuelve los resultados. Además, el equipo ha utilizado técnicas de aprendizaje reforzado con retroalimentación humana (RLHF) para entrenar un modelo de recompensa que puede optimizar TaskMatrix.AI utilizando información obtenida de la interacción humana. Este enfoque puede ayudar a MCFM y API Selector a encontrar políticas óptimas y mejorar el rendimiento de tareas complejas.
El equipo realizó un estudio empírico para probar la capacidad de TaskMatrix.AI para generar diapositivas de PowerPoint para diferentes empresas que utilizan ChatGPT como MCFM. El sistema generó varias diapositivas para cada empresa dividiendo la tarea en 25 llamadas API. El estudio demostró la comprensión de TaskMatrix.AI de las instrucciones del usuario y el contenido de PowerPoint, lo que le permitió generar páginas basadas en una lista de empresas e insertar un logotipo adecuado según el título de cada página.
La investigación muestra que TaskMatrix.AI puede mejorar el rendimiento en varias tareas al conectar los modelos básicos con las API existentes. El equipo cree que TaskMatrix.AI, junto con el desarrollo continuo de modelos básicos, servicios en la nube, robótica e Internet de las cosas, tiene el potencial de crear un mundo futuro con mayor productividad y creatividad.