Ganar Dinero Online Revisión de Google Bard (características, modelo LLM y cómo obtener acceso) 7 min read
Blog's En un último artículo de ML, los investigadores de OpenAI explican cómo los modelos de lenguaje a gran escala (LLM) entrenados en código abren un nuevo tipo significativo de inteligencia… 3 min read
Blog's Los investigadores de inteligencia artificial de Facebook abren la herramienta ‘LLM.int8()’ para realizar inferencias en modelos de lenguaje extenso (LLM) con hasta 175B de parámetros sin ninguna degradación del rendimiento 6 min read
Blog's Investigadores de Stanford han desarrollado un nuevo punto de referencia de inteligencia artificial (IA) para comprender los modelos de lenguaje grande (LLM) 3 min read
Blog's Investigadores de CMU presentan ReLM: un sistema de inteligencia artificial para validar y consultar LLM utilizando expresiones regulares estándar 5 min read
Blog's Conozca ‘Stack’, 3 TB de código fuente con licencia permisiva para LLM (modelos de lenguaje grande) 3 min read
Blog's Exploración de la capacidad de los modelos de lenguaje extenso (LLM) para razonar sobre cuestiones médicas: perspectivas de un estudio de inteligencia artificial (IA) en Dinamarca 4 min read
Blog's La investigación más reciente de inteligencia artificial (IA) sugiere que los LLM de impulso de pocos disparos pueden ser más similares al ajuste fino de lo que se cree 4 min read
Blog's Microsoft AI Research propone una solicitud extensible (X-Prompt) para solicitar un modelo de lenguaje grande (LLM) más allá del lenguaje natural (NL) 4 min read
Blog's Los investigadores de CMU presentan FROMAGe: un modelo de IA que arranca de manera eficiente los modelos de lenguaje grande (LLM) congelados para generar texto de formato libre intercalado con imágenes 4 min read
Blog's Automatización cognitiva y LLM en investigación económica: 25 casos de uso para LLM que aceleran la investigación en 6 dominios 6 min read
Blog's Principales modelos de lenguajes grandes (LLM) en 2023 de OpenAI, Google AI, Deepmind, Anthropic, Baidu, Huawei, Meta AI, AI21 Labs, LG AI Research y NVIDIA 8 min read
Blog's Una nueva investigación de IA presenta un enfoque centrado en la rapidez para analizar las capacidades de LLM de modelos de lenguaje grande 4 min read
Blog's Los tres cambios clave que impulsan el éxito de los LLM de modelos básicos preentrenados y modelos de lenguaje extenso 4 min read
Blog's Una nueva investigación de IA de Anthropic muestra que los enfoques de indicaciones simples pueden ayudar a los modelos de lenguaje extenso (LLM) entrenados con el aprendizaje reforzado a partir de la retroalimentación humana (RLHF)… 5 min read
Blog's Conozca RECITE: un nuevo paradigma para ayudar a los modelos de lenguaje extenso (LLM) a generar conocimiento fáctico más preciso sin recuperarlo de un corpus externo 5 min read
Blog's Esta investigación de inteligencia artificial (IA) muestra la viabilidad de permitir interacciones conversacionales con interfaces de usuario móviles utilizando modelos de lenguaje grandes LLM 4 min read
Blog's Investigadores de UC Berkeley proponen una técnica novedosa llamada Chain of Hindsight (CoH) que puede permitir que los LLM aprendan de cualquier forma de retroalimentación para mejorar… 4 min read
Blog's Investigadores de Microsoft y Columbia proponen LLM-AUGMENTER: un sistema de inteligencia artificial que aumenta un LLM de caja negra con un conjunto de módulos Plug-and-Play 4 min read
Blog's 5 razones por las que los modelos de lenguaje extenso (LLM) como ChatGPT utilizan el aprendizaje por refuerzo en lugar del aprendizaje supervisado para el ajuste fino 4 min read
Blog's A investigadores de Stanford y DeepMind se les ocurre la idea de utilizar LLM de modelos de lenguaje grande como una función de recompensa de proxy 4 min read
Blog's Microsoft propone MathPrompter: una técnica que mejora el rendimiento de los modelos de lenguaje extenso (LLM) en problemas de razonamiento matemático 4 min read
Blog's Conozca FlexGen: un motor de generación de alto rendimiento para ejecutar modelos de lenguaje grande (LLM) con memoria de GPU limitada 6 min read
Blog's Este documento de IA propone UPRISE: un enfoque liviano y versátil para mejorar el rendimiento de disparo cero de diferentes LLM de modelos de lenguaje grande en diversas tareas 3 min read
Blog's Conozca el uso automatizado de herramientas y razonamiento (ART): un marco que utiliza LLM de modelos de lenguaje grandes congelados para producir rápidamente etapas intermedias en programas de razonamiento 4 min read
Blog's Conozca xTuring: una herramienta de código abierto que le permite crear su propio modelo de lenguaje extenso (LLM) con solo tres líneas de código 3 min read
Blog's Este documento de IA explora el potencial de los modelos de lenguaje grande (LLM) para tareas de anotación de texto con un enfoque en ChatGPT 4 min read
Blog's ¿De quién son las opiniones que reflejan los LLM? Este artículo de AI de Stanford examina las opiniones reflejadas por los modelos de lenguaje LM a través de la lente de la opinión pública… 6 min read
Blog's 8 cosas potencialmente sorprendentes que debe saber sobre modelos de lenguaje grande LLM 10 min read
Blog's Conozca HuggingGPT: un marco que aprovecha los LLM para conectar varios modelos de IA en comunidades de aprendizaje automático (Hugging Face) para resolver tareas de IA 8 min read
Blog's Este documento de AI presenta AUTO-REFINADO: un marco para mejorar los resultados iniciales de los LLM a través de comentarios y refinamientos iterativos 4 min read
Blog's Conozca ChatArena: una biblioteca de Python diseñada para facilitar la comunicación y la colaboración entre múltiples modelos de lenguaje grande (LLM) 4 min read
Blog's ¡Otro modelo de lenguaje grande! Conozca a IGEL: una familia LLM alemana adaptada a las instrucciones 2 min read
Blog's Incitación recursiva de crítica y mejora (RCI): un enfoque para mejorar los modelos de lenguaje grande (LLM) en tareas informáticas y de razonamiento 4 min read
Blog's Conozca Auto-GPT: una aplicación experimental de código abierto que muestra el poder de LLM como GPT-4 para desarrollar y administrar de manera autónoma diferentes tipos de tareas 2 min read
Blog's Conozca LMQL: un lenguaje de programación de código abierto y una plataforma para la interacción con modelos de lenguaje extenso (LLM) 3 min read
Blog's ¿En qué se diferencia la naturaleza orientable de GPT-4 de los modelos de lenguaje extenso (LLM) anteriores? 3 min read
Blog's Investigadores de Google AI y UC Berkeley proponen un enfoque de IA que enseña a los LLM a depurar su programa predicho a través de demostraciones de pocos disparos 4 min read
Blog's Microsoft Research propone LLMA: un acelerador LLM para acelerar sin pérdidas la inferencia del modelo de lenguaje grande (LLM) con referencias 2 min read
Blog's Conozca WebLLM: un proyecto de IA que lleva el modelo de lenguaje grande y el chatbot basado en LLM a los navegadores web acelerados con WebGPU 4 min read
Blog's Conozca a Phoenix: un nuevo LLM multilingüe que logra un rendimiento competitivo entre los modelos de código abierto en inglés y chino 4 min read
Blog's Investigadores de Microsoft proponen LLM de código bajo: un nuevo patrón de interacción humano-LLM 3 min read
Blog's Esta investigación de IA propone un marco para modelar las interacciones de los usuarios con LLM utilizando las siete etapas de acción de Norman 5 min read
Blog's Este documento de AI presenta LLM+P: el primer marco que incorpora las fortalezas de los planificadores clásicos en los LLM 3 min read
Blog's Conozca Lamini AI: un motor LLM revolucionario que permite a los desarrolladores entrenar modelos de lenguaje de nivel ChatGPT con facilidad 4 min read
Blog's ¿Pueden los LLM ejecutarse de forma nativa en su iPhone? Conozca MLC-LLM: un marco abierto que lleva los modelos de lenguaje (LLM) directamente a una amplia clase de plataformas… 4 min read
Blog's Este documento de IA muestra una vía para crear grandes cantidades de datos de instrucción con diferentes niveles de complejidad utilizando LLM en lugar de humanos. 5 min read
Blog's Automatización de tareas de aprendizaje automático: cómo MLCopilot utiliza LLM para ayudar a los desarrolladores a optimizar los procesos de ML 3 min read
Blog's Primero sueñe, aprenda después: DECKARD es un enfoque de IA que utiliza LLM para capacitar agentes de aprendizaje por refuerzo (RL) 4 min read
Blog's LMSYS ORG presenta Chatbot Arena: una plataforma de referencia LLM de colaboración colectiva con batallas anónimas y aleatorias 3 min read
Blog's Microsoft AI Research presenta la optimización automática de avisos (APO): un marco simple y de propósito general para la optimización automática de los avisos de LLM 3 min read
Blog's ¿Puede LLM ya servir como una interfaz de base de datos? Conozca BIRD: un gran banco para texto a SQL basado en bases de datos a gran escala 4 min read
Blog's Investigadores de la Universidad de Pekín presentan FastServe: un sistema de servicio de inferencia distribuido para LLM de modelos de lenguaje grandes 7 min read
Blog's Investigadores de China proponen StructGPT para mejorar la capacidad de razonamiento de disparo cero de los LLM sobre datos estructurados 5 min read
Blog's Los investigadores de Stanford presentan FrugalGPT: un nuevo marco de IA para que las API LLM manejen consultas en lenguaje natural 4 min read
Blog's Investigadores de China proponen un enfoque de generación y edición que utiliza los resultados de ejecución del código generado de los LLM para mejorar la calidad del código en… 4 min read
Blog's Conozca a Argilla: una plataforma de curación de datos de código abierto para modelos de lenguaje grande (LLM) y MLOps para procesamiento de lenguaje natural 4 min read
Blog's ¿Qué pasaría si las alucinaciones LLM fueran una característica y no un error? Conozca dreamGPT: una solución basada en GPT de código abierto que utiliza alucinaciones de modelos de lenguaje grandes… 3 min read
Blog's Conozca BLOOMChat: un modelo de idioma grande (LLM) de chat multilingüe de código abierto con 176 000 millones de parámetros construido sobre el modelo BLOOM 4 min read
Blog's Los LLM superan el aprendizaje por refuerzo: conozca SPRING: un marco de referencia innovador para LLM diseñado para permitir la planificación y el razonamiento de la cadena de pensamiento en contexto 5 min read
Blog's LLM de Falcon de código abierto del Instituto de Innovación Tecnológica: un nuevo modelo de IA que utiliza solo el 75 por ciento de la computación de entrenamiento de GPT-3, el 40 por ciento de la de Chinchilla y… 3 min read
Blog's Uso del debate multiagente para mejorar el razonamiento y la precisión fáctica de los modelos de lenguaje extenso (LLM) 4 min read
Blog's Conozca LLMScore: una nueva canalización de coincidencia de seguimiento de instrucciones basada en LLM para evaluar la alineación entre indicaciones de texto e imágenes sintetizadas en la síntesis de texto a imagen 5 min read
Blog's Los investigadores de CMU proponen GILL: un método de inteligencia artificial para fusionar LLM con modelos de codificador y decodificador de imágenes 4 min read
Blog's Sabemos que los LLM pueden usar herramientas, pero ¿sabía que también pueden crear nuevas herramientas? Conozca a los LLM como fabricantes de herramientas (LATM): A… 4 min read
Blog's Los modelos de lenguaje no reconocen los intercambios de identificadores en Python: este documento de IA explora la capacidad de los LLM para predecir las continuaciones correctas de los fragmentos… 3 min read
Blog's Conozca LLaMaTab: una extensión de Chrome de código abierto que ejecuta un LLM completamente en el navegador 3 min read
Blog's ¿Cómo debemos maximizar la capacidad de planificación de los LLM mientras reducimos el costo de cómputo? Conozca a SwiftSage: un nuevo agente generativo para el razonamiento interactivo complejo… 4 min read
Blog's Esta investigación de IA se sumerge en las limitaciones y capacidades de los modelos de lenguaje grande (LLM) de transformadores, empírica y teóricamente, en tareas de composición 4 min read
Blog's Conozca a SelFee: un LLM iterativo de autorrevisión potenciado por la generación de auto-retroalimentación 3 min read
Blog's Conozca a CREATOR: un marco de IA novedoso que permite a los LLM crear sus propias herramientas a través de la documentación y la realización de código 5 min read
Blog's ¿Pueden las matemáticas (muy) simples informar RLHF para LLM de modelos de lenguaje grande? ¡Este documento de AI dice que sí! 4 min read
Ganar Dinero Online Implementación de un modelo de lenguaje grande Langchain (LLM) con Streamlit y… – Hacia la IA 7 min read
Ganar Dinero Online Cómo evaluar la calidad de los chatbots basados en LLM: hacia la IA 14 min read
Actualidad Todas las grandes empresas tecnológicas que desarrollan LLM deben priorizar la seguridad del modelo 4 min read
Actualidad CoreWeave recauda $ 221 millones para escalar su infraestructura en la nube para IA generativa y LLM 3 min read
Actualidad MLCopilot: aproveche el poder de los LLM para ayudar a los desarrolladores en sus tareas de ML 3 min read
Actualidad Investigadores de Carnegie Mellon presentan MLC LLM para ejecutar modelos de lenguaje en cualquier dispositivo 3 min read
Actualidad Programas LLM: el nuevo camino para ajustar modelos neuronales en situaciones complejas 6 min read