Blog's Conozca GLIGEN: un enfoque de IA que amplía la funcionalidad de los modelos de difusión de texto a imagen preentrenados existentes al habilitar el acondicionamiento en las entradas de conexión a tierra 6 min read
Blog's Investigadores de Stanford presentan ControlNet: una estructura de red neuronal para controlar modelos de gran difusión preentrenados para admitir condiciones de entrada adicionales 4 min read
Blog's Los tres cambios clave que impulsan el éxito de los LLM de modelos básicos preentrenados y modelos de lenguaje extenso 4 min read
Blog's Una nueva investigación de IA explica cómo el aprendizaje de instrucciones en contexto (ICIL) mejora el rendimiento de la generalización de tareas de disparo cero tanto para los modelos preentrenados como para los modelos ajustados con instrucción 4 min read
Blog's Una difusión para gobernar la difusión: modulación de modelos de difusión preentrenados para la síntesis de imágenes multimodales 4 min read
Blog's Investigadores de UC Berkeley y Deepmind proponen SuccessVQA: una reformulación de la detección de éxito que es compatible con VLM preentrenados como Flamingo 5 min read
Blog's Los investigadores de CMU presentan Unlimiformer: un método de IA para aumentar los codificadores-decodificadores preentrenados con un almacén de datos externo para permitir una entrada de longitud ilimitada 4 min read
Blog's Investigadores de UC Berkeley presentan Video Prediction Rewards (VIPER): un algoritmo que aprovecha los modelos de predicción de video preentrenados como señales de recompensa sin acción para el aprendizaje por refuerzo 3 min read
Blog's Recuperación de direcciones de correo electrónico del mundo real a partir de modelos de lenguaje natural preentrenados 9 min read
Ganar Dinero Online ¿Qué tarea de PNL NO se beneficia de los modelos de lenguaje preentrenados? – Hacia la IA 6 min read