Stability AI lanza StableLM: alternativas de código abierto de ChatGPT

Estás leyendo la publicación: Stability AI lanza StableLM: alternativas de código abierto de ChatGPT

Estabilidad IA, el creador del renombrado software de generación de imágenes Stable Diffusion, ha presentado una colección de herramientas de modelo de lenguaje de código abierto, que contribuye a la expansión de la industria del modelo de lenguaje grande (LLM). Esta nueva incorporación ofrece una alternativa viable a ChatGPT de OpenAI, que puede beneficiar a una industria que se está preocupando por OpenAI y su principal inversor, Microsoft, se está volviendo demasiado monopolista.

Las versiones alfa de la suite StableLM, que presenta modelos con 3 mil millones y 7 mil millones de parámetros, ahora están disponibles para el público. Actualmente se están desarrollando modelos con 15 mil millones, 30 mil millones y 65 mil millones de parámetros, mientras que se planea un modelo de 175 mil millones de parámetros para el futuro.

Comparativamente, GPT-4 de OpenAI cuenta con un estimado de 1 billón de parámetros, que es seis veces más que GPT-3. A pesar de esto, Stability AI enfatizó que el recuento de parámetros podría no ser una medida precisa de la efectividad de LLM.

“StableLM está entrenado en un nuevo conjunto de datos experimentales basado en The Pile, pero tres veces más grande, que contiene 1,5 billones de tokens de contenido. La riqueza de este conjunto de datos permite que StableLM muestre un rendimiento sorprendentemente alto en tareas de conversación y codificación, incluso con sus 3 a 7 mil millones de parámetros más pequeños”.

Queda por ver la solidez de los modelos StableLM. El equipo de Stability AI se comprometió a divulgar más información sobre las capacidades de los LLM en su página de GitHub, incluidas definiciones de modelos y parámetros de entrenamiento. La mayoría de los expertos de la industria dan la bienvenida a la aparición de una poderosa alternativa de código abierto a ChatGPT de OpenAI.

🔥 Recomendado:  ¿Cómo iniciar un blog de estilo de vida y ganar dinero con los blogs de estilo de vida en 2023? Una guía para principiantes

El acceso a herramientas de terceros sofisticado y avanzado, como BabyAGI y AutoGPT, como se informó recientemente, está integrando la recursividad en las aplicaciones de IA, lo que significa que pueden crear y modificar sus propias indicaciones para instancias recursivas en función de la información recién adquirida.

La incorporación de modelos de código abierto en la combinación podría beneficiar a los usuarios de la industria que prefieren o no pueden pagar las tarifas de acceso de OpenAI. Las personas interesadas pueden probar una interfaz en vivo para el Modelo StableLM de 7 mil millones de parámetros alojado en HuggingFace.

Queda por ver qué compañía da el siguiente paso para ofrecer modelos LLM similares.