Inteligencia artificial
Stability AI lanza StableLM: alternativas de ChatGPT de código abierto

Stability AI, el creador del renombrado software de generación de imágenes Stable Diffusion, ha presentado una colección de herramientas de modelo de lenguaje de código abierto, contribuyendo a la expansión de la industria de los grandes modelos de lenguaje (LLM). Esta nueva adición ofrece una alternativa viable a ChatGPT de OpenAI, lo que puede beneficiar a una industria que se está volviendo ansiosa por la creciente monopolización de OpenAI y su principal inversor, Microsoft.
Las versiones alpha de la suite StableLM, que cuentan con modelos de 3 mil millones y 7 mil millones de parámetros, ya están disponibles para el público. Se están desarrollando modelos con 15 mil millones, 30 mil millones y 65 mil millones de parámetros, mientras que se planea un modelo de 175 mil millones de parámetros para el futuro.
En comparación, GPT-4 de OpenAI cuenta con un estimado de 1 billón de parámetros, lo que es seis veces más que GPT-3. A pesar de esto, Stability AI enfatizó que la cantidad de parámetros puede no ser una medida precisa de la efectividad de los LLM.
“StableLM se entrena en un conjunto de datos experimentales novedosos basados en The Pile, pero tres veces más grande, que contiene 1,5 billones de tokens de contenido. La riqueza de este conjunto de datos permite que StableLM exhiba un rendimiento sorprendentemente alto en tareas de conversación y codificación, incluso con sus 3 a 7 mil millones de parámetros más pequeños.”
La robustez de los modelos StableLM aún está por verse. El equipo de Stability AI se ha comprometido a divulgar más información sobre las capacidades de los LLM en su página de GitHub, incluyendo definiciones de modelos y parámetros de entrenamiento. La aparición de una poderosa alternativa de código abierto a ChatGPT de OpenAI es bienvenida por la mayoría de los expertos de la industria.
El acceso a herramientas de terceros sofisticadas y avanzadas, como BabyAGI y AutoGPT, como se informó recientemente en un artículo, están integrando la recursividad en aplicaciones de inteligencia artificial, lo que significa que pueden crear y modificar sus propias solicitudes para instancias recursivas basadas en información recién adquirida.
Incorporar modelos de código abierto en la mezcla podría beneficiar a los usuarios de la industria que prefieran no pagar las tarifas de acceso de OpenAI. Los interesados pueden probar una interfaz en vivo para el modelo StableLM de 7 mil millones de parámetros alojado en HuggingFace.
Todavía está por verse qué empresa será la siguiente en ofrecer modelos LLM similares.












