Inteligência artificial
Lançamento da Stability AI do StableLM: Alternativas de Código Aberto ao ChatGPT

Stability AI, a criadora do renomado software de geração de imagens Stable Diffusion, lançou uma coleção de ferramentas de modelo de linguagem de código aberto, contribuindo para a expansão da indústria de grandes modelos de linguagem (LLM). Essa nova adição oferece uma alternativa viável ao ChatGPT da OpenAI, o que pode beneficiar uma indústria que está ficando ansiosa com a OpenAI e seu principal investidor, a Microsoft, se tornando muito monopolística.
As versões alpha da suíte StableLM, com modelos de 3 bilhões e 7 bilhões de parâmetros, agora estão acessíveis ao público. Modelos com 15 bilhões, 30 bilhões e 65 bilhões de parâmetros estão sendo desenvolvidos, enquanto um modelo de 175 bilhões de parâmetros está planejado para o futuro.
Comparativamente, o GPT-4 da OpenAI tem um estimado de 1 trilhão de parâmetros, o que é seis vezes mais do que o GPT-3. Apesar disso, a Stability AI enfatizou que a contagem de parâmetros pode não ser uma medida precisa da eficácia do LLM.
“O StableLM é treinado em um conjunto de dados experimentais novos baseados no The Pile, mas três vezes maior, contendo 1,5 trilhão de tokens de conteúdo. A riqueza desse conjunto de dados permite que o StableLM exiba um desempenho surpreendentemente alto em tarefas de conversação e codificação, mesmo com seus parâmetros menores de 3 a 7 bilhões.”
A robustez dos modelos StableLM ainda precisa ser vista. A equipe da Stability AI se comprometeu a divulgar mais informações sobre as capacidades dos LLMs em sua página do GitHub, incluindo definições de modelo e parâmetros de treinamento. O surgimento de uma poderosa alternativa de código aberto ao ChatGPT da OpenAI é bem-vinda pela maioria dos insiders da indústria.
Acesso a ferramentas de terceiros sofisticadas e avançadas, como o BabyAGI e o AutoGPT, como recentemente relatado, estão integrando recursão em aplicações de IA, o que significa que eles podem criar e modificar seus próprios prompts para instâncias recursivas com base em informações recém-adquiridas.
Incorporar modelos de código aberto na mistura pode beneficiar os usuários da indústria que preferem ou não podem pagar as taxas de acesso da OpenAI. Indivíduos interessados podem testar uma interface ao vivo para o modelo StableLM de 7 bilhões de parâmetros hospedado pelo HuggingFace.
Permanece para ser visto qual empresa dará o próximo passo para oferecer modelos LLM semelhantes.












