Inteligência artificial

Repensando as leis de escala no desenvolvimento de IA

Publicado 17 de novembro de 2024

Alex McFarland

À medida que os desenvolvedores e pesquisadores expandem os limites do desempenho do LLM, surgem questões sobre eficiência é grande. Até recentemente, o foco estava em aumentar o tamanho dos modelos e o volume de dados de treinamento, com pouca atenção dada à precisão numérica — o número de bits usados para representar números durante os cálculos.

A estudo recente de pesquisadores de Harvard, Stanford e outras instituições derrubou essa perspectiva tradicional. Suas descobertas sugerem que a precisão desempenha um papel muito mais significativo na otimização do desempenho do modelo do que se reconhecia anteriormente. Essa revelação tem implicações profundas para o futuro da IA, introduzindo uma nova dimensão às leis de escala que orientam o desenvolvimento do modelo.

Precisão no Foco

Precisão numérica em IA se refere ao nível de detalhe usado para representar números durante cálculos, normalmente medido em bits. Por exemplo, uma precisão de 16 bits representa números com mais granularidade do que a precisão de 8 bits, mas requer mais poder computacional. Embora isso possa parecer uma nuance técnica, a precisão afeta diretamente a eficiência e o desempenho dos modelos de IA.

O estudo, intitulado Leis de escala para precisão, aprofunda-se na relação frequentemente negligenciada entre precisão e desempenho do modelo. Conduzindo uma série extensa de mais de 465 execuções de treinamento, os pesquisadores testaram modelos com precisões variadas, variando de 3 bits a 16 bits. Os modelos, que continham até 1.7 bilhão de parâmetros, foram treinados em até 26 bilhões de tokens.

Os resultados revelaram uma tendência clara: a precisão não é apenas uma variável de fundo; ela molda fundamentalmente a eficácia do desempenho dos modelos. Notavelmente, modelos supertreinados — aqueles treinados com muito mais dados do que a proporção ideal para seu tamanho — foram especialmente sensíveis à degradação do desempenho quando submetidos a quantização, um processo que reduz a precisão pós-treinamento. Essa sensibilidade destacou o equilíbrio crítico necessário ao projetar modelos para aplicações do mundo real.

As Leis de Escala Emergentes

Uma das principais contribuições do estudo é a introdução de novas leis de escala que incorporam a precisão a variáveis tradicionais, como contagem de parâmetros e dados de treinamento. Essas leis fornecem um roteiro para determinar a maneira mais eficiente de alocar recursos computacionais durante o treinamento do modelo.

Os pesquisadores identificaram que uma faixa de precisão de 7–8 bits é geralmente ótima para modelos de larga escala. Isso estabelece um equilíbrio entre eficiência computacional e desempenho, desafiando a prática comum de padronizar para precisão de 16 bits, o que frequentemente desperdiça recursos. Por outro lado, usar poucos bits — como precisão de 4 bits — requer aumentos desproporcionais no tamanho do modelo para manter desempenho comparável.

O estudo também enfatiza estratégias dependentes de contexto. Enquanto 7–8 bits são adequados para modelos grandes e flexíveis, modelos de tamanho fixo, como LLaMA 3.1, se beneficiam de níveis de precisão mais altos, especialmente quando sua capacidade é esticada para acomodar conjuntos de dados extensos. Essas descobertas são um passo significativo à frente, oferecendo uma compreensão mais matizada das compensações envolvidas no dimensionamento de precisão.

Desafios e implicações práticas

Embora o estudo apresente evidências convincentes da importância da precisão no escalonamento da IA, sua aplicação enfrenta obstáculos práticos. Uma limitação crítica é a compatibilidade de hardware. A economia potencial com o treinamento de baixa precisão depende da capacidade do hardware de suportá-lo. GPUs e TPUs modernas são otimizadas para precisão de 16 bits, com suporte limitado para a faixa de 7 a 8 bits, mais eficiente em termos de computação. Até que o hardware se atualize, os benefícios dessas descobertas podem permanecer fora do alcance de muitos desenvolvedores.

Outro desafio está nos riscos associados ao excesso de treinamento e quantização. Como o estudo revela, modelos com excesso de treinamento são particularmente vulneráveis à degradação do desempenho quando quantizados. Isso introduz um dilema para os pesquisadores: embora dados de treinamento extensivos sejam geralmente uma bênção, eles podem inadvertidamente exacerbar erros em modelos de baixa precisão. Alcançar o equilíbrio certo exigirá calibração cuidadosa do volume de dados, tamanho do parâmetro e precisão.

Apesar desses desafios, as descobertas oferecem uma oportunidade clara para refinar as práticas de desenvolvimento de IA. Ao incorporar a precisão como uma consideração central, os pesquisadores podem otimizar os orçamentos de computação e evitar o uso excessivo e dispendioso de recursos, abrindo caminho para sistemas de IA mais sustentáveis e eficientes.

O futuro da escala da IA

As descobertas do estudo também sinalizam uma mudança mais ampla na trajetória da pesquisa em IA. Durante anos, o campo foi dominado pela mentalidade de "quanto maior, melhor", com foco em modelos e conjuntos de dados cada vez maiores. Mas, à medida que os ganhos de eficiência com métodos de baixa precisão, como o treinamento de 8 bits, se aproximam de seus limites, essa era de escalonamento ilimitado pode estar chegando ao fim.

Tim Dettmers, pesquisador de IA da Universidade Carnegie Mellon, vê este estudo como um ponto de inflexão. "Os resultados mostram claramente que atingimos os limites práticos da quantização", explica. Dettmers prevê uma mudança do escalonamento de uso geral para abordagens mais direcionadas, como modelos especializados projetados para tarefas específicas e aplicações centradas no ser humano que priorizam a usabilidade e a acessibilidade em detrimento do poder computacional bruto.

Este pivô se alinha com tendências mais amplas em IA, onde considerações éticas e restrições de recursos estão cada vez mais influenciando as prioridades de desenvolvimento. À medida que o campo amadurece, o foco pode se mover em direção à criação de modelos que não apenas tenham um bom desempenho, mas também se integrem perfeitamente aos fluxos de trabalho humanos e abordem as necessidades do mundo real de forma eficaz.

Concluindo!

A integração da precisão em leis de escala marca um novo capítulo na pesquisa de IA. Ao destacar o papel da precisão numérica, o estudo desafia suposições de longa data e abre a porta para práticas de desenvolvimento mais eficientes e conscientes dos recursos.

Embora restrições práticas como limitações de hardware permaneçam, as descobertas oferecem insights valiosos para otimizar o treinamento do modelo. À medida que os limites da quantização de baixa precisão se tornam aparentes, o campo está pronto para uma mudança de paradigma — da busca incansável por escala para uma abordagem mais equilibrada enfatizando aplicações especializadas e centradas no ser humano.

Este estudo serve como um guia e um desafio para a comunidade: inovar não apenas para desempenho, mas para eficiência, praticidade e impacto.

Tópicos relacionados:inteligência artificial LLM pesquisa

A seguir

A tensão entre a Microsoft e a OpenAI: o que isso significa para o futuro da IA

Não Perca

LLM-as-a-Judge: Uma solução escalável para avaliar modelos de linguagem usando modelos de linguagem