Entre em contato

Inteligência artificial

Microsoft lança Phi-3: modelos poderosos de IA aberta que oferecem desempenho superior em tamanhos pequenos

Publicado

 on

A Microsoft lançou o Phi-3, uma nova família de modelos de linguagem pequena (SLMs) que visam oferecer alto desempenho e economia em aplicações de IA. Esses modelos mostraram resultados sólidos em benchmarks de compreensão linguística, raciocínio, codificação e matemática quando comparados a modelos de tamanhos semelhantes e maiores. O lançamento do Phi-3 expande as opções disponíveis para desenvolvedores e empresas que buscam aproveitar a IA e ao mesmo tempo equilibrar eficiência e custo.

Família e disponibilidade do modelo Phi-3

O primeiro modelo da linha Phi-3 é o Phi-3-mini, um modelo de parâmetros de 3.8B agora disponível em Estúdio de IA do Azure, Abraçando o rosto e Ollama. O Phi-3-mini vem com ajuste de instrução, permitindo que ele seja usado “pronto para uso”, sem muitos ajustes finos. Ele apresenta uma janela de contexto de até 128 mil tokens, a mais longa em sua classe de tamanho, permitindo o processamento de entradas de texto maiores sem sacrificar o desempenho.

Para otimizar o desempenho em configurações de hardware, o Phi-3-mini foi ajustado para ONNX Runtime e GPUs NVIDIA. A Microsoft planeja expandir a família Phi-3 em breve com o lançamento do Phi-3-small (parâmetros 7B) e Phi-3-medium (parâmetros 14B). Esses modelos adicionais fornecerão uma gama mais ampla de opções para atender a diversas necessidades e orçamentos.

Imagem: Microsoft

Desempenho e desenvolvimento do Phi-3

A Microsoft relata que os modelos Phi-3 demonstraram melhorias significativas de desempenho em relação a modelos do mesmo tamanho e modelos ainda maiores em vários benchmarks. Segundo a empresa, o Phi-3-mini superou modelos com o dobro de seu tamanho em tarefas de compreensão e geração de linguagem, enquanto o Phi-3-small e o Phi-3-medium superaram modelos muito maiores, como o GPT-3.5T, em certos avaliações.

A Microsoft afirma que o desenvolvimento dos modelos Phi-3 acompanhou os passos da empresa Princípios de IA responsável e padrões, que enfatizam a responsabilidade, a transparência, a justiça, a confiabilidade, a segurança, a privacidade, a proteção e a inclusão. Os modelos passaram por treinamento de segurança, avaliações e equipes vermelhas para garantir a adesão às práticas responsáveis ​​de implantação de IA.

Imagem: Microsoft

Potenciais aplicações e capacidades do Phi-3

A família Phi-3 foi projetada para se destacar em cenários onde os recursos são limitados, a baixa latência é essencial ou a relação custo-benefício é uma prioridade. Esses modelos têm o potencial de permitir inferência no dispositivo, permitindo que aplicativos alimentados por IA sejam executados com eficiência em uma ampla variedade de dispositivos, incluindo aqueles com capacidade computacional limitada. O tamanho menor dos modelos Phi-3 também pode tornar o ajuste fino e a personalização mais acessíveis para as empresas, permitindo-lhes adaptar os modelos aos seus casos de uso específicos sem incorrer em custos elevados.

Em aplicações onde tempos de resposta rápidos são críticos, os modelos Phi-3 oferecem uma solução promissora. Sua arquitetura otimizada e processamento eficiente podem permitir a geração rápida de resultados, melhorando as experiências do usuário e abrindo possibilidades para interações de IA em tempo real. Além disso, os fortes recursos de raciocínio e lógica do Phi-3-mini o tornam adequado para tarefas analíticas, como análise de dados e geração de insights.

À medida que surgem aplicações reais dos modelos Phi-3, torna-se cada vez mais claro o potencial destes modelos para impulsionar a inovação e tornar a IA mais acessível. A família Phi-3 representa um marco na democratização da IA, capacitando empresas e desenvolvedores a aproveitar o poder de modelos de linguagem avançados, mantendo ao mesmo tempo a eficiência e a relação custo-benefício.

Com o lançamento do Phi-3, a Microsoft ultrapassa os limites do que é possível com modelos de linguagem pequena, abrindo caminho para um futuro onde a IA pode ser perfeitamente integrada numa vasta gama de aplicações e dispositivos.

Alex McFarland é um jornalista e escritor de IA que explora os mais recentes desenvolvimentos em inteligência artificial. Ele colaborou com inúmeras startups e publicações de IA em todo o mundo.