Intelligence Artificielle

Microsoft dévoile Phi-3 : de puissants modèles d'IA ouverts offrant des performances optimales dans des tailles réduites

Publié le 24 avril 2024

Alex McFarland

Microsoft a présenté Phi-3, une nouvelle famille de petits modèles de langage (SLM) qui visent à offrir des performances élevées et une rentabilité dans les applications d’IA. Ces modèles ont montré d’excellents résultats dans tous les domaines de compréhension du langage, de raisonnement, de codage et de mathématiques par rapport à des modèles de tailles similaires et plus grandes. La sortie de Phi-3 étend les options disponibles pour les développeurs et les entreprises qui cherchent à tirer parti de l'IA tout en équilibrant efficacité et coût.

Famille de modèles Phi-3 et disponibilité

Le premier modèle de la gamme Phi-3 est le Phi-3-mini, un modèle à paramètres 3.8B désormais disponible sur Azure IA Studio, Étreindre le visageou Ollama. Le Phi-3-mini est livré avec des instructions adaptées, ce qui lui permet d'être utilisé « prêt à l'emploi » sans réglage approfondi. Il dispose d'une fenêtre contextuelle pouvant contenir jusqu'à 128 XNUMX jetons, la plus longue de sa catégorie de taille, permettant le traitement de saisies de texte plus volumineuses sans sacrifier les performances.

Pour optimiser les performances dans les configurations matérielles, le Phi-3-mini a été optimisé pour les GPU ONNX Runtime et NVIDIA. Microsoft prévoit d'élargir prochainement la famille Phi-3 avec la sortie de Phi-3-small (paramètres 7B) et Phi-3-medium (paramètres 14B). Ces modèles supplémentaires offriront une plus large gamme d’options pour répondre à divers besoins et budgets.

Image : Microsoft

Performance et développement Phi-3

Microsoft rapporte que les modèles Phi-3 ont démontré des améliorations de performances significatives par rapport aux modèles de même taille et aux modèles encore plus grands selon divers tests de référence. Selon la société, le Phi-3-mini a surpassé des modèles deux fois plus grands en termes de compréhension du langage et de tâches de génération, tandis que le Phi-3-small et le Phi-3-medium ont surpassé des modèles beaucoup plus grands, tels que le GPT-3.5T, dans certains domaines. évaluations.

Microsoft affirme que le développement des modèles Phi-3 a respecté les principes et normes d'IA responsable de l'entreprise, qui mettent l'accent sur la responsabilité, la transparence, l'équité, la fiabilité, la sécurité, la confidentialité et l'inclusion. Les modèles auraient fait l'objet de formations en sécurité, d'évaluations et d'une mise en place d'équipes red-teaming afin de garantir le respect des pratiques de déploiement d'IA responsable.

Image : Microsoft

Applications potentielles et capacités de Phi-3

La famille Phi-3 est conçue pour exceller dans les scénarios où les ressources sont limitées, où une faible latence est essentielle ou où la rentabilité est une priorité. Ces modèles ont le potentiel de permettre l’inférence sur l’appareil, permettant ainsi aux applications basées sur l’IA de s’exécuter efficacement sur une large gamme d’appareils, y compris ceux dotés d’une puissance de calcul limitée. La taille réduite des modèles Phi-3 peut également rendre le réglage et la personnalisation plus abordables pour les entreprises, leur permettant d'adapter les modèles à leurs cas d'utilisation spécifiques sans encourir de coûts élevés.

Pour les applications où la rapidité de réponse est essentielle, les modèles Phi-3 offrent une solution prometteuse. Leur architecture optimisée et leur traitement efficace permettent une génération rapide de résultats, améliorant ainsi l'expérience utilisateur et ouvrant la voie à des interactions IA en temps réel. De plus, les puissantes capacités de raisonnement et de logique du Phi-3-mini le rendent particulièrement adapté aux tâches analytiques, telles que l'analyse de données et la génération d'informations.

À mesure que des applications concrètes des modèles Phi-3 émergent, le potentiel de ces modèles pour stimuler l’innovation et rendre l’IA plus accessible devient de plus en plus évident. La famille Phi-3 représente une étape importante dans la démocratisation de l'IA, permettant aux entreprises et aux développeurs d'exploiter la puissance des modèles de langage avancés tout en maintenant l'efficacité et la rentabilité.

Avec la sortie de Phi-3, Microsoft repousse les limites de ce qui est possible avec les petits modèles de langage, ouvrant la voie à un avenir où l'IA pourra être intégrée de manière transparente dans un large éventail d'applications et d'appareils.

Rubriques connexes:

L’intelligence artificielle peut-elle rendre l’assurance plus abordable ?

Ne manquez pas

Tout ce que vous devez savoir sur Llama 3 | Le modèle open source le plus puissant à ce jour | Concepts d'utilisation

Alex McFarland

Alex McFarland est un journaliste et écrivain en IA qui explore les derniers développements en matière d'intelligence artificielle. Il a collaboré avec de nombreuses startups et publications d'IA dans le monde entier.

Unite.AI

Microsoft dévoile Phi-3 : de puissants modèles d'IA ouverts offrant des performances optimales dans des tailles réduites

Famille de modèles Phi-3 et disponibilité

Performance et développement Phi-3

Applications potentielles et capacités de Phi-3

Tu peux aimer