Intelligence Artificielle
Microsoft dévoile Phi-3 : de puissants modèles d'IA ouverts offrant des performances optimales dans des tailles réduites

Microsoft a présenté Phi-3, une nouvelle famille de petits modèles de langage (SLM) qui visent à offrir des performances élevées et une rentabilité dans les applications d’IA. Ces modèles ont montré d’excellents résultats dans tous les domaines de compréhension du langage, de raisonnement, de codage et de mathématiques par rapport à des modèles de tailles similaires et plus grandes. La sortie de Phi-3 étend les options disponibles pour les développeurs et les entreprises qui cherchent à tirer parti de l'IA tout en équilibrant efficacité et coût.
Famille de modèles Phi-3 et disponibilité
Le premier modèle de la gamme Phi-3 est le Phi-3-mini, un modèle à paramètres 3.8B désormais disponible sur Azure IA Studio, Étreindre le visageou Ollama. Le Phi-3-mini est livré avec des instructions adaptées, ce qui lui permet d'être utilisé « prêt à l'emploi » sans réglage approfondi. Il dispose d'une fenêtre contextuelle pouvant contenir jusqu'à 128 XNUMX jetons, la plus longue de sa catégorie de taille, permettant le traitement de saisies de texte plus volumineuses sans sacrifier les performances.
Pour optimiser les performances dans les configurations matérielles, le Phi-3-mini a été optimisé pour les GPU ONNX Runtime et NVIDIA. Microsoft prévoit d'élargir prochainement la famille Phi-3 avec la sortie de Phi-3-small (paramètres 7B) et Phi-3-medium (paramètres 14B). Ces modèles supplémentaires offriront une plus large gamme d’options pour répondre à divers besoins et budgets.

Image : Microsoft
Performance et développement Phi-3
Microsoft rapporte que les modèles Phi-3 ont démontré des améliorations de performances significatives par rapport aux modèles de même taille et aux modèles encore plus grands selon divers tests de référence. Selon la société, le Phi-3-mini a surpassé des modèles deux fois plus grands en termes de compréhension du langage et de tâches de génération, tandis que le Phi-3-small et le Phi-3-medium ont surpassé des modèles beaucoup plus grands, tels que le GPT-3.5T, dans certains domaines. évaluations.
Microsoft affirme que le développement des modèles Phi-3 a respecté les principes et normes d'IA responsable de l'entreprise, qui mettent l'accent sur la responsabilité, la transparence, l'équité, la fiabilité, la sécurité, la confidentialité et l'inclusion. Les modèles auraient fait l'objet de formations en sécurité, d'évaluations et d'une mise en place d'équipes red-teaming afin de garantir le respect des pratiques de déploiement d'IA responsable.

Image : Microsoft
Applications potentielles et capacités de Phi-3
La famille Phi-3 est conçue pour exceller dans les scénarios où les ressources sont limitées, où une faible latence est essentielle ou où la rentabilité est une priorité. Ces modèles ont le potentiel de permettre l’inférence sur l’appareil, permettant ainsi aux applications basées sur l’IA de s’exécuter efficacement sur une large gamme d’appareils, y compris ceux dotés d’une puissance de calcul limitée. La taille réduite des modèles Phi-3 peut également rendre le réglage et la personnalisation plus abordables pour les entreprises, leur permettant d'adapter les modèles à leurs cas d'utilisation spécifiques sans encourir de coûts élevés.
Pour les applications où la rapidité de réponse est essentielle, les modèles Phi-3 offrent une solution prometteuse. Leur architecture optimisée et leur traitement efficace permettent une génération rapide de résultats, améliorant ainsi l'expérience utilisateur et ouvrant la voie à des interactions IA en temps réel. De plus, les puissantes capacités de raisonnement et de logique du Phi-3-mini le rendent particulièrement adapté aux tâches analytiques, telles que l'analyse de données et la génération d'informations.