talon Microsoft dévoile Phi-3 : de puissants modèles d'IA ouverts offrant des performances optimales dans des tailles réduites - Unite.AI
Suivez nous sur

Intelligence artificielle

Microsoft dévoile Phi-3 : de puissants modèles d'IA ouverts offrant des performances optimales dans des tailles réduites

Publié le

 on

Microsoft a présenté Phi-3, une nouvelle famille de petits modèles de langage (SLM) qui visent à offrir des performances élevées et une rentabilité dans les applications d’IA. Ces modèles ont montré d’excellents résultats dans tous les domaines de compréhension du langage, de raisonnement, de codage et de mathématiques par rapport à des modèles de tailles similaires et plus grandes. La sortie de Phi-3 étend les options disponibles pour les développeurs et les entreprises qui cherchent à tirer parti de l'IA tout en équilibrant efficacité et coût.

Famille de modèles Phi-3 et disponibilité

Le premier modèle de la gamme Phi-3 est le Phi-3-mini, un modèle à paramètres 3.8B désormais disponible sur Azure IA Studio, Étreindre le visageainsi que Ollama. Le Phi-3-mini est livré avec des instructions adaptées, ce qui lui permet d'être utilisé « prêt à l'emploi » sans réglage approfondi. Il dispose d'une fenêtre contextuelle pouvant contenir jusqu'à 128 XNUMX jetons, la plus longue de sa catégorie de taille, permettant le traitement de saisies de texte plus volumineuses sans sacrifier les performances.

Pour optimiser les performances dans les configurations matérielles, le Phi-3-mini a été optimisé pour les GPU ONNX Runtime et NVIDIA. Microsoft prévoit d'élargir prochainement la famille Phi-3 avec la sortie de Phi-3-small (paramètres 7B) et Phi-3-medium (paramètres 14B). Ces modèles supplémentaires offriront une plus large gamme d’options pour répondre à divers besoins et budgets.

Image : Microsoft

Performance et développement Phi-3

Microsoft rapporte que les modèles Phi-3 ont démontré des améliorations de performances significatives par rapport aux modèles de même taille et aux modèles encore plus grands selon divers tests de référence. Selon la société, le Phi-3-mini a surpassé des modèles deux fois plus grands en termes de compréhension du langage et de tâches de génération, tandis que le Phi-3-small et le Phi-3-medium ont surpassé des modèles beaucoup plus grands, tels que le GPT-3.5T, dans certains domaines. évaluations.

Microsoft déclare que le développement des modèles Phi-3 a suivi les orientations de l'entreprise. Principes de l'IA responsable et des normes, qui mettent l’accent sur la responsabilité, la transparence, l’équité, la fiabilité, la sûreté, la confidentialité, la sécurité et l’inclusion. Les modèles auraient suivi une formation en matière de sécurité, des évaluations et une équipe rouge pour garantir le respect des pratiques responsables de déploiement de l'IA.

Image : Microsoft

Applications potentielles et capacités de Phi-3

La famille Phi-3 est conçue pour exceller dans les scénarios où les ressources sont limitées, où une faible latence est essentielle ou où la rentabilité est une priorité. Ces modèles ont le potentiel de permettre l’inférence sur l’appareil, permettant ainsi aux applications basées sur l’IA de s’exécuter efficacement sur une large gamme d’appareils, y compris ceux dotés d’une puissance de calcul limitée. La taille réduite des modèles Phi-3 peut également rendre le réglage et la personnalisation plus abordables pour les entreprises, leur permettant d'adapter les modèles à leurs cas d'utilisation spécifiques sans encourir de coûts élevés.

Dans les applications où des temps de réponse rapides sont essentiels, les modèles Phi-3 offrent une solution prometteuse. Leur architecture optimisée et leur traitement efficace peuvent permettre une génération rapide de résultats, améliorant l'expérience utilisateur et ouvrant des possibilités d'interactions avec l'IA en temps réel. De plus, les solides capacités de raisonnement et de logique du Phi-3-mini le rendent bien adapté aux tâches analytiques, telles que l'analyse des données et la génération d'informations.

À mesure que des applications concrètes des modèles Phi-3 émergent, le potentiel de ces modèles pour stimuler l’innovation et rendre l’IA plus accessible devient de plus en plus évident. La famille Phi-3 représente une étape importante dans la démocratisation de l'IA, permettant aux entreprises et aux développeurs d'exploiter la puissance des modèles de langage avancés tout en maintenant l'efficacité et la rentabilité.

Avec la sortie de Phi-3, Microsoft repousse les limites de ce qui est possible avec les petits modèles de langage, ouvrant la voie à un avenir où l'IA pourra être intégrée de manière transparente dans un large éventail d'applications et d'appareils.

Alex McFarland est un journaliste et écrivain en IA qui explore les derniers développements en matière d'intelligence artificielle. Il a collaboré avec de nombreuses startups et publications d'IA dans le monde entier.