Artificiell intelligens
Microsoft presenterar Phi-3: Kraftfulla öppna AI-modeller som levererar toppprestanda i smÄ storlekar

Microsoft har introducerat Phi-3, en ny familj av smÄ sprÄkmodeller (SLM) som syftar till att leverera hög prestanda och kostnadseffektivitet i AI-applikationer. Dessa modeller har visat starka resultat över riktmÀrken i sprÄkförstÄelse, resonemang, kodning och matematik jÀmfört med modeller av liknande och större storlekar. Utgivningen av Phi-3 utökar de tillgÀngliga alternativen för utvecklare och företag som vill utnyttja AI och samtidigt balansera effektivitet och kostnad.
Phi-3 modellfamilj och tillgÀnglighet
Den första modellen i Phi-3-serien Àr Phi-3-mini, en 3.8B-parametermodell som nu finns tillgÀnglig pÄ Azure AI Studio, Kramande ansikteoch Ollama. Phi-3-mini levereras instruktionsjusterad, vilket gör att den kan anvÀndas "out-of-the-box" utan omfattande finjustering. Den har ett kontextfönster pÄ upp till 128K tokens, den lÀngsta i sin storleksklass, vilket möjliggör bearbetning av större textinmatningar utan att offra prestanda.
För att optimera prestanda över hÄrdvaruinstÀllningar har Phi-3-mini finjusterats för ONNX Runtime och NVIDIA GPU:er. Microsoft planerar att utöka Phi-3-familjen snart med lanseringen av Phi-3-small (7B parametrar) och Phi-3-medium (14B parametrar). Dessa ytterligare modeller kommer att ge ett bredare utbud av alternativ för att möta olika behov och budgetar.

Bild: Microsoft
Phi-3 prestanda och utveckling
Microsoft rapporterar att Phi-3-modellerna har visat betydande prestandaförbÀttringar jÀmfört med modeller av samma storlek och Ànnu större modeller över olika riktmÀrken. Enligt företaget har Phi-3-mini övertrÀffat modeller som Àr dubbelt sÄ stora nÀr det gÀller sprÄkförstÄelse och genereringsuppgifter, medan Phi-3-small och Phi-3-medium har övertrÀffat mycket större modeller, som GPT-3.5T, i vissa utvÀrderingar.
Microsoft uppger att utvecklingen av Phi-3-modellerna har följt företagets principer och standarder för ansvarsfull AI, vilka betonar ansvarsskyldighet, transparens, rÀttvisa, tillförlitlighet, sÀkerhet, integritet, trygghet och inkludering. Modellerna har enligt uppgift genomgÄtt sÀkerhetsutbildning, utvÀrderingar och red-teaming för att sÀkerstÀlla att ansvarsfulla AI-distributionsrutiner följs.

Bild: Microsoft
Potentiella tillÀmpningar och funktioner för Phi-3
Phi-3-familjen Àr designad för att utmÀrka sig i scenarier dÀr resurserna Àr begrÀnsade, lÄg latens Àr avgörande eller kostnadseffektivitet Àr en prioritet. Dessa modeller har potential att möjliggöra slutledning pÄ enheten, vilket gör att AI-drivna applikationer kan köras effektivt pÄ ett brett utbud av enheter, inklusive de med begrÀnsad datorkraft. Den mindre storleken pÄ Phi-3-modeller kan ocksÄ göra finjustering och anpassning mer överkomlig för företag, vilket gör det möjligt för företag att anpassa modellerna till sina specifika anvÀndningsfall utan att Ädra sig höga kostnader.
I applikationer dÀr snabba svarstider Àr avgörande erbjuder Phi-3-modeller en lovande lösning. Deras optimerade arkitektur och effektiva bearbetning kan möjliggöra snabb generering av resultat, förbÀttra anvÀndarupplevelser och öppna upp möjligheter för AI-interaktioner i realtid. Dessutom gör Phi-3-minis starka resonemangs- och logikfunktioner den vÀl lÀmpad för analytiska uppgifter, sÄsom dataanalys och insiktsgenerering.