Anslut dig till vÄrt nÀtverk!

Artificiell intelligens

Microsoft presenterar Phi-3: Kraftfulla öppna AI-modeller som levererar toppprestanda i smÄ storlekar

mm

Microsoft har introducerat Phi-3, en ny familj av smÄ sprÄkmodeller (SLM) som syftar till att leverera hög prestanda och kostnadseffektivitet i AI-applikationer. Dessa modeller har visat starka resultat över riktmÀrken i sprÄkförstÄelse, resonemang, kodning och matematik jÀmfört med modeller av liknande och större storlekar. Utgivningen av Phi-3 utökar de tillgÀngliga alternativen för utvecklare och företag som vill utnyttja AI och samtidigt balansera effektivitet och kostnad.

Phi-3 modellfamilj och tillgÀnglighet

Den första modellen i Phi-3-serien Àr Phi-3-mini, en 3.8B-parametermodell som nu finns tillgÀnglig pÄ Azure AI Studio, Kramande ansikteoch Ollama. Phi-3-mini levereras instruktionsjusterad, vilket gör att den kan anvÀndas "out-of-the-box" utan omfattande finjustering. Den har ett kontextfönster pÄ upp till 128K tokens, den lÀngsta i sin storleksklass, vilket möjliggör bearbetning av större textinmatningar utan att offra prestanda.

För att optimera prestanda över hÄrdvaruinstÀllningar har Phi-3-mini finjusterats för ONNX Runtime och NVIDIA GPU:er. Microsoft planerar att utöka Phi-3-familjen snart med lanseringen av Phi-3-small (7B parametrar) och Phi-3-medium (14B parametrar). Dessa ytterligare modeller kommer att ge ett bredare utbud av alternativ för att möta olika behov och budgetar.

Bild: Microsoft

Phi-3 prestanda och utveckling

Microsoft rapporterar att Phi-3-modellerna har visat betydande prestandaförbÀttringar jÀmfört med modeller av samma storlek och Ànnu större modeller över olika riktmÀrken. Enligt företaget har Phi-3-mini övertrÀffat modeller som Àr dubbelt sÄ stora nÀr det gÀller sprÄkförstÄelse och genereringsuppgifter, medan Phi-3-small och Phi-3-medium har övertrÀffat mycket större modeller, som GPT-3.5T, i vissa utvÀrderingar.

Microsoft uppger att utvecklingen av Phi-3-modellerna har följt företagets principer och standarder för ansvarsfull AI, vilka betonar ansvarsskyldighet, transparens, rÀttvisa, tillförlitlighet, sÀkerhet, integritet, trygghet och inkludering. Modellerna har enligt uppgift genomgÄtt sÀkerhetsutbildning, utvÀrderingar och red-teaming för att sÀkerstÀlla att ansvarsfulla AI-distributionsrutiner följs.

Bild: Microsoft

Potentiella tillÀmpningar och funktioner för Phi-3

Phi-3-familjen Àr designad för att utmÀrka sig i scenarier dÀr resurserna Àr begrÀnsade, lÄg latens Àr avgörande eller kostnadseffektivitet Àr en prioritet. Dessa modeller har potential att möjliggöra slutledning pÄ enheten, vilket gör att AI-drivna applikationer kan köras effektivt pÄ ett brett utbud av enheter, inklusive de med begrÀnsad datorkraft. Den mindre storleken pÄ Phi-3-modeller kan ocksÄ göra finjustering och anpassning mer överkomlig för företag, vilket gör det möjligt för företag att anpassa modellerna till sina specifika anvÀndningsfall utan att Ädra sig höga kostnader.

I applikationer dÀr snabba svarstider Àr avgörande erbjuder Phi-3-modeller en lovande lösning. Deras optimerade arkitektur och effektiva bearbetning kan möjliggöra snabb generering av resultat, förbÀttra anvÀndarupplevelser och öppna upp möjligheter för AI-interaktioner i realtid. Dessutom gör Phi-3-minis starka resonemangs- och logikfunktioner den vÀl lÀmpad för analytiska uppgifter, sÄsom dataanalys och insiktsgenerering.

NÀr verkliga tillÀmpningar av Phi-3-modeller dyker upp blir potentialen för dessa modeller att driva innovation och göra AI mer tillgÀnglig allt tydligare. Phi-3-familjen representerar en milstolpe i demokratiseringen av AI, vilket ger företag och utvecklare möjlighet att utnyttja kraften i avancerade sprÄkmodeller samtidigt som effektivitet och kostnadseffektivitet bibehÄlls.

Med lanseringen av Phi-3 tÀnjer Microsoft pÄ grÀnserna för vad som Àr möjligt med smÄ sprÄkmodeller, vilket banar vÀg för en framtid dÀr AI sömlöst kan integreras i ett brett utbud av applikationer och enheter.

Alex McFarland Àr en AI-journalist och författare som utforskar den senaste utvecklingen inom artificiell intelligens. Han har samarbetat med mÄnga AI-startups och publikationer över hela vÀrlden.