Artificiell intelligens

Microsoft presenterar Phi-3: Kraftfulla öppna AI-modeller som levererar toppprestanda i små storlekar

publicerade 24 april 2024

Alex McFarland

Microsoft har introducerat Phi-3, en ny familj av små språkmodeller (SLM) som syftar till att leverera hög prestanda och kostnadseffektivitet i AI-applikationer. Dessa modeller har visat starka resultat över riktmärken i språkförståelse, resonemang, kodning och matematik jämfört med modeller av liknande och större storlekar. Utgivningen av Phi-3 utökar de tillgängliga alternativen för utvecklare och företag som vill utnyttja AI och samtidigt balansera effektivitet och kostnad.

Phi-3 modellfamilj och tillgänglighet

Den första modellen i Phi-3-serien är Phi-3-mini, en 3.8B-parametermodell som nu finns tillgänglig på Azure AI Studio, Kramande ansikteoch Ollama. Phi-3-mini levereras instruktionsjusterad, vilket gör att den kan användas "out-of-the-box" utan omfattande finjustering. Den har ett kontextfönster på upp till 128K tokens, den längsta i sin storleksklass, vilket möjliggör bearbetning av större textinmatningar utan att offra prestanda.

För att optimera prestanda över hårdvaruinställningar har Phi-3-mini finjusterats för ONNX Runtime och NVIDIA GPU:er. Microsoft planerar att utöka Phi-3-familjen snart med lanseringen av Phi-3-small (7B parametrar) och Phi-3-medium (14B parametrar). Dessa ytterligare modeller kommer att ge ett bredare utbud av alternativ för att möta olika behov och budgetar.

Bild: Microsoft

Phi-3 prestanda och utveckling

Microsoft rapporterar att Phi-3-modellerna har visat betydande prestandaförbättringar jämfört med modeller av samma storlek och ännu större modeller över olika riktmärken. Enligt företaget har Phi-3-mini överträffat modeller som är dubbelt så stora när det gäller språkförståelse och genereringsuppgifter, medan Phi-3-small och Phi-3-medium har överträffat mycket större modeller, som GPT-3.5T, i vissa utvärderingar.

Microsoft uppger att utvecklingen av Phi-3-modellerna har följt företagets principer och standarder för ansvarsfull AI, vilka betonar ansvarsskyldighet, transparens, rättvisa, tillförlitlighet, säkerhet, integritet, trygghet och inkludering. Modellerna har enligt uppgift genomgått säkerhetsutbildning, utvärderingar och red-teaming för att säkerställa att ansvarsfulla AI-distributionsrutiner följs.

Bild: Microsoft

Potentiella tillämpningar och funktioner för Phi-3

Phi-3-familjen är designad för att utmärka sig i scenarier där resurserna är begränsade, låg latens är avgörande eller kostnadseffektivitet är en prioritet. Dessa modeller har potential att möjliggöra slutledning på enheten, vilket gör att AI-drivna applikationer kan köras effektivt på ett brett utbud av enheter, inklusive de med begränsad datorkraft. Den mindre storleken på Phi-3-modeller kan också göra finjustering och anpassning mer överkomlig för företag, vilket gör det möjligt för företag att anpassa modellerna till sina specifika användningsfall utan att ådra sig höga kostnader.

I applikationer där snabba svarstider är avgörande erbjuder Phi-3-modeller en lovande lösning. Deras optimerade arkitektur och effektiva bearbetning kan möjliggöra snabb generering av resultat, förbättra användarupplevelser och öppna upp möjligheter för AI-interaktioner i realtid. Dessutom gör Phi-3-minis starka resonemangs- och logikfunktioner den väl lämpad för analytiska uppgifter, såsom dataanalys och insiktsgenerering.

När verkliga tillämpningar av Phi-3-modeller dyker upp blir potentialen för dessa modeller att driva innovation och göra AI mer tillgänglig allt tydligare. Phi-3-familjen representerar en milstolpe i demokratiseringen av AI, vilket ger företag och utvecklare möjlighet att utnyttja kraften i avancerade språkmodeller samtidigt som effektivitet och kostnadseffektivitet bibehålls.

Med lanseringen av Phi-3 tänjer Microsoft på gränserna för vad som är möjligt med små språkmodeller, vilket banar väg för en framtid där AI sömlöst kan integreras i ett brett utbud av applikationer och enheter.

Relaterade ämnen:

Strax

Kan artificiell intelligens göra försäkringar mer överkomliga?

Missa inte

Allt du behöver veta om Llama 3 | Den mest kraftfulla modellen med öppen källkod hittills | Begrepp för användning

Alex McFarland

Alex McFarland är en AI-journalist och författare som utforskar den senaste utvecklingen inom artificiell intelligens. Han har samarbetat med många AI-startups och publikationer över hela världen.

Unite.AI

Microsoft presenterar Phi-3: Kraftfulla öppna AI-modeller som levererar toppprestanda i små storlekar

Phi-3 modellfamilj och tillgänglighet

Phi-3 prestanda och utveckling

Potentiella tillämpningar och funktioner för Phi-3

Du må gilla