Kunstmatige intelligentie
Microsoft onthult Phi-3: Krachtige open AI-modellen die topprestaties leveren bij kleine maten

Microsoft heeft Phi-3 geïntroduceerd, een nieuwe familie van kleine taalmodellen (SLM’s) die zijn ontworpen om hoge prestaties en kosten-effectiviteit te bieden in AI-toepassingen. Deze modellen hebben sterke resultaten laten zien in benchmarks voor taalbegrip, redeneren, coderen en wiskunde in vergelijking met modellen van vergelijkbare en grotere maten. De release van Phi-3 breidt de opties uit voor ontwikkelaars en bedrijven die AI willen gebruiken en tegelijkertijd efficiëntie en kosten in balans willen houden.
Phi-3 Model Familie en Beschikbaarheid
Het eerste model in de Phi-3-lijn is Phi-3-mini, een model met 3,8 miljard parameters dat nu beschikbaar is op Azure AI Studio, Hugging Face en Ollama. Phi-3-mini is vooraf ingesteld op instructies, waardoor het “out-of-the-box” kan worden gebruikt zonder uitgebreide fine-tuning. Het heeft een contextvenster van maximaal 128K tokens, het langste in zijn klasse, waardoor het grotere tekstinvoer kan verwerken zonder prestaties te offeren.
Om de prestaties te optimaliseren over hardware-instellingen, is Phi-3-mini fijn afgestemd op ONNX Runtime en NVIDIA GPU’s. Microsoft plant om de Phi-3-familie binnenkort uit te breiden met de release van Phi-3-small (7 miljard parameters) en Phi-3-medium (14 miljard parameters). Deze extra modellen zullen een bredere reeks opties bieden om te voldoen aan diverse behoeften en budgetten.

Afbeelding: Microsoft
Phi-3 Prestaties en Ontwikkeling
Microsoft meldt dat de Phi-3-modellen aanzienlijke prestatieverbeteringen hebben laten zien ten opzichte van modellen van dezelfde grootte en zelfs grotere modellen in verschillende benchmarks. Volgens het bedrijf heeft Phi-3-mini modellen die tweemaal zo groot zijn, overtroffen in taalbegrip- en generatietaken, terwijl Phi-3-small en Phi-3-medium grotere modellen, zoals GPT-3,5T, hebben overtroffen in bepaalde evaluaties.
Microsoft stelt dat de ontwikkeling van de Phi-3-modellen is gebaseerd op de bedrijfsprincipes en -normen voor Verantwoorde AI, die benadrukken dat verantwoordelijkheid, transparantie, eerlijkheid, betrouwbaarheid, veiligheid, privacy, beveiliging en inclusiviteit essentieel zijn. De modellen zouden een veiligheidstraining, evaluaties en rood teamonderzoek hebben ondergaan om ervoor te zorgen dat ze voldoen aan de verantwoorde AI-uitrolpraktijken.

Afbeelding: Microsoft
Potentiële Toepassingen en Mogelijkheden van Phi-3
De Phi-3-familie is ontworpen om uit te blinken in scenario’s waarin resources beperkt zijn, lage latentie essentieel is of kosten-effectiviteit een prioriteit heeft. Deze modellen hebben het potentieel om on-device-inferentie mogelijk te maken, waardoor AI-gebaseerde toepassingen efficiënt kunnen worden uitgevoerd op een breed scala aan apparaten, inclusief apparaten met beperkte rekenkracht. De kleinere grootte van de Phi-3-modellen kan ook fine-tuning en aanpassing betaalbaarder maken voor bedrijven, waardoor ze de modellen kunnen aanpassen aan hun specifieke use-cases zonder hoge kosten te maken.
In toepassingen waarin snelle responstijden essentieel zijn, bieden de Phi-3-modellen een veelbelovende oplossing. Hun geoptimaliseerde architectuur en efficiënte verwerking kunnen snelle generatie van resultaten mogelijk maken, waardoor gebruikerservaringen worden verbeterd en mogelijkheden voor real-time AI-interacties worden geopend. Bovendien maken de sterke redenerings- en logische capaciteiten van Phi-3-mini het een goede keuze voor analytische taken, zoals gegevensanalyse en inzichtengeneratie.
