Artificial Intelligence
Microsoft onthult Phi-3: krachtige open AI-modellen die topprestaties leveren bij kleine formaten

Microsoft heeft Phi-3 geïntroduceerd, een nieuwe familie van kleine taalmodellen (SLM's) die gericht zijn op het leveren van hoge prestaties en kosteneffectiviteit in AI-toepassingen. Deze modellen hebben sterke resultaten laten zien in benchmarks op het gebied van taalbegrip, redeneren, coderen en wiskunde in vergelijking met modellen van vergelijkbare en grotere omvang. De release van Phi-3 breidt de opties uit die beschikbaar zijn voor ontwikkelaars en bedrijven die AI willen benutten en tegelijkertijd efficiëntie en kosten in evenwicht willen brengen.
Phi-3-modelfamilie en beschikbaarheid
Het eerste model in de Phi-3-serie is Phi-3-mini, een parametermodel van 3.8 miljard nu beschikbaar op Azure AI-studio, Gezicht knuffelenen Ollama. De Phi-3-mini wordt op instructies afgestemd, waardoor hij ‘out-of-the-box’ kan worden gebruikt zonder uitgebreide fijnafstemming. Het beschikt over een contextvenster van maximaal 128 tokens, het langste in zijn grootteklasse, waardoor de verwerking van grotere tekstinvoer mogelijk is zonder dat dit ten koste gaat van de prestaties.
Om de prestaties van hardware-installaties te optimaliseren, is Phi-3-mini verfijnd voor ONNX Runtime en NVIDIA GPU's. Microsoft is van plan de Phi-3-familie binnenkort uit te breiden met de release van Phi-3-small (7B-parameters) en Phi-3-medium (14B-parameters). Deze aanvullende modellen bieden een breder scala aan opties om aan uiteenlopende behoeften en budgetten te voldoen.

Afbeelding: Microsoft
Phi-3 Prestaties en ontwikkeling
Microsoft meldt dat de Phi-3-modellen aanzienlijke prestatieverbeteringen hebben laten zien ten opzichte van modellen van dezelfde grootte en zelfs grotere modellen in verschillende benchmarks. Volgens het bedrijf presteert de Phi-3-mini beter dan modellen die twee keer zo groot zijn wat betreft taalbegrip en generatietaken, terwijl Phi-3-small en Phi-3-medium veel grotere modellen, zoals de GPT-3.5T, in bepaalde opzichten hebben overtroffen. evaluaties.
Microsoft stelt dat de ontwikkeling van de Phi-3-modellen is gebaseerd op de principes en normen van het bedrijf voor verantwoorde AI, die de nadruk leggen op verantwoording, transparantie, eerlijkheid, betrouwbaarheid, veiligheid, privacy, beveiliging en inclusiviteit. De modellen zouden veiligheidstrainingen, evaluaties en red-teaming hebben ondergaan om naleving van verantwoorde AI-implementatiepraktijken te waarborgen.

Afbeelding: Microsoft
Potentiële toepassingen en mogelijkheden van Phi-3
De Phi-3-familie is ontworpen om uit te blinken in scenario's waarin de bronnen beperkt zijn, een lage latentie essentieel is of kosteneffectiviteit een prioriteit is. Deze modellen hebben het potentieel om inferentie op apparaten mogelijk te maken, waardoor AI-aangedreven applicaties efficiënt kunnen worden uitgevoerd op een breed scala aan apparaten, inclusief apparaten met beperkte rekenkracht. Het kleinere formaat van Phi-3-modellen kan verfijning en maatwerk ook betaalbaarder maken voor bedrijven, waardoor ze de modellen kunnen aanpassen aan hun specifieke gebruiksscenario’s zonder hoge kosten te hoeven maken.
In toepassingen waar snelle responstijden cruciaal zijn, bieden Phi-3-modellen een veelbelovende oplossing. Hun geoptimaliseerde architectuur en efficiënte verwerking maken het mogelijk om snel resultaten te genereren, de gebruikerservaring te verbeteren en mogelijkheden te creëren voor realtime AI-interacties. Bovendien maken de sterke redeneer- en logische mogelijkheden van Phi-3-mini hem zeer geschikt voor analytische taken, zoals data-analyse en het genereren van inzichten.