Verbind je met ons

Artificial Intelligence

Microsoft onthult Phi-3: krachtige open AI-modellen die topprestaties leveren bij kleine formaten

mm

Microsoft heeft Phi-3 geïntroduceerd, een nieuwe familie van kleine taalmodellen (SLM's) die gericht zijn op het leveren van hoge prestaties en kosteneffectiviteit in AI-toepassingen. Deze modellen hebben sterke resultaten laten zien in benchmarks op het gebied van taalbegrip, redeneren, coderen en wiskunde in vergelijking met modellen van vergelijkbare en grotere omvang. De release van Phi-3 breidt de opties uit die beschikbaar zijn voor ontwikkelaars en bedrijven die AI willen benutten en tegelijkertijd efficiëntie en kosten in evenwicht willen brengen.

Phi-3-modelfamilie en beschikbaarheid

Het eerste model in de Phi-3-serie is Phi-3-mini, een parametermodel van 3.8 miljard nu beschikbaar op Azure AI-studio, Gezicht knuffelenen Ollama. De Phi-3-mini wordt op instructies afgestemd, waardoor hij ‘out-of-the-box’ kan worden gebruikt zonder uitgebreide fijnafstemming. Het beschikt over een contextvenster van maximaal 128 tokens, het langste in zijn grootteklasse, waardoor de verwerking van grotere tekstinvoer mogelijk is zonder dat dit ten koste gaat van de prestaties.

Om de prestaties van hardware-installaties te optimaliseren, is Phi-3-mini verfijnd voor ONNX Runtime en NVIDIA GPU's. Microsoft is van plan de Phi-3-familie binnenkort uit te breiden met de release van Phi-3-small (7B-parameters) en Phi-3-medium (14B-parameters). Deze aanvullende modellen bieden een breder scala aan opties om aan uiteenlopende behoeften en budgetten te voldoen.

Afbeelding: Microsoft

Phi-3 Prestaties en ontwikkeling

Microsoft meldt dat de Phi-3-modellen aanzienlijke prestatieverbeteringen hebben laten zien ten opzichte van modellen van dezelfde grootte en zelfs grotere modellen in verschillende benchmarks. Volgens het bedrijf presteert de Phi-3-mini beter dan modellen die twee keer zo groot zijn wat betreft taalbegrip en generatietaken, terwijl Phi-3-small en Phi-3-medium veel grotere modellen, zoals de GPT-3.5T, in bepaalde opzichten hebben overtroffen. evaluaties.

Microsoft stelt dat de ontwikkeling van de Phi-3-modellen is gebaseerd op de principes en normen van het bedrijf voor verantwoorde AI, die de nadruk leggen op verantwoording, transparantie, eerlijkheid, betrouwbaarheid, veiligheid, privacy, beveiliging en inclusiviteit. De modellen zouden veiligheidstrainingen, evaluaties en red-teaming hebben ondergaan om naleving van verantwoorde AI-implementatiepraktijken te waarborgen.

Afbeelding: Microsoft

Potentiële toepassingen en mogelijkheden van Phi-3

De Phi-3-familie is ontworpen om uit te blinken in scenario's waarin de bronnen beperkt zijn, een lage latentie essentieel is of kosteneffectiviteit een prioriteit is. Deze modellen hebben het potentieel om inferentie op apparaten mogelijk te maken, waardoor AI-aangedreven applicaties efficiënt kunnen worden uitgevoerd op een breed scala aan apparaten, inclusief apparaten met beperkte rekenkracht. Het kleinere formaat van Phi-3-modellen kan verfijning en maatwerk ook betaalbaarder maken voor bedrijven, waardoor ze de modellen kunnen aanpassen aan hun specifieke gebruiksscenario’s zonder hoge kosten te hoeven maken.

In toepassingen waar snelle responstijden cruciaal zijn, bieden Phi-3-modellen een veelbelovende oplossing. Hun geoptimaliseerde architectuur en efficiënte verwerking maken het mogelijk om snel resultaten te genereren, de gebruikerservaring te verbeteren en mogelijkheden te creëren voor realtime AI-interacties. Bovendien maken de sterke redeneer- en logische mogelijkheden van Phi-3-mini hem zeer geschikt voor analytische taken, zoals data-analyse en het genereren van inzichten.

Naarmate er toepassingen van Phi-3-modellen in de echte wereld ontstaan, wordt het potentieel van deze modellen om innovatie te stimuleren en AI toegankelijker te maken steeds duidelijker. De Phi-3-familie vertegenwoordigt een mijlpaal in de democratisering van AI, waardoor bedrijven en ontwikkelaars de kracht van geavanceerde taalmodellen kunnen benutten met behoud van efficiëntie en kosteneffectiviteit.

Met de release van Phi-3 verlegt Microsoft de grenzen van wat mogelijk is met kleine taalmodellen, waardoor de weg wordt vrijgemaakt voor een toekomst waarin AI naadloos kan worden geïntegreerd in een breed scala aan applicaties en apparaten.

Alex McFarland is een AI-journalist en -schrijver die de nieuwste ontwikkelingen op het gebied van kunstmatige intelligentie onderzoekt. Hij heeft samengewerkt met tal van AI-startups en publicaties over de hele wereld.