Tekoäly
Microsoft julkistaa Phi-3:n: Tehokkaat avoimet tekoälymallit, jotka tarjoavat huippusuorituskykyä pienissä kooissa
Microsoft on esitellyt Phi-3:n, uuden perheen pienet kielimallit (SLM) joiden tavoitteena on tarjota korkea suorituskyky ja kustannustehokkuus tekoälysovelluksissa. Nämä mallit ovat osoittaneet vahvoja tuloksia kielen ymmärtämisen, päättelyn, koodauksen ja matematiikan vertailuissa verrattuna samankokoisiin ja suurempiin malleihin. Phi-3:n julkaisu laajentaa vaihtoehtoja kehittäjille ja yrityksille, jotka haluavat hyödyntää tekoälyä ja tasapainottaa tehokkuutta ja kustannuksia.
Phi-3 malliperhe ja saatavuus
Ensimmäinen Phi-3-malliston malli on Phi-3-mini, 3.8B-parametrimalli, joka on nyt saatavilla Azure AI Studio, Halaaminen kasvotja Ollama. Phi-3-mini on ohjeistettu, joten sitä voidaan käyttää heti valmiina ilman laajaa hienosäätöä. Siinä on jopa 128 XNUMX tokenin kontekstiikkuna, joka on kokoluokassaan pisin ja mahdollistaa suurempien tekstisyötteiden käsittelyn suorituskyvystä tinkimättä.
Laitteiston suorituskyvyn optimoimiseksi Phi-3-mini on hienosäädetty ONNX Runtime- ja NVIDIA GPU:ia varten. Microsoft aikoo laajentaa Phi-3-perhettä pian julkaisemalla Phi-3-small (7B-parametrit) ja Phi-3-medium (14B-parametrit). Nämä lisämallit tarjoavat laajemman valikoiman vaihtoehtoja erilaisiin tarpeisiin ja budjetteihin.
Phi-3 suorituskyky ja kehitys
Microsoft raportoi, että Phi-3-mallit ovat osoittaneet merkittäviä suorituskyvyn parannuksia verrattuna samankokoisiin malleihin ja jopa suurempiin malleihin eri vertailuissa. Yrityksen mukaan Phi-3-mini on ylittänyt mallit kaksi kertaa kokonsa kielen ymmärtämisessä ja sukupolvitehtävissä, kun taas Phi-3-small ja Phi-3-medium ovat ylittäneet joissakin tapauksissa paljon suuremmat mallit, kuten GPT-3.5T. arvioinnit.
Microsoft toteaa, että Phi-3-mallien kehitys on seurannut yhtiön kehitystä Vastuulliset tekoälyperiaatteet ja standardit, jotka korostavat vastuullisuutta, läpinäkyvyyttä, oikeudenmukaisuutta, luotettavuutta, turvallisuutta, yksityisyyttä, turvallisuutta ja osallisuutta. Malleille on kerrottu käyneen turvallisuuskoulutuksen, arvioinnin ja red-teamingin varmistaakseen vastuullisten tekoälyn käyttöönottokäytäntöjen noudattamisen.
Phi-3:n mahdolliset sovellukset ja ominaisuudet
Phi-3-perhe on suunniteltu menestymään skenaarioissa, joissa resurssit ovat rajalliset, pieni latenssi on välttämätöntä tai kustannustehokkuus on etusijalla. Näillä malleilla on mahdollisuus tehdä päätelmiä laitteessa, jolloin tekoälyllä toimivat sovellukset voivat toimia tehokkaasti monenlaisissa laitteissa, mukaan lukien ne, joiden laskentateho on rajoitettu. Phi-3-mallien pienempi koko saattaa myös tehdä hienosäädöstä ja räätälöimisestä yrityksille edullisempaa, jolloin ne voivat mukauttaa mallit omiin käyttötapauksiinsa ilman suuria kustannuksia.
Sovelluksissa, joissa nopeat vasteajat ovat kriittisiä, Phi-3-mallit tarjoavat lupaavan ratkaisun. Niiden optimoitu arkkitehtuuri ja tehokas prosessointi voivat mahdollistaa nopean tulosten luomisen, parantaa käyttäjäkokemusta ja avata mahdollisuuksia reaaliaikaiseen tekoälyvuorovaikutukseen. Lisäksi Phi-3-minin vahvat päättely- ja logiikkaominaisuudet tekevät siitä hyvin sopivan analyyttisiin tehtäviin, kuten data-analyysiin ja oivallusten luomiseen.