stubbur Beyging-2.5: The Powerhouse LLM samkeppni GPT-4 og Gemini - Unite.AI
Tengja við okkur

Gervi almenn greind

Beyging-2.5: The Powerhouse LLM samkeppni GPT-4 og Gemini

mm
Uppfært on
Beyging-2.5 PI

Beyging AI hefur verið að slá í gegn á sviði stór mállíkön (LLMs) með nýlegri afhjúpun þeirra á Inflection-2.5, líkani sem keppir við leiðandi LLMs heims, þar á meðal OpenAI's GPT-4 og Google's Gemini.

Hröð aukning gervigreindar beygingar hefur verið knúin áfram af gríðarlegu 1.3 milljarða dollara fjármögnunarlota, undir forystu iðnaðarrisa eins og Microsoft, NVIDIA og þekktra fjárfesta þar á meðal Reid Hoffman, Bill Gates og Eric Schmidt. Þessi umtalsverða fjárfesting færir heildarfjármögnun fyrirtækisins upp í 1.525 milljarða dollara.

Í samvinnu við samstarfsaðilana CoreWeave og NVIDIA er Inflection AI að byggja stærsta gervigreindarþyrping í heimi, sem samanstendur af áður óþekktum 22,000 NVIDIA H100 Tensor Core GPU. Þessi gríðarlegi tölvukraftur mun styðja við þjálfun og uppsetningu nýrrar kynslóðar stórfelldra gervigreindarlíkana, sem gerir Inflection AI kleift að ýta mörkum þess sem er mögulegt á sviði persónulegrar gervigreindar.

Byltingarkennd vinna fyrirtækisins hefur þegar skilað ótrúlegum árangri, þar sem Inflection AI þyrpingin, sem nú samanstendur af yfir 3,500 NVIDIA H100 Tensor Core GPU, skilar nýjustu frammistöðu á opnum viðmiði MLPerf. Í sameiginlegri sendingu með CoreWeave og NVIDIA, kláraði þyrping viðmiðunarþjálfunarverkefnið fyrir stór tungumálalíkön á aðeins 11 mínútum og styrkti stöðu sína sem hraðasta þyrpinguna á þessu viðmiði.

Þetta afrek kemur í kjölfar afhjúpunar á Inflection-1, Inflection AI's in-house large language model (LLM), sem hefur verið hyllt sem besta líkanið í sínum tölvuflokki. Beygja sig fram úr risum iðnaðarins eins og GPT-3.5, LLaMA, Chinchilla og PaLM-540B á fjölmörgum viðmiðum sem almennt eru notaðir til að bera saman LLM, Inflection-1 gerir notendum kleift að hafa samskipti við Pi, persónulega AI's Inflection AI, á einfaldan og náttúrulegan hátt , fá skjótar, viðeigandi og gagnlegar upplýsingar og ráð.

Skuldbinding beygingargervigreindar við gagnsæi og endurgerðanleika er augljós í útgáfu tæknilegs minnisblaðs þar sem greint er frá mati og frammistöðu Beygingar-1 á ýmsum viðmiðum. Minnisblaðið leiðir í ljós að Inflection-1 er betri en líkön í sama tölvuflokki, skilgreind sem líkön sem eru þjálfuð með því að nota í mesta lagi FLOPs (floating-point operations) PaLM-540B.

Velgengni Inflection-1 og hröð stærðarstærð tölvuinnviða fyrirtækisins, knúin áfram af umfangsmikilli fjármögnunarlotu, varpa ljósi á óbilandi vígslu Inflection AI til að skila hlutverki sínu að skapa persónulega gervigreind fyrir alla. Með samþættingu Inflection-1 í Pi geta notendur nú upplifað kraft persónulegrar gervigreindar og notið góðs af samúðarfullum persónuleika þess, notagildi og öryggisstöðlum.

Beyging-2.5

Beyging-2.5 er nú í boði fyrir alla notendur Pi, persónulegur AI aðstoðarmaður Inflection AI, á mörgum kerfum, þar á meðal vefnum (pi.ai), iOS, Android og nýju skrifborðsforriti. Þessi samþætting markar mikilvægan áfanga í hlutverki Inflection AI að búa til persónulega gervigreind fyrir alla, sem sameinar hráa getu með einkennandi samkennd persónuleika og öryggisstaðla.

A Leap in Performance Inflection AI Fyrra líkan gervigreindar, Inflection-1, nýtti um það bil 4% af þjálfunar FLOPs (flotpunktaaðgerðum) GPT-4 og sýndi meðalframmistöðu um 72% samanborið við GPT-4 á ýmsum greindarvísitölum. verkefni. Með Inflection-2.5 hefur Inflection AI náð verulegri aukningu í vitsmunalegum getu Pi, með áherslu á erfðaskrá og stærðfræði.

Frammistaða líkansins á lykilviðmiðum iðnaðarins sýnir hæfileika þess, sýnir yfir 94% af meðalframmistöðu GPT-4 í ýmsum verkefnum, með sérstakri áherslu á að skara fram úr á STEM sviðum. Þetta ótrúlega afrek er til marks um skuldbindingu Inflection AI til að ýta á tæknilega landamærin á sama tíma og halda óbilandi áherslu á notendaupplifun og öryggi.

Kóðunar- og stærðfræðikunnátta Beyging-2.5 skín í kóðun og stærðfræði og sýnir meira en 10% framför á Beygingar-1 á BIG-Bench-Hard, undirmengi krefjandi vandamála fyrir stór mállíkön. Tvö kóðunarviðmið, MBPP+ og HumanEval+, sýna gríðarlegar endurbætur á Inflection-1, sem treysta stöðu Inflection-2.5 sem afl sem þarf að reikna með á kóðunarsviðinu.

Á MBPP+ viðmiðinu er Inflection-2.5 betri en forveri sinn umtalsvert og sýnir frammistöðustig sem er sambærilegt við GPT-4, eins og greint var frá af DeepSeek Coder. Á sama hátt, á HumanEval+ viðmiðinu, sýnir Inflection-2.5 ótrúlegar framfarir, fer yfir frammistöðu Inflection-1 og nálgast stigið GPT-4, eins og greint er frá á EvalPlus stigatöflunni.

Yfirburðir iðnaðarviðmiðs

Beyging-2.5 sker sig úr í viðmiðum iðnaðarins og sýnir verulegar endurbætur á Beygingar-1 á MMLU viðmiðinu og GPQA Diamond viðmiðinu, sem er þekkt fyrir erfiðleika á sérfræðingum. Árangur líkansins á þessum viðmiðum undirstrikar getu þess til að takast á við margvísleg verkefni, allt frá vandamálum á framhaldsskólastigi til viðfangsefna á fagstigi.

Framúrskarandi í STEM prófum. Hæfni líkansins nær til STEM prófa, með framúrskarandi frammistöðu á ungversku stærðfræðiprófinu og eðlisfræði GRE. Í ungversku stærðfræðiprófinu sýnir Inflection-2.5 stærðfræðilega hæfileika sína með því að nýta sér fáein skota vísbendingu og snið, sem auðveldar endurgerðanleika.

Í eðlisfræði GRE, útskriftarprófi í eðlisfræði, nær beyging-2.5 85. hundraðshluta þeirra sem taka próf í maj@8 (meirihlutaatkvæði við 8), sem styrkir stöðu sína sem ægilegur keppinautur á sviði eðlisfræðivandamála. . Ennfremur nálgast líkanið hæstu einkunnina í maj@32 og sýnir getu sína til að takast á við flókin eðlisfræðileg vandamál með ótrúlegri nákvæmni.

Að auka notendaupplifun Beygingar-2.5 heldur ekki aðeins uppi einkennandi persónuleika og öryggisstöðlum Pi heldur hækkar stöðu hans sem fjölhæfur og ómetanlegur persónulegur gervigreind í margvíslegum viðfangsefnum. Allt frá því að ræða atburði líðandi stundar til að leita að staðbundnum ráðleggingum, læra fyrir próf, kóða og jafnvel frjálslegur samtöl, Pi knúinn af Inflection-2.5 lofar auðgað notendaupplifun.

Með öflugum möguleikum Inflection-2.5 eru notendur að taka þátt í Pi um fjölbreyttari efni en nokkru sinni fyrr. Hæfni líkansins til að takast á við flókin verkefni, ásamt samúðarfullum persónuleika og rauntíma vefleitargetu, tryggir að notendur fái hágæða, uppfærðar upplýsingar og leiðbeiningar.

Notendasamþykkt og þátttaka Áhrif samþættingar Inflection-2.5 í Pi eru þegar augljós í notendaviðhorfum, þátttöku og varðveislumælingum. Inflection AI hefur orðið vitni að verulegri hröðun í lífrænum notendavexti, þar sem ein milljón daglega og sex milljónir virkra notenda á hverjum mánuði skiptast á meira en fjórum milljörðum skilaboða við Pi.

Að meðaltali standa samtöl við Pi í 33 mínútur, þar af einn af hverjum tíu í meira en klukkutíma á hverjum degi. Ennfremur, um það bil 60% fólks sem hefur samskipti við Pi í tiltekinni viku snúa aftur vikuna á eftir og sýna meiri mánaðarlega klístur en fremstu keppendur á þessu sviði.

Tæknilegar upplýsingar og gagnsæi viðmiðunar

Í samræmi við skuldbindingu Inflection AI um gagnsæi og endurgerðanleika, hefur fyrirtækið veitt yfirgripsmiklar tæknilegar niðurstöður og upplýsingar um frammistöðu Inflection-2.5 í ýmsum viðmiðum iðnaðarins.

Til dæmis, á leiðréttri útgáfu MT-Bench gagnasafnsins, sem tekur á vandamálum með rangar tilvísunarlausnir og gölluð forsendur í upprunalegu gagnasafninu, sýnir Inflection-2.5 frammistöðu í samræmi við væntingar byggðar á öðrum viðmiðum.

Inflection AI hefur einnig metið Inflection-2.5 á HellaSwag og ARC-C, skynsemi og vísindaviðmið sem greint er frá af fjölmörgum gerðum, og niðurstöðurnar sýna sterkan árangur á þessum mettandi viðmiðum.

Það er mikilvægt að hafa í huga að þó að úttektirnar sem gefnar eru tákna líkanið sem knýr Pi, getur notendaupplifunin verið lítillega breytileg vegna þátta eins og áhrifa vefleitar (ekki notað í viðmiðunum), uppbyggingu fára skota hvetja og annarra munur á framleiðsluhlið.

Niðurstaða

Beyging-2.5 táknar verulegt stökk fram á við á sviði stórra tungumálalíkana, sem keppir við getu leiðtoga í iðnaði eins og GPT-4 og Gemini á sama tíma og þeir nýta aðeins brot af tölvuauðlindunum. Með glæsilegri frammistöðu sinni á margvíslegum viðmiðum, sérstaklega á STEM sviðum, kóðun og stærðfræði, hefur Inflection-2.5 staðset sig sem ógnvekjandi keppinaut í gervigreindarlandslaginu.

Samþætting Inflection-2.5 í Pi, persónulegum gervigreindaraðstoðarmanni Inflection AI, lofar auðgaðri notendaupplifun, sem sameinar hráa getu með samúðarfullum persónuleika og öryggisstöðlum. Þar sem Inflection AI heldur áfram að ýta á mörk þess sem er mögulegt með LLM, sér gervigreind samfélagið spennt fram á næstu bylgju nýjunga og byltinga frá þessu brautryðjandi fyrirtæki.

Hugsjónaleg nálgun Beygingargervigreindar nær lengra en eingöngu módelþróun, þar sem fyrirtækið viðurkennir mikilvægi forþjálfunar og fínstillingar til að skapa hágæða, örugga og gagnlega gervigreindarupplifun. Sem lóðrétt samþætt gervigreind stúdíó, annast Inflection AI allt ferlið innanhúss, frá inntöku gagna og líkanhönnun til afkastamikilla innviða.

Ég hef eytt síðustu fimm árum í að sökkva mér niður í heillandi heim vélanáms og djúpnáms. Ástríða mín og sérfræðiþekking hefur leitt mig til að leggja mitt af mörkum til yfir 50 fjölbreyttra hugbúnaðarverkefna, með sérstakri áherslu á gervigreind/ML. Áframhaldandi forvitni mín hefur einnig dregið mig að náttúrulegri málvinnslu, svið sem ég er fús til að kanna frekar.