Informații generale artificiale

Inflexie-2.5: Powerhouse LLM rivalizează cu GPT-4 și Gemeni

Actualizat on Martie 14, 2024

Inflexiune AI a făcut furori în domeniul modele lingvistice mari (LLM) cu recenta lor dezvăluire a Inflection-2.5, un model care concurează cu liderii LLM din lume, inclusiv OpenAI GPT-4 și Google Gemini.

Creșterea rapidă a Inflection AI a fost alimentată și mai mult de un masiv Rundă de finanțare de 1.3 miliard de dolari, condus de giganți din industrie precum Microsoft, NVIDIA și investitori renumiți, inclusiv Reid Hoffman, Bill Gates și Eric Schmidt. Această investiție semnificativă aduce finanțarea totală strânsă de companie la 1.525 miliarde USD.

În colaborare cu partenerii CoreWeave și NVIDIA, Inflection AI construiește cel mai mare cluster AI din lume, cuprinzând 22,000 de GPU-uri NVIDIA H100 Tensor Core fără precedent. Această putere de calcul colosală va sprijini pregătirea și implementarea unei noi generații de modele AI la scară largă, permițând AI Inflection să depășească limitele a ceea ce este posibil în domeniul AI personal.

Munca revoluționară a companiei a dat deja rezultate remarcabile, clusterul Inflection AI, care cuprinde în prezent peste 3,500 de GPU-uri NVIDIA H100 Tensor Core, oferind performanțe de ultimă generație pe benchmark-ul open-source MLPerf. Într-o prezentare comună cu CoreWeave și NVIDIA, clusterul a finalizat sarcina de instruire de referință pentru modele de limbi mari în doar 11 minute, solidificându-și poziția de cel mai rapid cluster din acest benchmark.

Această realizare urmează dezvăluirii Inflection-1, modelul de limbaj mare (LLM) al Inflection AI, care a fost salutat drept cel mai bun model din clasa sa de calcul. Depășind giganții din industrie precum GPT-3.5, LLaMA, Chinchilla și PaLM-540B pe o gamă largă de benchmark-uri utilizate în mod obișnuit pentru compararea LLM-urilor, Inflection-1 permite utilizatorilor să interacționeze cu Pi, IA personală a Inflection AI, într-un mod simplu și natural. , primind informații și sfaturi rapide, relevante și utile.

Angajamentul Inflection AI față de transparență și reproductibilitate este evident în lansarea unui memoriu tehnic care detaliază evaluarea și performanța Inflection-1 pe diferite criterii de referință. Nota dezvăluie că Inflection-1 depășește modelele din aceeași clasă de calcul, definite ca modele antrenate folosind cel mult FLOP-urile (operațiuni în virgulă mobilă) ale PaLM-540B.

Succesul Inflection-1 și extinderea rapidă a infrastructurii de calcul a companiei, alimentată de runda substanțială de finanțare, evidențiază dedicarea neclintită a Inflection AI de a-și îndeplini misiunea de a crea o IA personală pentru toată lumea. Odată cu integrarea Inflection-1 în Pi, utilizatorii pot experimenta acum puterea unui AI personal, beneficiind de personalitatea empatică, utilitatea și standardele de siguranță ale acesteia.

Inflexiune-2.5

Inflexiune-2.5 este acum disponibil pentru toți utilizatorii Pi, asistentul personal AI al Inflection AI, pe mai multe platforme, inclusiv web (pi.ai), iOS, Android și o nouă aplicație desktop. Această integrare marchează o piatră de hotar semnificativă în misiunea Inflection AI de a crea o IA personală pentru toată lumea, combinând capacitatea brută cu personalitatea lor empatică și standardele de siguranță.

Un salt în performanță Modelul anterior al Inflection AI, Inflection-1, a utilizat aproximativ 4% din FLOP-urile de antrenament (operațiuni în virgulă mobilă) ale GPT-4 și a prezentat o performanță medie de aproximativ 72% în comparație cu GPT-4 în diferitele IQ-uri orientate. sarcini. Cu Inflection-2.5, Inflection AI a obținut un impuls substanțial în capacitățile intelectuale ale lui Pi, cu accent pe codificare și matematică.

Performanța modelului la punctele de referință cheie din industrie demonstrează priceperea sa, prezentând peste 94% din performanța medie a GPT-4 în diferite sarcini, cu un accent deosebit pe excelența în domeniile STEM. Această realizare remarcabilă este o dovadă a angajamentului Inflection AI de a împinge granița tehnologică, menținând în același timp un accent neclintit asupra experienței și siguranței utilizatorului.

Codificare și pricepere la matematică Inflection-2.5 strălucește în codificare și matematică, demonstrând o îmbunătățire de peste 10% față de Inflection-1 pe BIG-Bench-Hard, un subset de probleme provocatoare pentru modelele mari de limbaj. Două benchmark-uri de codare, MBPP+ și HumanEval+, dezvăluie îmbunătățiri masive față de Inflection-1, solidificând poziția lui Inflection-2.5 ca forță care trebuie luată în considerare în domeniul codării.

Pe benchmark-ul MBPP+, Inflection-2.5 îl depășește pe predecesorul său cu o marjă semnificativă, prezentând un nivel de performanță comparabil cu cel al GPT-4, după cum a raportat DeepSeek Coder. În mod similar, pe benchmark-ul HumanEval+, Inflection-2.5 demonstrează un progres remarcabil, depășind performanța lui Inflection-1 și apropiindu-se de nivelul GPT-4, așa cum este raportat pe clasamentul EvalPlus.

Dominanța de referință în industrie

Inflection-2.5 iese în evidență în benchmark-urile din industrie, prezentând îmbunătățiri substanțiale față de Inflection-1 în ceea ce privește benchmark-ul MMLU și GPQA Diamond, renumit pentru dificultatea sa la nivel de expert. Performanța modelului la aceste puncte de referință subliniază capacitatea sa de a gestiona o gamă largă de sarcini, de la probleme la nivel de liceu până la provocări la nivel profesional.

Excelență în examenele STEM Performanța modelului se extinde și la examenele STEM, cu performanțe remarcabile la examenul de matematică maghiară și GRE de fizică. La examenul de matematică maghiară, Inflection-2.5 își demonstrează aptitudinea matematică prin valorificarea promptului și formatării oferite pentru câteva lovituri, permițând reproductibilitate ușoară.

În Physics GRE, un examen de admitere pentru absolvenți în fizică, Inflection-2.5 atinge a 85-a percentila de examinați umani în maj@8 (vot majoritar la 8), solidificându-și poziția de candidat formidabil în domeniul rezolvării problemelor de fizică. . În plus, modelul se apropie de scorul maxim în maj@32, manifestându-și capacitatea de a aborda probleme complexe de fizică cu o acuratețe remarcabilă.

Îmbunătățirea experienței utilizatorului Inflection-2.5 nu numai că susține personalitatea și standardele de siguranță ale lui Pi, dar îi ridică statutul de IA personală versatilă și de neprețuit pe diverse subiecte. De la discutarea evenimentelor curente la căutarea de recomandări locale, studiul pentru examene, codificare și chiar conversații ocazionale, Pi powered by Inflection-2.5 promite o experiență de utilizator îmbogățită.

Cu capabilitățile puternice ale lui Inflection-2.5, utilizatorii interacționează cu Pi pe o gamă mai largă de subiecte decât oricând. Capacitatea modelului de a gestiona sarcini complexe, combinată cu personalitatea sa empatică și capabilitățile de căutare web în timp real, asigură utilizatorilor să primească informații și îndrumări de înaltă calitate, actualizate.

Adoptarea și implicarea utilizatorilor Impactul integrării Inflection-2.5 în Pi este deja evident în valorile de sentiment, implicare și retenție ale utilizatorilor. Inflection AI a asistat la o accelerare semnificativă a creșterii organice a utilizatorilor, cu un milion de utilizatori activi zilnic și șase milioane lunar schimbând peste patru miliarde de mesaje cu Pi.

În medie, conversațiile cu Pi durează 33 de minute, una din zece durând peste o oră în fiecare zi. În plus, aproximativ 60% dintre persoanele care interacționează cu Pi într-o anumită săptămână revin în săptămâna următoare, prezentând o lipiciitate lunară mai mare decât concurenții de top în domeniu.

Detalii tehnice și transparență de referință

În conformitate cu angajamentul Inflection AI față de transparență și reproductibilitate, compania a oferit rezultate tehnice cuprinzătoare și detalii despre performanța Inflection-2.5 în diferite benchmark-uri din industrie.

De exemplu, pe versiunea corectată a setului de date MT-Bench, care abordează problemele cu soluții de referință incorecte și premise defecte în setul de date original, Inflection-2.5 demonstrează performanța în conformitate cu așteptările bazate pe alte benchmark-uri.

Inflection AI a evaluat, de asemenea, Inflection-2.5 pe HellaSwag și ARC-C, repere de bun simț și știință raportate de o gamă largă de modele, iar rezultatele arată performanțe puternice pe aceste repere saturate.

Este important de reținut că, în timp ce evaluările furnizate reprezintă modelul care alimentează Pi, experiența utilizatorului poate varia ușor din cauza unor factori precum impactul regăsării web (nu este utilizat în benchmark-uri), structura solicitării pentru câteva inregistrări și altele. diferențe din partea producției.

Concluzie

Inflection-2.5 reprezintă un salt înainte semnificativ în domeniul modelelor de limbaj mari, rivalizând cu capacitățile liderilor din industrie precum GPT-4 și Gemini, utilizând în același timp doar o fracțiune din resursele de calcul. Cu performanța sa impresionantă într-o gamă largă de benchmark-uri, în special în domeniile STEM, codificare și matematică, Inflection-2.5 s-a poziționat ca un concurent formidabil în peisajul AI.

Integrarea Inflection-2.5 în Pi, asistentul personal AI al Inflection AI, promite o experiență îmbogățită pentru utilizator, combinând capacitatea brută cu personalitatea empatică și standardele de siguranță. Pe măsură ce Inflection AI continuă să depășească limitele a ceea ce este posibil cu LLM-urile, comunitatea AI anticipează cu nerăbdare următorul val de inovații și descoperiri de la această companie pioniera.

Abordarea vizionară a Inflection AI se extinde dincolo de simpla dezvoltare a modelului, deoarece compania recunoaște importanța pregătirii preliminare și a reglajului în crearea unor experiențe AI de înaltă calitate, sigure și utile. Fiind un studio AI integrat vertical, Inflection AI se ocupă de întregul proces intern, de la ingerarea de date și proiectarea modelelor până la infrastructura de înaltă performanță.

Subiecte asemănătoare:Gemenii GPT-4 Inflexiune AI Modele de limbaj mari Palmier asistent personal AI

Urmeaza

Puterea Rerankerelor și Recuperarea în două etape pentru generarea sporită de recuperare

Nu ratați

Creșterea modelelor de limbaj specifice domeniului

Aayush Mittal

Mi-am petrecut ultimii cinci ani scufundându-mă în lumea fascinantă a învățării automate și a învățării profunde. Pasiunea și expertiza mea m-au determinat să contribui la peste 50 de proiecte diverse de inginerie software, cu un accent deosebit pe AI/ML. Curiozitatea mea continuă m-a atras și către Procesarea limbajului natural, un domeniu pe care sunt dornic să îl explorez în continuare.