tynkä Taivutus-2.5: Powerhouse LLM kilpailee GPT-4:n ja Geminiin kanssa - Unite.AI
Liity verkostomme!

Keinotekoinen yleinen älykkyys

Taivutus-2.5: Powerhouse LLM kilpailee GPT-4:n ja Geminiin kanssa

mm
Päivitetty on
Taivutus-2.5 PI

Taivutus AI on tehnyt aaltoja alalla suuria kielimalleja (LLM:t) äskettäin julkistamalla Inflection-2.5:n, mallin, joka kilpailee maailman johtavien LLM:ien kanssa, mukaan lukien OpenAI:n GPT-4 ja Googlen Gemini.

Inflection AI:n nopeaa nousua on edelleen ruokkinut massiivinen 1.3 miljardin dollarin rahoituskierros, jota johtavat alan jättiläiset, kuten Microsoft, NVIDIA ja tunnetut sijoittajat, kuten Reid Hoffman, Bill Gates ja Eric Schmidt. Tämä merkittävä investointi nostaa yhtiön keräämän kokonaisrahoituksen 1.525 miljardiin dollariin.

Yhteistyössä kumppaneiden CoreWeaven ja NVIDIAn kanssa Inflection AI rakentaa maailman suurinta tekoälyklusteria, joka koostuu ennennäkemättömästä 22,000 100 NVIDIA HXNUMX Tensor Core -grafiikkasuorittimesta. Tämä valtava laskentateho tukee uuden sukupolven laajamittaisten tekoälymallien koulutusta ja käyttöönottoa, mikä mahdollistaa Inflection AI:n työntämään henkilökohtaisen tekoälyn rajoja.

Yrityksen uraauurtava työ on jo tuottanut merkittäviä tuloksia: Inflection AI -klusteri, joka sisältää tällä hetkellä yli 3,500 100 NVIDIA H11 Tensor Core -grafiikkasuoritinta, tarjoaa huippuluokan suorituskyvyn avoimen lähdekoodin MLPerf-vertailussa. CoreWeaven ja NVIDIAn kanssa yhteisessä lähetyksessä klusteri suoritti suurten kielimallien referenssiharjoitustehtävän vain XNUMX minuutissa, mikä vahvisti asemansa nopeimpana klusterina tällä vertailulla.

Tämä saavutus seuraa Inflection-1:n, Inflection AI:n sisäisen suuren kielimallin (LLM) julkistamista, jota on kehuttu laskentaluokkansa parhaaksi malliksi. Toimialan jättiläisiä, kuten GPT-3.5, LLaMA, Chinchilla ja PaLM-540B, parempi monissa LLM:ien vertailussa yleisesti käytetyissä vertailuarvoissa Inflection-1 antaa käyttäjille mahdollisuuden olla vuorovaikutuksessa Pi:n, Inflection AI:n henkilökohtaisen tekoälyn kanssa yksinkertaisella ja luonnollisella tavalla. , saa nopeasti, asiaankuuluvaa ja hyödyllistä tietoa ja neuvoja.

Inflection AI:n sitoutuminen läpinäkyvyyteen ja toistettavuuteen käy ilmi teknisestä muistiosta, joka sisältää yksityiskohtaisesti Inflection-1:n arvioinnin ja suorituskyvyn eri mittareilla. Muistio paljastaa, että Inflection-1 ylittää saman laskentaluokan mallit, jotka määritellään malleiksi, jotka on koulutettu käyttämällä korkeintaan PaLM-540B:n FLOP-toimintoja (liukupistetoimintoja).

Inflection-1:n menestys ja yrityksen tietojenkäsittelyinfrastruktuurin nopea skaalautuminen, jota vauhditti huomattava rahoituskierros, korostavat Inflection AI:n horjumatonta omistautumista sen tehtävän toteuttamiseen, joka on luoda henkilökohtainen tekoäly kaikille. Kun Inflection-1 on integroitu Pi:hen, käyttäjät voivat nyt kokea henkilökohtaisen tekoälyn voiman ja hyötyä sen empatiasta persoonallisuutta, hyödyllisyyttä ja turvallisuusstandardeja.

Taivutus-2.5

Taivutus-2.5 on nyt kaikkien Inflection AI:n henkilökohtaisen tekoälyavustajan Pi:n käyttäjien saatavilla useilla alustoilla, mukaan lukien web (pi.ai), iOS, Android ja uusi työpöytäsovellus. Tämä integraatio on merkittävä virstanpylväs Inflection AI:n tehtävässä luoda henkilökohtainen tekoäly kaikille yhdistämällä raaka kyky heidän tunnusomaiseen empatiaan persoonallisuutensa ja turvallisuusstandardeihinsa.

A Leap in Performance Inflection AI:n edellinen malli Inflection-1 käytti noin 4 % GPT-4:n harjoitteluista FLOP:ista (liukulukuoperaatiot) ja sen keskimääräinen suorituskyky oli noin 72 % verrattuna GPT-4:ään eri IQ-suuntautuneilla menetelmillä. tehtäviä. Inflection-2.5:n avulla Inflection AI on saavuttanut huomattavan lisäyksen Pi:n älyllisiin kykyihin keskittyen koodaukseen ja matematiikkaan.

Mallin suorituskyky keskeisillä alan vertailuarvoilla osoittaa sen kyvykkyyttä, sillä se osoittaa yli 94 % GPT-4:n keskimääräisestä suorituskyvystä eri tehtävissä, erityisesti STEM-alueilla. Tämä merkittävä saavutus on osoitus Inflection AI:n sitoutumisesta teknologian rajojen työntämiseen samalla, kun hän keskittyy horjumatta käyttökokemukseen ja turvallisuuteen.

Koodaus ja matematiikka Prowess Inflection-2.5 loistaa koodauksessa ja matematiikassa, mikä osoittaa yli 10 % parannuksen BIG-Bench-Hardin Inflection-1:een, joka on suurten kielimallien haastavien ongelmien osajoukko. Kaksi koodauksen vertailuarvoa, MBPP+ ja HumanEval+, paljastavat massiivisia parannuksia Inflection-1:een verrattuna ja vahvistavat Inflection-2.5:n asemaa voimana, joka on otettava huomioon koodausalueella.

MBPP+-vertailussa Inflection-2.5 ylittää edeltäjänsä merkittävällä marginaalilla, ja sen suorituskyky on verrattavissa GPT-4:n tasoon, kuten DeepSeek Coder raportoi. Samoin HumanEval+-benchmarkissa Inflection-2.5 osoittaa huomattavaa edistystä, ylittää Inflection-1:n suorituskyvyn ja lähestyy GPT-4:n tasoa, kuten EvalPlus-tulostaulukossa kerrotaan.

Toimialan benchmark-dominanssi

Inflection-2.5 erottuu alan vertailuarvoista ja esittelee merkittäviä parannuksia Inflection-1:een verrattuna MMLU-vertailussa ja GPQA Diamond -vertailuarvossa, joka tunnetaan asiantuntijatason vaikeusasteestaan. Mallin suorituskyky näissä vertailuissa korostaa sen kykyä käsitellä monenlaisia ​​tehtäviä lukiotason ongelmista ammattitason haasteisiin.

Erinomaista STEM-kokeissa Mallin suorituskyky ulottuu STEM-kokeisiin, ja Unkarin matematiikan kokeessa ja fysiikan GRE:ssä on erinomainen suorituskyky. Unkarin matematiikan kokeessa Inflection-2.5 osoittaa matemaattiset kykynsä hyödyntämällä toimitettua muutaman laukauksen kehotetta ja muotoilua, mikä mahdollistaa helpon toistettavuuden.

Physics GRE:ssä, fysiikan jatko-pääsykokeessa, Inflection-2.5 saavuttaa ihmiskokeen suorittaneiden 85. persentiilin vuonna 8 (enemmistöäänestys 8), mikä vahvistaa asemaansa valtavana haastajana fysiikan ongelmanratkaisun alalla. . Lisäksi malli lähestyy huipputulosta maj@32:ssa, mikä osoittaa sen kykyä ratkaista monimutkaisia ​​fysiikan ongelmia huomattavalla tarkkuudella.

Enhancing User Experience Inflection-2.5 ei ainoastaan ​​ylläpidä Pi:n persoonallisuutta ja turvallisuusstandardeja, vaan nostaa sen asemaa monipuolisena ja korvaamattomana henkilökohtaisena tekoälynä useissa eri aiheissa. Ajankohtaisista tapahtumista keskustelemisesta paikallisten suositusten etsimiseen, kokeisiin opiskelemiseen, koodaamiseen ja jopa satunnaisiin keskusteluihin, Inflection-2.5:n tuottama Pi lupaa rikastuneen käyttökokemuksen.

Inflection-2.5:n tehokkailla ominaisuuksilla käyttäjät ovat tekemisissä Pi:n kanssa laajemmissa aiheissa kuin koskaan ennen. Mallin kyky käsitellä monimutkaisia ​​tehtäviä yhdistettynä sen empaattiseen persoonallisuuteen ja reaaliaikaisiin verkkohakuominaisuuksiin varmistaa, että käyttäjät saavat laadukasta ja ajantasaista tietoa ja ohjausta.

Käyttäjien omaksuminen ja sitoutuminen Inflection-2.5:n Pi:hen integroinnin vaikutus näkyy jo käyttäjien mielipiteissä, sitoutumisessa ja säilyttämisessä. Inflection AI on nähnyt merkittävän kiihtyvyyden orgaanisessa käyttäjien kasvussa, kun miljoona päivittäistä ja kuusi miljoonaa kuukausittaista aktiivista käyttäjää on vaihtanut yli neljä miljardia viestiä Pi:n kanssa.

Keskimäärin keskustelut Pin kanssa kestävät 33 minuuttia, joista joka kymmenes kestää yli tunnin joka päivä. Lisäksi noin 60 % ihmisistä, jotka ovat vuorovaikutuksessa Pi:n kanssa tietyllä viikolla, palaavat takaisin seuraavalla viikolla, mikä osoittaa korkeampaa kuukausittaista tahmeutta kuin alan johtavat kilpailijat.

Tekniset tiedot ja vertailun läpinäkyvyys

Inflection AI:n läpinäkyvyyttä ja toistettavuutta koskevan sitoumuksen mukaisesti yhtiö on toimittanut kattavat tekniset tulokset ja tiedot Inflection-2.5:n suorituskyvystä eri alan vertailuissa.

Esimerkiksi MT-Bench-tietojoukon korjatussa versiossa, jossa käsitellään virheellisiin vertailuratkaisuihin ja virheellisiin lähtökohtiin liittyviä ongelmia alkuperäisessä tietojoukossa, Inflection-2.5 osoittaa suorituskykyä muiden vertailuarvojen perusteella odotusten mukaisesti.

Inflection AI on myös arvioinut Inflection-2.5:tä HellaSwagissa ja ARC-C:ssä, tervettä järkeä ja tiedettä koskevia vertailuarvoja, jotka on raportoitu useissa eri malleissa, ja tulokset osoittavat vahvan suorituskyvyn näillä kyllästetyillä vertailuarvoilla.

On tärkeää huomata, että vaikka toimitetut arvioinnit edustavat mallia, joka käyttää Pi:tä, käyttökokemus voi vaihdella hieman esimerkiksi verkkohaun vaikutuksesta (ei käytetty vertailuissa), muutaman otoksen kehotteen rakenteesta ja muista tekijöistä johtuen. tuotantopuolen erot.

Yhteenveto

Inflection-2.5 edustaa merkittävää harppausta eteenpäin suurten kielimallien alalla. Se kilpailee alan johtajien, kuten GPT-4:n ja Geminin, kyvyt ja käyttää vain murto-osaa laskentaresursseista. Inflection-2.5:n vaikuttava suorituskyky useissa eri vertailuissa, erityisesti STEM-alueilla, koodauksessa ja matematiikassa, on asettanut itsensä valtavaksi kilpailijaksi tekoälymaailmassa.

Inflection-2.5:n integrointi Piiin, Inflection AI:n henkilökohtaiseen tekoälyassistenttiin, lupaa rikastuneen käyttökokemuksen, jossa yhdistyvät raaka ominaisuudet empaattiseen persoonallisuus- ja turvallisuusstandardeihin. Kun Inflection AI jatkaa LLM-yritysten mahdollisuuksien rajoja, AI-yhteisö odottaa innokkaasti tämän uraauurtavan yrityksen seuraavaa innovaatioaaltoa ja läpimurtoja.

Inflection AI:n visionäärinen lähestymistapa ulottuu pelkkää mallikehitystä pidemmälle, sillä yritys tunnustaa esikoulutuksen ja hienosäädön tärkeyden luotaessa laadukkaita, turvallisia ja hyödyllisiä tekoälykokemuksia. Pystysuoraan integroituna tekoälystudiona Inflection AI hoitaa koko prosessin talon sisällä tiedon keräämisestä ja mallien suunnittelusta korkean suorituskyvyn infrastruktuuriin.

Olen viettänyt viimeiset viisi vuotta uppoutuen koneoppimisen ja syväoppimisen kiehtovaan maailmaan. Intohimoni ja asiantuntemukseni ovat saaneet minut osallistumaan yli 50:een erilaiseen ohjelmistosuunnitteluprojektiin keskittyen erityisesti tekoälyyn/ML:ään. Jatkuva uteliaisuuteni on myös vetänyt minut kohti luonnollisen kielen käsittelyä, alaa, jota olen innokas tutkimaan lisää.