Tekoäly

GPT-4o Mini julkistettu: Kustannustehokas, tehokas vaihtoehto Claude Haikulle, Gemini Flashille ja GPT 3.5 Turbolle

Julkaistu Heinäkuu 22, 2024

Tohtori Tehseen Zia

OpenAI, johtava generatiivisten esikoulutettujen muuntimien (GPT) skaalaamisessa, on nyt esitellyt GPT-4o Minin siirtyen kohti kompaktimpia tekoälyratkaisuja. Tämä muutos vastaa laaja-alaisen tekoälyn haasteisiin, kuten korkeisiin kustannuksiin ja energiaintensiiviseen koulutukseen, ja asettaa OpenAI:n kilpailemaan kilpailijoiden, kuten Googlen ja Clauden, kanssa. GPT-4o Mini tarjoaa tehokkaamman ja edullisemman lähestymistavan multimodaaliseen tekoälyyn. Tässä artikkelissa tarkastellaan, mikä erottaa GPT-4o Minin muista, vertaamalla sitä Claude Haikuun, Gemini Flashiin ja OpenAI:n GPT-3.5 Turboon. Arvioimme näitä malleja kuuden keskeisen tekijän perusteella: modaliteettituki, suorituskyky, konteksti-ikkuna, prosessointinopeus, hinnoittelu ja saatavuus, jotka ovat ratkaisevan tärkeitä oikean tekoälymallin valinnassa eri sovelluksiin.

GPT-4o Minin esittely:

GPT-4o Mini on kompakti multimodaalinen tekoälymalli, jossa on teksti- ja näköälykkyysominaisuudet. Vaikka OpenAI ei ole jakanut tarkempia tietoja kehitysmenetelmästään, GPT-4o Mini rakentaa GPT-sarjan perustalle. Se on suunniteltu kustannustehokkaisiin ja pienilatenssisiin sovelluksiin. GPT-4o Mini on hyödyllinen tehtävissä, jotka vaativat useiden mallikutsujen ketjuttamista tai rinnakkaistamista, suurten kontekstimäärien käsittelyä ja nopeiden, reaaliaikaisten tekstivastausten tarjoamista. Nämä ominaisuudet ovat erityisen tärkeitä sovellusten kehittämisessä, kuten Retrieval Augment Generation (RAG) järjestelmät ja chatbotit.

GPT-4o Minin tärkeimmät ominaisuudet ovat:

128 XNUMX tunnuksen kontekstiikkuna
Tuki jopa 16 XNUMX lähtötunnisteelle pyyntöä kohti
Ei-englanninkielisen tekstin parannettu käsittely
Tietoa lokakuuhun 2023 asti

GPT-4o Mini vs. Claude Haiku vs. Gemini Flash: pienten multimodaalisten AI-mallien vertailu

Tässä osiossa verrataan GPT-4o Miniä kahteen olemassa olevaan pieneen multimodaaliseen tekoälymalliin: Claude Haiku ja Gemini Flash. Anthropicin maaliskuussa 2024 lanseeraama Claude Haiku ja Googlen joulukuussa 2023 julkaisema Gemini Flash päivitetyllä versiolla 1.5, joka julkaistiin toukokuussa 2024, ovat merkittäviä kilpailijoita.

Modaalisuuden tuki: Sekä GPT-4o Mini että Claude Haiku tukee tällä hetkellä teksti- ja kuvaominaisuuksia. OpenAI aikoo lisätä ääni- ja videotuen tulevaisuudessa. Sitä vastoin Gemini Flash tukee jo tekstiä, kuvaa, videota ja ääntä.
Suorituskyky: OpenAI-tutkijat ovat vertailleet GPT-4o Miniä Gemini Flash ja Claude Haikua useilla keskeisillä mittareilla. GPT-4o Mini suoriutuu jatkuvasti kilpailijoitaan paremmin. Tekstiä ja näköä sisältävissä päättelytehtävissä GPT-4o Mini sai 82.0 % MMLU:ssa, ohittaen Gemini Flashin 77.9 %:n ja Claude Haikun 73.8 %:n pisteet. GPT-4o Mini saavutti 87.0 % matematiikassa ja koodauksessa MGSM:ssä, kun Gemini Flashin tulokset olivat 75.5 % ja Claude Haikun 71.7 %. HumanEvalissa, joka mittaa koodaussuorituskykyä, GPT-4o Mini sai 87.2 %, edellä Gemini Flashia 71.5 %:lla ja Claude Haikua 75.9 %:lla. Lisäksi GPT-4o Mini loistaa multimodaalisessa päättelyssä, saaen 59.4 % MMMU:ssa, kun Gemini Flashin luvut olivat 56.1 % ja Claude Haikun 50.2 %.
Konteksti-ikkuna: Suuremman kontekstiikkunan ansiosta malli voi tarjota johdonmukaisia ja yksityiskohtaisia vastauksia laajennettuihin kohtiin. GPT-4o Mini tarjoaa 128 16 tokenin kapasiteetin ja tukee jopa 200 4096 lähtötunnistetta pyyntöä kohti. Claude Haikulla on pidempi kontekstiikkuna, 1 4 merkkiä, mutta se palauttaa vähemmän tokeneita pyyntöä kohden, enintään XNUMX XNUMX merkkiä. Gemini Flash tarjoaa huomattavasti laajemman kontekstiikkunan, XNUMX miljoona tokenia. Tästä syystä Gemini Flashilla on etulyöntiasema GPT-XNUMXo Miniin verrattuna kontekstiikkunan suhteen.
Käsittelynopeus: GPT-4o Mini on nopeampi kuin muut mallit. Se käsittelee 15 miljoonaa merkkiä minuutissa, kun taas Claude Haiku käsittelee 1.26 miljoonaa merkkiä minuutissa ja Gemini Flash käsittelee 4 miljoonaa merkkiä minuutissa.
Hinnasto:: GPT-4o Mini on kustannustehokkaampi, ja sen hinta on 15 senttiä miljoonalta syöttötunnisteelta ja 60 senttiä miljoonalta tulostetunnisteelta. Claude Haiku maksaa 25 senttiä miljoonalta syöttötunnisteelta ja 1.25 dollaria miljoonalta vastaustokenilta. Gemini Flashin hinta on 35 senttiä miljoonalta syöttötunnisteelta ja 1.05 dollaria miljoonalta lähtötunnisteelta.
Käytettävyys:: GPT-4o Miniä voi käyttää Assistant API, Chat Completions APIja Erä-API. Claude Haiku on saatavilla Claude Pro -tilauksen kautta claude.ai, sen API, Amazonin kallioperäja Google Cloud Vertex AI. Gemini Flashin pääsee osoitteessa Google AI Studio ja integroitu sovelluksiin Google API:n kautta lisäsaatavuuden kanssa Google Cloud Vertex AI.

Tässä vertailussa GPT-4o Mini erottuu tasapainoisesta suorituskyvystään, kustannustehokkuudestaan ja nopeudestaan, mikä tekee siitä vahvan haastajan pienten multimodaalisten tekoälymallien maisemassa.

GPT-4o Mini vs. GPT-3.5 Turbo: Yksityiskohtainen vertailu

Tässä osiossa verrataan GPT-4o Miniä GPT-3.5 Turbo, OpenAI:n laajalti käytetty suuri multimodaalinen tekoälymalli.

Koko: Vaikka OpenAI ei ole paljastanut GPT-4o Minin ja GPT-3.5 Turbon parametrien tarkkaa määrää, tiedetään, että GPT-3.5 Turbo luokitellaan suureksi multimodaaliksi malliksi, kun taas GPT-4o Mini kuuluu pienten multimodaalien luokkaan. mallit. Tämä tarkoittaa, että GPT-4o Mini vaatii huomattavasti vähemmän laskentaresursseja kuin GPT-3.5 Turbo.
Modaalisuuden tuki: GPT-4o Mini ja GPT-3.5 Turbo tukevat teksti- ja kuvatehtäviä.
Suorituskyky: GPT-4o Mini näyttää merkittäviä parannuksia GPT-3.5 Turboon verrattuna useissa eri osissa Viitearvot kuten MMLU, GPQA, DROP, MGSM, MATH, HumanEval, MMMU ja MathVista. Se toimii paremmin tekstiälyssä ja multimodaalisessa päättelyssä, ylittäen jatkuvasti GPT-3.5 Turbon.
Konteksti-ikkunaGPT-4o Mini tarjoaa paljon pidemmän konteksti-ikkunan kuin GPT-3.5 Turbon 16K-tokenikapasiteetti, minkä ansiosta se pystyy käsittelemään laajempaa tekstiä ja tarjoamaan yksityiskohtaisia, yhtenäisiä vastauksia pidempiin osuuksiin.
KäsittelynopeusGPT-4o Mini käsittelee tokeneita vaikuttavalla 15 miljoonan tokeonin minuutissa nopeudella, mikä ylittää reilusti GPT-3.5 Turbon 4,650 XNUMX tokenia minuutissa.
Hinta: GPT-4o Mini on myös kustannustehokkaampi, yli 60 % halvempi kuin GPT-3.5 Turbo. Se maksaa 15 senttiä miljoonalta syöttötunnisteelta ja 60 senttiä miljoonalta tulostetunnisteelta, kun taas GPT-3.5 Turbon hinta on 50 senttiä miljoonalta syöttötunnisteelta ja 1.50 dollaria miljoonalta tulostetunnisteelta.
Lisäominaisuudet: OpenAI korostaa, että GPT-4o Mini ohittaa GPT-3.5 Turbon toimintokutsuissa, mikä mahdollistaa sujuvamman integroinnin ulkoisiin järjestelmiin. Lisäksi sen parannettu pitkän kontekstin suorituskyky tekee siitä tehokkaamman ja monipuolisemman työkalun erilaisiin tekoälysovelluksiin.

Bottom Line

OpenAI:n GPT-4o Minin lanseeraus edustaa strategista siirtymistä kohti kompaktimpia ja kustannustehokkaampia tekoälyratkaisuja. Tämä malli vastaa tehokkaasti suurten tekoälyjärjestelmien korkeiden käyttökustannusten ja energiankulutuksen haasteisiin. GPT-4o Mini loistaa suorituskyvyssä, prosessointinopeudessa ja kohtuuhintaisuudessa verrattuna kilpailijoihin, kuten Claude Haikuun ja Gemini Flashiin. Se osoittaa myös ylivoimaisia ominaisuuksia GPT-3.5 Turboon verrattuna, ja sillä on huomattavia etuja kontekstin käsittelyssä ja kustannustehokkuudessa. GPT-4o Minin parannetut toiminnot ja monipuolinen käyttö tekevät siitä vahvan valinnan kehittäjille, jotka etsivät tehokasta ja multimodaalista tekoälyä.

Seuraavaksi

LLM-käytön optimointi: vLLM PagedAttention ja tehokkaan tekoälyn tulevaisuus

Älä missaa

Luma AI:n unelmakone – Mullistava tekoälyvideon luominen

Tohtori Tehseen Zia

Dr. Tehseen Zia on vakinainen apulaisprofessori COMSATS University Islamabadissa, ja hänellä on tekoälyn tohtori Wienin teknillisestä yliopistosta, Itävallasta. Hän on erikoistunut tekoälyyn, koneoppimiseen, tietotieteeseen ja tietokonenäköön, ja hän on tehnyt merkittävän panoksen julkaisuilla arvostetuissa tieteellisissä aikakauslehdissä. Dr. Tehseen on myös johtanut erilaisia teollisia projekteja päätutkijana ja toiminut tekoälykonsulttina.

Unite.AI

GPT-4o Mini julkistettu: Kustannustehokas, tehokas vaihtoehto Claude Haikulle, Gemini Flashille ja GPT 3.5 Turbolle

GPT-4o Minin esittely:

GPT-4o Mini vs. Claude Haiku vs. Gemini Flash: pienten multimodaalisten AI-mallien vertailu

GPT-4o Mini vs. GPT-3.5 Turbo: Yksityiskohtainen vertailu

Bottom Line

Saatat pitää