Kunstmatige intelligentie

GPT-4o Mini onthuld: een kostenefficiënte, high-performance alternatief voor Claude Haiku, Gemini Flash en GPT 3.5 Turbo

mm

OpenAI, een leider in het schalen van Generative Pre-trained Transformer (GPT)-modellen, heeft nu GPT-4o Mini geïntroduceerd, waarmee het een stap zet naar compacte AI-oplossingen. Deze stap adresseert de uitdagingen van grote-schaal AI, waaronder hoge kosten en energievretende training, en positioneert OpenAI om te concurreren met rivalen zoals Google en Claude. GPT-4o Mini biedt een efficiëntere en betaalbaardere benadering van multimodale AI. Dit artikel zal onderzoeken wat GPT-4o Mini onderscheidt door het te vergelijken met Claude Haiku, Gemini Flash en OpenAI’s GPT-3.5 Turbo. We zullen deze modellen evalueren op basis van zes sleutelfactoren: modale ondersteuning, prestaties, contextvenster, verwerkingssnelheid, prijs en toegankelijkheid, die cruciaal zijn voor het kiezen van het juiste AI-model voor verschillende toepassingen.

GPT-4o Mini onthuld:

GPT-4o Mini is een compact multimodaal AI-model met tekst- en visie-intelligentiecapaciteiten. Hoewel OpenAI geen specifieke details over de ontwikkelingsmethode heeft gedeeld, bouwt GPT-4o Mini voort op de basis van de GPT-serie. Het is ontworpen voor kostenefficiënte en laag-latentie-toepassingen. GPT-4o Mini is nuttig voor taken die het ketenen of parallelizeren van meerdere modelaanroepen, het omgaan met grote volumes aan context en het bieden van snelle, real-time tekstantwoorden vereisen. Deze functies zijn bijzonder essentieel voor het bouwen van toepassingen zoals retrieval augment generation (RAG)-systemen en chatbots.

Sleutelfuncties van GPT-4o Mini omvatten:

  • Een contextvenster van 128K tokens
  • Ondersteuning voor maximaal 16K outputtokens per aanvraag
  • Verbeterd omgaan met niet-Engelse tekst
  • Kennis tot oktober 2023

GPT-4o Mini vs. Claude Haiku vs. Gemini Flash: een vergelijking van kleine multimodale AI-modellen

Deze sectie vergelijkt GPT-4o Mini met twee bestaande kleine multimodale AI-modellen: Claude Haiku en Gemini Flash. Claude Haiku, gelanceerd door Anthropic in maart 2024, en Gemini Flash, geïntroduceerd door Google in december 2023 met een bijgewerkte versie 1.5 uitgebracht in mei 2024, zijn significante concurrenten.

  • Modale ondersteuning: Zowel GPT-4o Mini als Claude Haiku ondersteunen momenteel tekst- en beeldcapaciteiten. OpenAI plant om in de toekomst audio- en videosupport toe te voegen. In tegenstelling tot Gemini Flash, dat al tekst, beeld, video en audio ondersteunt.
  • Prestaties: OpenAI-onderzoekers hebben GPT-4o Mini getest tegen Gemini Flash en Claude Haiku over verschillende belangrijke metrics. GPT-4o Mini presteert consistent beter dan zijn rivalen. In redeneertaken met tekst en visie scoorde GPT-4o Mini 82,0% op MMLU, voorbij Gemini Flash met 77,9% en Claude Haiku met 73,8%. GPT-4o Mini behaalde 87,0% in wiskunde en codering op MGSM, in vergelijking met Gemini Flash met 75,5% en Claude Haiku met 71,7%. Op HumanEval, dat de coderingsprestaties meet, scoorde GPT-4o Mini 87,2%, voorbij Gemini Flash met 71,5% en Claude Haiku met 75,9%. Bovendien blinkt GPT-4o Mini uit in multimodale redenering, met een score van 59,4% op MMMU, in vergelijking met 56,1% voor Gemini Flash en 50,2% voor Claude Haiku.
  • Contextvenster: Een groter contextvenster stelt een model in staat om samenhangende en gedetailleerde antwoorden te geven over langere passages. GPT-4o Mini biedt een capaciteit van 128K tokens en ondersteunt maximaal 16K outputtokens per aanvraag. Claude Haiku heeft een langer contextvenster van 200K tokens, maar retourneert minder tokens per aanvraag, met een maximum van 4096 tokens. Gemini Flash heeft een aanzienlijk groter contextvenster van 1 miljoen tokens. Dus Gemini Flash heeft een voordeel ten opzichte van GPT-4o Mini op het gebied van contextvenster.
  • Verwerkingssnelheid: GPT-4o Mini is sneller dan de andere modellen. Het verwerkt 15 miljoen tokens per minuut, terwijl Claude Haiku 1,26 miljoen tokens per minuut verwerkt en Gemini Flash 4 miljoen tokens per minuut verwerkt.
  • Prijs: GPT-4o Mini is kostenefficiënter, met een prijs van 15 cent per miljoen inputtokens en 60 cent per miljoen outputtokens. Claude Haiku kost 25 cent per miljoen inputtokens en $1,25 per miljoen responstokens. Gemini Flash is geprijsd op 35 cent per miljoen inputtokens en $1,05 per miljoen outputtokens.
  • Toegankelijkheid: GPT-4o Mini kan worden benaderd via de Assistants API, Chat Completions API en Batch API. Claude Haiku is beschikbaar via een Claude Pro-abonnement op claude.ai, zijn API, Amazon Bedrock en Google Cloud Vertex AI. Gemini Flash kan worden benaderd op Google AI Studio en geïntegreerd in toepassingen via de Google API, met extra beschikbaarheid op Google Cloud Vertex AI.

In deze vergelijking onderscheidt GPT-4o Mini zich met zijn evenwichtige prestaties, kostenefficiëntie en snelheid, waardoor het een sterke concurrent is in het landschap van kleine multimodale AI-modellen.

GPT-4o Mini vs. GPT-3.5 Turbo: een gedetailleerde vergelijking

Deze sectie vergelijkt GPT-4o Mini met GPT-3.5 Turbo, OpenAI’s breed gebruikte grote multimodale AI-model.

  • Grootte: Hoewel OpenAI de exacte aantal parameters voor GPT-4o Mini en GPT-3.5 Turbo niet heeft onthuld, is het bekend dat GPT-3.5 Turbo een groot multimodaal model is, terwijl GPT-4o Mini valt onder de categorie van kleine multimodale modellen. Dit betekent dat GPT-4o Mini aanzienlijk minder rekenkracht vereist dan GPT-3.5 Turbo.
  • Modale ondersteuning: GPT-4o Mini en GPT-3.5 Turbo ondersteunen tekst- en beeldgerelateerde taken.
  • Prestaties: GPT-4o Mini toont aanzienlijke verbeteringen ten opzichte van GPT-3.5 Turbo in verschillende benchmarks zoals MMLU, GPQA, DROP, MGSM, MATH, HumanEval, MMMU en MathVista. Het presteert beter in tekstuele intelligentie en multimodale redenering, waarbij het consistent GPT-3.5 Turbo overtreft.
  • Contextvenster: GPT-4o Mini biedt een veel langer contextvenster dan GPT-3.5 Turbo’s 16K token-capaciteit, waardoor het meer uitgebreide tekst kan omgaan en gedetailleerde, samenhangende antwoorden kan geven over langere passages.
  • Verwerkingssnelheid: GPT-4o Mini verwerkt tokens met een indrukwekkende snelheid van 15 miljoen tokens per minuut, ver overstijgend GPT-3.5 Turbo’s 4.650 tokens per minuut.
  • Prijs: GPT-4o Mini is ook kostenefficiënter, meer dan 60% goedkoper dan GPT-3.5 Turbo. Het kost 15 cent per miljoen inputtokens en 60 cent per miljoen outputtokens, terwijl GPT-3.5 Turbo 50 cent per miljoen inputtokens en $1,50 per miljoen outputtokens kost.
  • Aanvullende capaciteiten: OpenAI benadrukt dat GPT-4o Mini GPT-3.5 Turbo overtreft in functieaanroepen, waardoor een soepelere integratie met externe systemen mogelijk is. Bovendien maakt zijn verbeterde lange-contextprestaties het een efficiënter en veelzijdiger instrument voor verschillende AI-toepassingen.

De bottom line

OpenAI’s introductie van GPT-4o Mini vertegenwoordigt een strategische verschuiving naar compactere en kostenefficiëntere AI-oplossingen. Dit model adresseert effectief de uitdagingen van hoge operationele kosten en energieverbruik die samenhangen met grote-schaal AI-systemen. GPT-4o Mini blinkt uit in prestaties, verwerkingssnelheid en betaalbaarheid in vergelijking met concurrenten zoals Claude Haiku en Gemini Flash. Het toont ook superieure capaciteiten ten opzichte van GPT-3.5 Turbo, met aanzienlijke voordelen in contextbehandeling en kostenefficiëntie. GPT-4o Mini’s verbeterde functionaliteit en veelzijdige toepassing maken het een sterke keuze voor ontwikkelaars die op zoek zijn naar high-performance, multimodale AI.

Dr. Tehseen Zia is een gewaardeerd associate professor aan de COMSATS University Islamabad, met een PhD in AI van de Vienna University of Technology, Oostenrijk. Hij specialiseert zich in Artificial Intelligence, Machine Learning, Data Science en Computer Vision, en heeft significante bijdragen geleverd met publicaties in gerenommeerde wetenschappelijke tijdschriften. Dr. Tehseen heeft ook verschillende industriële projecten geleid als hoofdonderzoeker en heeft gediend als AI-consultant.