Connect with us

Oznámení

Google představuje Gemini 3 Pro s výkonem, který překonává benchmarky

mm

Google dnes vydal Gemini 3 Pro, což je jeho nej pokročilejší AI model dosud, s rekordními benchmarky a novou agentic vývojovou platformou nazvanou Antigravity. Model dosahuje 1501 Elo na LMArena, čímž překonává Gemini 2.5 Pro s 1451 a zaujímá první místo napříč všemi hlavními AI hodnoceními.

Spuštění následuje po měsících očekávání v AI průmyslu, kdy model byl tiše spuštěn pro vybrané uživatele 22. října před veřejným oznámením. Google’s developer-focused release zdůrazňuje kódovací schopnosti a autonomní agentovu funkčnost, čímž společnost soutěží více agresivně s Claude’s kódovacím výkonem a OpenAI’s vývojovými nástroji.

Gemini 3 Pro podporuje kontextové okno o velikosti 1 milionu tokenů – přibližně 750 000 slov – se dvěma úrovněmi nabízejícími 200 000 a 1 milion tokenů pro různé použití. Model prokazuje výjimečné multimodální schopnosti, zpracovává text, obrázky, videa a audio s vylepšeným vizuálním rozlišením a grafickou generací. Integrace zahrnuje celý produktový ekosystém Google, včetně Workspace, Chrome a Android.

Rekordní výkon benchmarků

Gemini 3 Pro dosahuje 91,8% přesnosti na MMLU benchmarku, což je 5bodové zlepšení oproti Gemini 2.5 Pro s 89,5%. Model prokazuje zvláštní sílu při řešení otázek z více oborů, dosahující 92% při úkolech zahrnujících několik znalostních domén, zatímco Gemini 2.5 klesl na 65% při podobných výzvách.

Na kódovacích benchmarkách Gemini 3 Pro dosáhl 76,2% na SWE-bench Verified, což je výrazné překonání jeho předchůdce, ale zaostává za Claude 4.5 s 77,2%. Model vede leaderboard WebDev Arena s 1487 Elo, prokazující výjimečné webové vývojářské schopnosti. Na Terminal-Bench 2.0, který měří použití nástrojů a počítačové operace prostřednictvím terminálu, Gemini 3 Pro dosáhl 54,2%.

Model dodává přibližně 2x rychlejší inferenci než Gemini 2.5 Pro napříč velikostmi úkolů. Malé úkoly, jako 50řádkový Python skript, jsou dokončeny za 12 sekund oproti 25 sekundám, zatímco velké úkoly zahrnující 10 000 řádků dat jsou dokončeny za 15 minut a 30 sekund oproti 32 minutám a 15 sekundám dříve.

Google také představil Gemini 3 Deep Think mode, vylepšenou rozlišovací schopnost, která dodává vyšší výkon na náročných benchmarkách. Režim dosahuje 93,8% na GPQA Diamond (oproti 91,9% standard), 41,0% na Humanity’s Last Exam (oproti 37,5%), a bude k dispozici předplatitelům AI Ultra v následujících týdnech.

Antigravity platforma transformuje vývojářské pracovní postupy

Google spustil Antigravity, agentic vývojovou platformu poháněnou Gemini 3, umožňující autonomním agentům pracovat napříč kódovacími editory, terminály a prohlížeči současně. Platforma je posunem od tradiční nástrojové asistence k colaborativním modelům, kde agenti zajišťují podstatné vývojářské odpovědnosti.

Antigravity využívá několik AI modelů, včetně Gemini 3 Pro jako primárního rozlišovacího motoru, Gemini 2.5 Computer Use pro kontrolu prohlížeče a Nano Banana (Gemini 2.5 Image) pro editaci obrázků. Agenti mohou nezávisle plánovat a vykonávat složité vývojářské úkoly, zatímco ověřují svůj vlastní kód před prezentací výsledků.

Platforma supercharguje “vibe coding“, kde přirozený jazyk se stává primární syntaxí. Vývojáři mohou přeložit vysoké úrovně kreativních nápadů do plně interaktivních aplikací s jedinými výzvami, bez specifikace implementačních detailů. Tato funkčnost je podporována výjimečnými webovými vývojářskými skóre Gemini 3.

Agenti v Antigravity autonomně spravují budování funkcí, iteraci UI, opravu chyb, výzkum řešení a generování zpráv. Platforma je k dispozici pro veřejnou zkušební verzi zdarma napříč Mac, Windows a Linux, s integrační podporou pro Cursor, GitHub, JetBrains, Manus a Cline.

Firemní integrace a dopad na trh

Gemini 3 Pro je k dispozici předplatitelům Google AI Ultra a placeným uživatelům Gemini API. Model je vložen přímo do Google Search, dosahující 2 miliard měsíčních uživatelů AI Overviews, podle CEO Sundar Pichai. Firemní nasazení mohou získat přístup k modelu prostřednictvím Google AI Studio a Vertex AI.

Gemini aplikace obdržela aktualizace s novými rozhraními a vylepšenými agentovými schopnostmi, navržené speciálně pro Gemini 3. Tyto vylepšení позиcionují Google proti konkurenčním AI asistentům, zatímco využívají dominantní distribuční kanály společnosti.

Google’s release strategie zdůrazňuje přijetí vývojáři a firemní nasazení, s cílem na firemní zákazníky. Kombinace rekordních benchmarků, autonomních kódovacích schopností a široké ekosystémové integrace signalizuje společnost záměr udržet konkurenční pozici, zatímco AI modelové schopnosti konvergují napříč hlavními poskytovateli.

Spuštění přichází přibližně 11 měsíců po Gemini 2.0, což je významné zkrácení Google’s release časového plánu, zatímco soutěž se zintenzivňuje napříč AI průmyslem.

Alex McFarland je AI novinář a spisovatel, který zkoumá nejnovější vývoj v oblasti umělé inteligence. Spolupracoval s mnoha AI startupy a publikacemi po celém světě.