Connect with us

Google presenterar Gemini 3 Pro med prestanda som slår alla rekord

Meddelanden

Google presenterar Gemini 3 Pro med prestanda som slår alla rekord

mm

Google släppte Gemini 3 Pro idag, vilket markerar deras mest avancerade AI-modell hittills med rekordbrytande benchmarkresultat och en ny agentic utvecklingsplattform som kallas Antigravity. Modellen får 1501 Elo på LMArena, och överträffar därmed Gemini 2.5 Pros 1451 och tar den främsta platsen över alla stora AI-utvärderingsmetoder.

Lanseringen följer månader av förväntan inom AI-branschen, med modellen som tyst rullades ut till utvalda användare den 22 oktober innan den offentliga tillkännagivandet. Googles utvecklartillvänta version betonar kodningsförmågor och autonom agentfunktionalitet, och positionerar företaget för att konkurrera mer aggressivt med Claudes kodningsprestanda och OpenAIs utvecklingsverktyg.

Gemini 3 Pro stöder en kontextfönster på 1 miljon token – ungefär 750 000 ord – med två nivåer som erbjuder 200K och 1M token för olika användningsfall. Modellen visar exceptionella multimodala förmågor, bearbetar text, bilder, video och ljud med förbättrad visuell resonemang och grafisk generering. Integrationen omfattar Googles produkt ekosystem, inklusive Workspace, Chrome och Android.

Rekordbrytande benchmarkprestanda

Gemini 3 Pro uppnår 91,8 % noggrannhet på MMLU-benchmarken, en 5-punkts förbättring jämfört med Gemini 2.5 Pros 89,5 %. Modellen visar särskild styrka på tvärvetenskapliga frågor, med 92 % på uppgifter som omfattar flera kunskapsområden, medan Gemini 2.5 sjönk till 65 % på liknande utmaningar.

På kodspecifika benchmarkresultat fick Gemini 3 Pro 76,2 % på SWE-bench Verified, och överträffade därmed sin föregångare men föll efter Claude 4.5:s 77,2 %. Modellen toppar WebDev Arena-ledaren med 1487 Elo, och visar exceptionella webbutvecklingsförmågor. På Terminal-Bench 2.0, som mäter verktygsanvändning och datoranvändning via terminal, uppnådde Gemini 3 Pro 54,2 %.

Modellen levererar ungefär 2x snabbare inferens än Gemini 2.5 Pro över alla uppgiftsstorlekar. Små uppgifter som 50-raders Python-skript slutförs på 12 sekunder jämfört med 25 sekunder, medan stora uppgifter som involverar 10 000 datarader slutförs på 15 minuter och 30 sekunder jämfört med 32 minuter och 15 sekunder tidigare.

Google introducerade också Gemini 3 Deep Think-läge, en förbättrad resonemangsförmåga som levererar högre prestanda på utmanande benchmarkresultat. Läget uppnår 93,8 % på GPQA Diamond (jämfört med 91,9 % standard), 41,0 % på Humanitys Last Exam (jämfört med 37,5 %), och kommer att finnas tillgängligt för AI Ultra-prenumeranter inom de kommande veckorna.

Antigravity-plattformen förändrar utvecklarnas arbetsflöden

Google lanserade Antigravity, en agentic utvecklingsplattform som drivs av Gemini 3, som möjliggör autonomt agenter att fungera över kodredigerare, terminaler och webbläsare samtidigt. Plattformen är en förändring från traditionell verktygsbaserad assistans till samarbetsmodeller där agenter hanterar betydande utvecklingsansvar.

Antigravity använder flera AI-modeller, inklusive Gemini 3 Pro som dess primära resonemangsmotor, Gemini 2.5 Computer Use för webbläsarstyrning och Nano Banana (Gemini 2.5 Image) för bildredigering. Agenter kan oberoende planera och utföra sofistikerade utvecklingsuppgifter medan de validerar sin egen kod innan de presenterar resultaten.

Plattformen ger extra kraft till “vibe-coding“, där naturligt språk blir den primära syntaxen. Utvecklare kan översätta högnivåkreativa idéer till fullt interaktiva applikationer med enkla prompter, utan att ange implementationsdetaljer. Denna funktionality stöds av Gemini 3:s exceptionella webbutvecklingspoäng.

Agenter i Antigravity hanterar autonomt byggnadsfunktioner, UI-iteration, felsökning, lösningssökning och rapportgenerering. Plattformen är tillgänglig för offentlig förhandsvisning utan kostnad över Mac, Windows och Linux, med integrationsstöd för Cursor, GitHub, JetBrains, Manus och Cline.

Företagsintegration och marknadsinverkan

Gemini 3 Pro är tillgänglig för Google AI Ultra-prenumeranter och betalda Gemini API-användare. Modellen infogas direkt i Google Sök, och når företagets 2 miljarder månatliga AI-översiktsanvändare, enligt VD Sundar Pichai. Företagsdistributioner kan komma åt modellen via Google AI Studio och Vertex AI.

Gemini-appen fick uppdateringar med nya gränssnitt och förbättrade agentförmågor som är speciellt utformade för Gemini 3. Dessa förbättringar positionerar Google mot konkurrerande AI-assistenter samtidigt som de utnyttjar företagets dominerande distributionskanaler.

Googles lanseringsstrategi betonar utvecklarantagande och företagsdistribution, med prissättning och prestanda som riktar sig mot företagskunder. Kombinationen av rekordbrytande benchmarkresultat, autonom kodningsförmåga och bred ekosystemintegration signalerar företagets avsikt att upprätthålla konkurrenskraftig positionering när AI-modellförmågor konvergerar över alla stora leverantörer.

Lanseringen sker ungefär 11 månader efter Gemini 2.0, en betydande komprimering av Googles lanseringstidslinje när konkurrensen intensifieras inom AI-branschen.

Alex McFarland är en AI-journalist och författare som utforskar de senaste utvecklingarna inom artificiell intelligens. Han har samarbetat med många AI-startups och publikationer över hela världen.