Entre em contato

Google revela o Gemini 3 Pro com desempenho que quebra recordes de benchmark.

Anúncios

Google revela o Gemini 3 Pro com desempenho que quebra recordes de benchmark.

mm

O Google lançou hoje o Gemini 3 Pro, seu modelo de IA mais avançado até o momento, com resultados de benchmarks recordes e uma nova plataforma de desenvolvimento de agentes chamada Antigravity. O modelo alcança 1501 pontos Elo no LMArena., superando os 1451 pontos do Gemini 2.5 Pro e conquistando a primeira posição nas principais métricas de avaliação de IA.

O lançamento ocorre após meses de expectativa na indústria de IA, com o modelo sendo disponibilizado discretamente para usuários selecionados em 22 de outubro, antes do anúncio público. Lançamento do Google voltado para desenvolvedores A empresa enfatiza as capacidades de programação e a funcionalidade de agentes autônomos, posicionando-a para competir de forma mais agressiva com o desempenho de programação de Claude e as ferramentas de desenvolvimento da OpenAI.

O Gemini 3 Pro suporta uma janela de contexto de 1 milhão de tokens — aproximadamente 750,000 palavras — com dois níveis oferecendo 200 mil e 1 milhão de tokens para diferentes casos de uso. O modelo demonstra capacidades multimodais excepcionais, processando texto, imagens, vídeo e áudio com raciocínio visual e geração gráfica aprimorados. A integração abrange todo o ecossistema de produtos do Google, incluindo Workspace, Chrome e Android.

Uma nova era da inteligência artificial com Gemini 3

Desempenho de referência que quebrou recordes

O Gemini 3 Pro alcança 91.8% de precisão no benchmark MMLU, uma melhoria de 5 pontos percentuais em relação aos 89.5% do Gemini 2.5 Pro. O modelo demonstra particular força em questões interdisciplinares, atingindo 92% em tarefas que abrangem múltiplos domínios de conhecimento, enquanto o Gemini 2.5 caiu para 65% em desafios semelhantes.

Em benchmarks específicos para programação, o Gemini 3 Pro obteve 76.2% no SWE-bench Verified, superando significativamente seu antecessor, mas ficando atrás dos 77.2% do Claude 4.5. O modelo lidera o ranking do WebDev Arena com 1487 pontos Elo, demonstrando capacidades excepcionais para desenvolvimento web. No Terminal-Bench 2.0, que mede o uso de ferramentas e a operação do computador via terminal, o Gemini 3 Pro alcançou 54.2%.

O modelo oferece inferência aproximadamente 2 vezes mais rápida que o Gemini 2.5 Pro em tarefas de diferentes tamanhos. Tarefas pequenas, como scripts Python de 50 linhas, são concluídas em 12 segundos, em vez de 25 segundos, enquanto tarefas grandes, envolvendo 10,000 linhas de dados, são finalizadas em 15 minutos e 30 segundos, comparado aos 32 minutos e 15 segundos anteriores.

O Google também apresentou o modo Gemini 3 Deep Think, uma capacidade de raciocínio aprimorada que oferece desempenho superior em benchmarks desafiadores. O modo alcançou 93.8% no GPQA Diamond (contra 91.9% no padrão), 41.0% no Humanity's Last Exam (contra 37.5%) e estará disponível para assinantes do AI Ultra nas próximas semanas.

Plataforma Antigravidade Transforma Fluxos de Trabalho de Desenvolvedores

O Google lançou o Antigravity, uma plataforma de desenvolvimento baseada em agentes, impulsionada pelo Gemini 3, que permite que agentes autônomos operem simultaneamente em editores de código, terminais e navegadores. A plataforma representa uma mudança em relação à assistência tradicional baseada em ferramentas, para modelos colaborativos nos quais os agentes assumem responsabilidades substanciais de desenvolvimento.

O Antigravity utiliza múltiplos modelos de IA, incluindo o Gemini 3 Pro como seu principal mecanismo de raciocínio, o Gemini 2.5 Computer Use para controle do navegador e o Nano Banana (Gemini 2.5 Image) para edição de imagens. Os agentes podem planejar e executar tarefas de desenvolvimento complexas de forma independente, validando seu próprio código antes de apresentar os resultados.

A plataforma potencializa “codificação de vibraçãoonde a linguagem natural se torna a sintaxe principal. Os desenvolvedores podem traduzir ideias criativas de alto nível em aplicativos totalmente interativos com comandos simples, sem precisar especificar detalhes de implementação. Essa funcionalidade é suportada pelas excepcionais pontuações de desenvolvimento web do Gemini 3.

Os agentes do Antigravity gerenciam de forma autônoma o desenvolvimento de funcionalidades, a iteração da interface do usuário, a correção de bugs, a pesquisa de soluções e a geração de relatórios. A plataforma está disponível para pré-visualização pública gratuita para Mac, Windows e Linux, com suporte para integração com Cursor, GitHub, JetBrains, Manus e Cline.

Integração empresarial e impacto no mercado

O Gemini 3 Pro está disponível para assinantes do Google AI Ultra e usuários pagos da API Gemini. O modelo é incorporado diretamente à Busca do Google, alcançando os 2 bilhões de usuários mensais do AI Overviews da empresa, segundo o CEO Sundar Pichai. Implantações corporativas podem acessar o modelo por meio do Google AI Studio e do Vertex AI.

O aplicativo Gemini recebeu atualizações com novas interfaces e recursos aprimorados para o agente, projetados especificamente para o Gemini 3. Essas melhorias posicionam o Google em relação aos assistentes de IA concorrentes, ao mesmo tempo que aproveitam os canais de distribuição dominantes da empresa.

A estratégia de lançamento do Google enfatiza a adoção por desenvolvedores e a implementação empresarial, com preços e desempenho direcionados a clientes corporativos. A combinação de benchmarks recordes, recursos de codificação autônoma e ampla integração ao ecossistema sinaliza a intenção da empresa de manter sua posição competitiva à medida que os recursos de modelos de IA convergem entre os principais fornecedores.

O lançamento ocorre aproximadamente 11 meses após o Gemini 2.0, uma compressão significativa no cronograma de lançamentos do Google, à medida que a concorrência se intensifica no setor de IA.

Alex McFarland é um jornalista e escritor de IA que explora os mais recentes desenvolvimentos em inteligência artificial. Ele colaborou com inúmeras startups e publicações de IA em todo o mundo.