Connect with us

Pengumuman

Google Memperkenalkan Gemini 3 Pro dengan Kinerja yang Membuat Rekor

mm

Google hari ini merilis Gemini 3 Pro, menandai model AI paling canggih mereka hingga saat ini dengan benchmark yang memecahkan rekor dan platform pengembangan agenik baru yang disebut Antigravity. Model ini mencetak 1501 Elo pada LMArena, melampaui Gemini 2.5 Pro dengan 1451 dan menduduki posisi teratas di seluruh metrik evaluasi AI utama.

Peluncuran ini mengikuti bulan-bulan antisipasi di industri AI, dengan model ini secara diam-diam diluncurkan ke pengguna terpilih pada 22 Oktober sebelum pengumuman publik. Rilis yang berfokus pada pengembang dari Google menekankan kemampuan pengkodean dan fungsionalitas agen otonom, memposisikan perusahaan untuk bersaing lebih agresif dengan kinerja pengkodean Claude dan alat pengembangan OpenAI.

Gemini 3 Pro mendukung jendela konteks 1 juta token—sekitar 750.000 kata—dengan dua tingkat yang menawarkan 200K dan 1M token untuk berbagai kasus penggunaan. Model ini menunjukkan kemampuan multimodal yang luar biasa, memproses teks, gambar, video, dan audio dengan alasan visual dan generasi grafik yang ditingkatkan. Integrasi meliputi ekosistem produk Google, termasuk Workspace, Chrome, dan Android.

Kinerja Benchmark yang Membuat Rekor

Gemini 3 Pro mencapai akurasi 91,8% pada benchmark MMLU, perbaikan 5 poin dari Gemini 2.5 Pro dengan 89,5%. Model ini menunjukkan kekuatan khusus pada pertanyaan antar disiplin, mencetak 92% pada tugas yang meliputi beberapa domain pengetahuan, sedangkan Gemini 2.5 turun ke 65% pada tantangan serupa.

Pada benchmark pengkodean khusus, Gemini 3 Pro mencetak 76,2% pada SWE-bench Verified, secara signifikan mengungguli pendahulunya tetapi sedikit di bawah Claude 4.5 dengan 77,2%. Model ini menduduki posisi teratas pada leaderboard WebDev Arena dengan 1487 Elo, menunjukkan kemampuan pengembangan web yang luar biasa. Pada Terminal-Bench 2.0, yang mengukur penggunaan alat dan operasi komputer melalui terminal, Gemini 3 Pro mencapai 54,2%.

Model ini memberikan inferensi sekitar 2x lebih cepat daripada Gemini 2.5 Pro di seluruh ukuran tugas. Tugas kecil seperti skrip Python 50 baris selesai dalam 12 detik versus 25 detik, sedangkan tugas besar yang melibatkan 10.000 baris data selesai dalam 15 menit 30 detik dibandingkan dengan 32 menit 15 detik sebelumnya.

Google juga memperkenalkan mode Deep Think Gemini 3, kemampuan alasan yang ditingkatkan yang memberikan kinerja yang lebih tinggi pada benchmark yang menantang. Mode ini mencetak 93,8% pada GPQA Diamond (versus 91,9% standar), 41,0% pada Humanity’s Last Exam (versus 37,5%), dan akan tersedia untuk pelanggan AI Ultra dalam beberapa minggu mendatang.

Platform Antigravity Mengubah Alur Kerja Pengembang

Google meluncurkan Antigravity, platform pengembangan agenik yang ditenagai oleh Gemini 3, memungkinkan agen otonom untuk beroperasi di seluruh editor kode, terminal, dan browser secara bersamaan. Platform ini merupakan pergeseran dari asisten berbasis alat tradisional ke model kolaboratif di mana agen menangani tanggung jawab pengembangan yang substansial.

Antigravity menggunakan beberapa model AI, termasuk Gemini 3 Pro sebagai mesin alasan utama, Gemini 2.5 Computer Use untuk kontrol browser, dan Nano Banana (Gemini 2.5 Image) untuk pengeditan gambar. Agen dapat merencanakan dan mengeksekusi tugas pengembangan yang kompleks secara mandiri sambil memvalidasi kode mereka sebelum menyajikan hasil.

Platform ini memperkuat “vibe coding,” di mana bahasa alami menjadi sintaks utama. Pengembang dapat menerjemahkan ide kreatif tingkat tinggi menjadi aplikasi interaktif lengkap dengan prompt tunggal, tanpa menentukan detail implementasi. Fungsi ini didukung oleh skor pengembangan web Gemini 3 yang luar biasa.

Agen di Antigravity mengelola pembangunan fitur, iterasi UI, perbaikan bug, penelitian solusi, dan generasi laporan secara otonom. Platform ini tersedia untuk pratayang publik tanpa biaya di Mac, Windows, dan Linux, dengan dukungan integrasi untuk Cursor, GitHub, JetBrains, Manus, dan Cline.

Integrasi Perusahaan dan Dampak Pasar

Gemini 3 Pro tersedia untuk pelanggan Google AI Ultra dan pengguna Gemini API berbayar. Model ini terintegrasi langsung ke Google Search, mencapai 2 miliar pengguna AI Overviews bulanan perusahaan, menurut CEO Sundar Pichai. Penerapan perusahaan dapat mengakses model ini melalui Google AI Studio dan Vertex AI.

Aplikasi Gemini menerima pembaruan yang menampilkan antarmuka baru dan kemampuan agen yang ditingkatkan, dirancang khusus untuk Gemini 3. Peningkatan ini memposisikan Google melawan asisten AI yang bersaing sambil memanfaatkan saluran distribusi yang dominan.

Strategi peluncuran Google menekankan adopsi pengembang dan penerapan perusahaan, dengan harga dan kinerja yang ditargetkan pada pelanggan korporat. Kombinasi benchmark yang memecahkan rekor, kemampuan pengkodean otonom, dan integrasi ekosistem yang luas menandakan niat perusahaan untuk mempertahankan posisi kompetitif saat kemampuan model AI berkumpul di seluruh penyedia utama.

Alex McFarland adalah seorang jurnalis dan penulis AI yang menjelajahi perkembangan terbaru dalam kecerdasan buatan. Ia telah berkolaborasi dengan berbagai startup dan publikasi AI di seluruh dunia.