Connect with us

Kecerdasan buatan

Claude 3.7 Sonnet adalah Kebangkitan AI Anthropic

mm

Anthropic telah merilis Claude 3.7 Sonnet, sebuah peningkatan yang sangat dinantikan untuk model bahasa besar (LLM) keluarganya. Dijuluki sebagai “model paling cerdas hingga saat ini” dan AI alasan hibrida pertama di pasar, Claude 3.7 Sonnet memperkenalkan beberapa peningkatan besar atas pendahulunya (Claude 3.5 Sonnet) dalam kecepatan, alasan, dan kinerja tugas dunia nyata. 

Peluncuran ini datang di tengah kemajuan pesat dari pesaing seperti OpenAI dan xAI baru-baru ini Grok 3, menyebabkan banyak penggemar AI (termasuk saya) melihat peluncuran ini sebagai jawaban Anthropic atas inovasi baru-baru ini. Model baru ini bertujuan untuk menggabungkan jawaban konversasi yang cepat dengan pemikiran analitis yang lebih dalam dalam satu sistem – sebuah pendekatan terpadu yang dapat menunjukkan kepada kita apa yang akan terlihat seperti interaksi dengan AI di masa depan. 

Peningkatan yang Dinantikan untuk Asisten AI yang Dicintai

Bagi banyak pengguna AI biasa, Claude 3.5 Sonnet sudah menjadi alat andalan. Ini dianggap sebagai salah satu yang terbaik di luar sana. Namun, dalam beberapa bulan terakhir Anthropic menghadapi tekanan yang meningkat. Industri AI telah gila dengan fitur dan model baru – OpenAI’s ChatGPT mendapatkan suara, kemampuan alasan multi-langkah, dan penelitian mendalam. Grok 3 membuat debutnya dengan data X waktu nyata, dan platform lain seperti Perplexity dan Gemini terus merilis. Banyak pengamat mulai memperhatikan bahwa Anthropic mulai ketinggalan. Komunitas telah dengan sabar menunggu respons Anthropic, dengan harapan bahwa model Claude baru akan segera dirilis.

Claude 3.7 Sonnet akhirnya tiba untuk memenuhi harapan tersebut. Ini adalah lompatan besar dari Claude 3.5, bukan sekedar penyempurnaan kecil. Anthropic mempromosikannya sebagai peningkatan komprehensif: lebih cepat, lebih pintar, dan lebih serbaguna.

Kecepatan dan kualitas output model ini sangat mencolok. Dalam tes saya sendiri, saya menemukan bahwa ini sangat cepat dibandingkan dengan versi sebelumnya, memproses input teks panjang hampir secara instan. Mengingat siklus pembaruan Anthropic yang lambat, rilis 3.7 terasa seperti pengejaran yang lama ditunggu-tunggu yang mengembalikan posisi Claude di perlombaan AI. Claude 3.7 menggandakan apa yang membuat pengguna mencintai Claude 3.5 – kinerja luar biasa dalam tugas praktis – sambil menambahkan kemampuan alasan inovatif di bawah kap.

Alasan Hibrida: Jawaban Cepat dan Pemikiran Mendalam dalam Satu

Fitur utama dari Claude 3.7 Sonnet adalah kemampuan alasan hibridanya. Dalam istilah sederhana, model ini dapat beroperasi dalam dua mode: mode standar untuk jawaban hampir instan, dan mode “pemikiran diperpanjang” baru di mana ia bekerja melalui masalah langkah demi langkah, menunjukkan rantai pemikiran kepada pengguna.

Bukannya merilis edisi alasan Claude terpisah, Anthropic telah menggabungkan baik jawaban cepat dan pemikiran reflektif dalam satu AI. “Sama seperti manusia menggunakan satu otak untuk jawaban cepat dan refleksi mendalam, kami percaya bahwa alasan harus menjadi kemampuan terintegrasi… bukan model terpisah,” perusahaan menjelaskan dalam pengumuman, menekankan pendekatan terpadu untuk pengalaman pengguna yang mulus.

Dalam prakteknya, ini berarti pengguna dapat memutuskan kapan mereka ingin jawaban cepat dan kapan untuk membiarkan Claude berdeliberasi lebih lama. Toggle sederhana memungkinkan Anda beralih ke mode diperpanjang jika pertanyaan memerlukan analisis terperinci atau logika multi-langkah. Dalam mode standar, Claude 3.7 Sonnet berfungsi seperti versi yang ditingkatkan dari 3.5 – lebih cepat dan lebih halus, tetapi dengan gaya konversasi yang akrab. Dalam mode diperpanjang, AI “mereflksikan” sebelum menjawab, menulis proses alasan internal (dan membuatnya terlihat) untuk mencapai solusi yang lebih akurat atau kompleks.

Rantai pemikiran bergulir langkah demi langkah di layar, fitur yang telah menjadi populer di sistem AI lain yang canggih dan sekarang akhirnya hadir di Claude.

Alex McFarland/Unite.AI

Filosofi Anthropic di sini sengaja kontras dengan beberapa pesaing. OpenAI, misalnya, telah menawarkan model atau mode terpisah, yang beberapa orang temukan membingungkan untuk diatasi. Pendekatan all-in-one Claude 3.7 dimaksudkan untuk menyederhanakan hal-hal untuk pengguna. Beralih antara mode sangat sederhana, dan gaya prompt tetap sama. Pengguna yang kuat bahkan dapat menyesuaikan seberapa banyak AI berpikir: melalui API, pengembang dapat menetapkan anggaran token untuk alasan, mengatakan kepada Claude seberapa lama untuk merenungkan (dari beberapa langkah hingga proses pemikiran 128k-token yang besar) sebelum menjawab. Kontrol granular ini memungkinkan satu untuk memperdagangkan kecepatan untuk ketepatan sesuai kebutuhan.

Peningkatan Utama di Claude 3.7 Sonnet:

Berikut beberapa peningkatan utama yang kita lihat dari Claude 3.7 Sonnet:

  • Mode Alasan Hibrida – Menawarkan jawaban instan dan mode Pemikiran Diperpanjang di mana AI bekerja melalui masalah langkah demi langkah dengan alasan yang terlihat. Pengguna memilih mode per kueri, menggabungkan obrolan cepat dan analisis mendalam dalam satu sistem.
  • Filsafat Model Terpadu – Mengintegrasikan pemikiran cepat dan reflektif dalam satu AI “otak” untuk kemudahan penggunaan. Ini kontras dengan pesaing yang memerlukan model atau plugin terpisah, mengurangi kompleksitas untuk pengguna akhir.
  • Kecepatan dan Responsivitas – Menyampaikan jawaban lebih cepat daripada Claude 3.5. Tes awal menunjukkan kinerja yang lebih gesit dalam mode standar.
  • Kontrol Pemikiran Diperluas – Melalui API, pengguna dapat membatasi atau memperpanjang panjang alasan AI (hingga 128.000 token) untuk menyeimbangkan kecepatan vs kualitas sesuai kebutuhan. Ini memastikan mode diperpanjang digunakan hanya sebanyak yang diperlukan.
  • Fokus Tugas Dunia Nyata – Menurut perusahaan, pelatihan Claude 3.7 diarahkan pada tugas bisnis praktis dan kreatif daripada teka-teki olimpiade matematika yang sulit. Model ini unggul dalam pemecahan masalah sehari-hari dan tugas yang mencerminkan kasus penggunaan umum.
  • Pengkodean dan Penggunaan Alat – Kinerja yang lebih kuat dalam tugas pengkodean, terutama pengembangan web front-end. Anthropic bahkan meluncurkan alat pendamping, Claude Code, yang memungkinkan pengembang menggunakan Claude dari baris perintah untuk menulis dan memperbaiki kode. Benchmarks awal menunjukkan Claude 3.7 memuncaki grafik dalam memecahkan masalah perangkat lunak nyata.

Batasan dan Apa yang Berikutnya untuk Pengguna AI

Meskipun semua kegembiraan, Claude 3.7 Sonnet tidak tanpa batasan, dan ini bukanlah peluru ajaib untuk semua tantangan AI. Untuk satu, Anthropic secara sadar mengurangi beberapa domain dalam pelatihan model ini. Mereka “mengoptimalkan sedikit untuk masalah kompetisi matematika dan ilmu komputer” demi tugas bisnis sehari-hari. Ini berarti bahwa meskipun Claude 3.7 dapat memecahkan pertanyaan matematika dan kode (sering lebih baik daripada 3.5), mungkin tidak menduduki puncak daftar setiap benchmark akademis atau teka-teki. Pengguna yang kebutuhannya condong ke arah bukti matematika kompleks atau kontes kode khusus mungkin masih menemukan area di mana jawaban Claude memerlukan pemeriksaan ganda atau di mana model pesaing yang disesuaikan untuk niche tersebut melakukan lebih baik. Anthropic tampaknya telah menerima trade-off ini, dengan mengarahkan model ke utilitas praktis daripada kekuatan teoretis.

Selain itu, Mode Pemikiran Diperpanjang, meskipun kuat, memperkenalkan beberapa kompleksitas. Ini secara inheren lebih lambat daripada mode standar; ketika AI sedang berpikir mendalam, pengguna akan melihat jeda singkat saat ia bekerja melalui proses alasan. Ini diharapkan – menukar kecepatan untuk ketepatan – tetapi ini berarti pengguna harus memutuskan kapan mereka benar-benar membutuhkan kekuatan tambahan. Dalam banyak kueri obrolan sehari-hari, mode standar akan memadai dan lebih efisien. Ada juga kenyataan bahwa alasan diperpanjang dapat kadang-kadang berlebihan dan memberikan lebih dari yang sebenarnya dibutuhkan. Dalam beberapa kasus, ini bisa membingungkan atau menyimpang dari topik. Anthropic perlu memastikan bahwa kemampuan AI untuk “mengambil langkah besar” dengan ide tetap relevan dan on-topik. Pengguna mungkin belajar untuk memicu lebih presisi atau menetapkan batasan token untuk menghindari tangens yang tidak terkendali.

Ringkasan

Peluncuran Claude 3.7 Sonnet adalah pernyataan bahwa Anthropic sangat berada dalam permainan bersama OpenAI, Google/DeepMind, dan pemain baru seperti xAI. Untuk penggemar dan pengembang AI, ini menambahkan model top-tier lain untuk bereksperimen, satu yang menawarkan twist unik dengan alasan hibridanya.

Dalam industri AI yang kompetitif, langkah terbaru Anthropic mungkin juga mempengaruhi bagaimana perusahaan memosisikan model mereka. Dengan tidak melakukan lompatan besar dalam ukuran model atau demo multi-modal yang canggih, tetapi malah menyempurnakan pengalaman pengguna (penggabungan mode, kecepatan, kasus penggunaan praktis), Anthropic memotong niche yang berfokus pada kemudahan penggunaan dan keandalan. 

Secara keseluruhan, Claude 3.7 Sonnet adalah momen penting bagi Anthropic. Ini adalah evolusi dari seri Claude yang menunjukkan bahwa perusahaan belajar dari kebutuhan komunitas – menggandakan kekuatan sambil mengatasi kelemahan. Masih ada area untuk diperhatikan (dan iterasi Claude masa depan untuk diantisipasi), tetapi rilis ini telah jelas menghidupkan kembali basis pengguna Anthropic. 

Alex McFarland adalah seorang jurnalis dan penulis AI yang menjelajahi perkembangan terbaru dalam kecerdasan buatan. Ia telah berkolaborasi dengan berbagai startup dan publikasi AI di seluruh dunia.