Yapay Zeka
Claude 3.7 Sonnet, Anthropic'in Yapay Zeka Dirilişidir

Anthropic yayınlandı Claude 3.7 Sonesi, çok beklenen bir yükseltme büyük dil modeli (LLM) Aile. Şirketin "bugüne kadarki en akıllı modeli" ve piyasadaki ilk hibrit akıl yürütme yapay zekası olarak tanıtılan Claude 3.7 Sonnet, selefine göre bazı önemli geliştirmeler sunuyor (Claude 3.5 Sonesi) hız, muhakeme ve gerçek dünya görev performansında.
Bu lansman, OpenAI ve xAI gibi rakiplerin son dönemdeki hızlı ilerlemeleri sırasında gerçekleşti. Grok 3, birçok AI tutkununun (ben de dahil) bu lansmanı Anthropic'in son yeniliklere cevabı olarak görmesine yol açtı. Yeni model, hızlı konuşma cevaplarını daha derin analitik düşünceyle tek bir sistemde harmanlamayı hedefliyor - bize AI ile gelecekteki etkileşimin nasıl görüneceğini gösterebilecek birleşik bir yaklaşım.
Sevilen Yapay Zeka Asistanına Uzun Zamandır Beklenen Yükseltme
Birçok düzenli AI kullanıcısı için Claude 3.5 Sonnet zaten başvurulacak bir araçtı. Piyasadaki en iyilerden biri olarak görülüyordu. Ancak son aylarda Anthropic artan bir baskıyla karşı karşıyaydı. AI endüstrisi yeni özellikler ve modellerle çılgına döndü - OpenAI'nin ChatGPT'si ses, çok adımlı akıl yürütme yetenekleri kazandı ve derin araştırma. Grok 3, gerçek zamanlı X verileriyle ve diğer platformlarla ilk kez piyasaya sürüldü şaşkınlık ve İkizler burcu sürümleri gelmeye devam etti. Birçok gözlemci Anthropic'in geride kalmaya başladığını fark etmeye başladı. Topluluk, yeni bir Claude modelinin her an gelebileceği beklentisiyle Anthropic'in yanıtını merakla bekliyordu.
Claude 3.7 Sonnet sonunda bu beklentileri karşılamak için geldi. Küçük bir değişiklikten ziyade Claude 3.5'ten önemli bir sıçrama. Anthropic bunu kapsamlı bir yükseltme olarak tanıtıyor: daha hızlı, daha akıllı ve daha çok yönlü.
Modelin hızı ve çıktı kalitesi çarpıcı. Kendi testlerimde, son versiyona kıyasla inanılmaz hızlı olduğunu, uzun metin girişlerini neredeyse anında işlediğini gördüm. Anthropic'in yavaş güncelleme döngüsü göz önüne alındığında, 3.7 sürümü uzun zamandır beklenen bir telafi gibi görünüyor geri almak Claude'un yapay zeka yarışındaki konumu. Claude 3.7, kullanıcıların Claude 3.5'i sevmesini sağlayan şeyi -pratik görevlerde olağanüstü performans- ikiye katlarken, kaputun altında yenilikçi akıl yürütme yetenekleri ekliyor.
Hibrit Akıl Yürütme: Hızlı Cevaplar ve Derin Düşünme Bir Arada
Claude 3.7 Sonnet'in başlık özelliği karma akıl yürütme yeteneğidir. Basitçe ifade etmek gerekirse, bu model iki modda çalışabilir: neredeyse anında yanıtlar için standart bir mod ve sorunları adım adım ele alarak çözümünü gösterdiği yeni bir "genişletilmiş düşünme" modu. düşünce zinciri kullanıcıya
Anthropic, ayrı bir Claude muhakeme sürümü yayınlamak yerine, hızlı ve derin düşünmeyi tek bir yapay zekada birleştirdi. "İnsanlar hem hızlı tepkiler hem de derin düşünme için tek bir beyin kullandığı gibi, biz de muhakemenin ayrı bir model olmaktan ziyade bütünleşik bir yetenek olması gerektiğine inanıyoruz." Şirket açıklamasında şunları söyledi: duyuruKusursuz bir kullanıcı deneyimi için bütünleşik bir yaklaşımın önemini vurguluyor.
Pratikte bu, kullanıcıların ne zaman hızlı bir cevap istediklerine ve ne zaman Claude'un uzun uzadıya düşünmesine izin vereceklerine karar verebilecekleri anlamına gelir. Basit bir geçiş, bir soru ayrıntılı analiz veya çok adımlı mantık gerektiriyorsa genişletilmiş moda geçmenizi sağlar. Standart modda, Claude 3.7 Sonnet, 3.5'in geliştirilmiş bir versiyonu gibi çalışır - daha hızlı ve daha rafine, ancak tanıdık hızlı konuşma tarzıyla. Genişletilmiş modda, AI cevap vermeden önce "kendi kendine düşünür", daha doğru veya karmaşık çözümlere ulaşmak için muhakeme sürecini dahili olarak yazar (ve görünür hale getirir).
Düşünce zinciri ekranda adım adım kayıyor; bu özellik diğer gelişmiş yapay zeka sistemlerinde popüler hale geldi ve sonunda Claude'a da geldi.

Alex McFarland/Unite AI
Anthropic'in felsefesi burada kasıtlı olarak bazı rakipleriyle çelişiyor. Örneğin OpenAI, bazıları için kafa karıştırıcı olan ayrı modeller veya modlar sundu. Claude 3.7'nin hepsi bir arada yaklaşımı, kullanıcılar için işleri basitleştirmeyi amaçlıyor. Modlar arasında geçiş yapmak basit ve hızlı stil aynı kalıyor. Güçlü kullanıcılar, AI'nın ne kadar düşüneceğini bile ince ayarlayabilir: API aracılığıyla geliştiriciler, akıl yürütme için bir belirteç bütçesi belirleyebilir ve Claude'a bir cevabı sonlandırmadan önce ne kadar düşünmesi gerektiğini (sadece birkaç adımdan devasa 128k belirteçli bir düşünce sürecine kadar) söyleyebilir. Bu ayrıntılı kontrol, talep üzerine hızdan ödün verip titizlik sağlamayı sağlar.
Claude 3.7 Sonnet'teki Temel İyileştirmeler:
Claude 3.7 Sonnet’te gördüğümüz başlıca gelişmelerden bazıları şunlardır:
- Hibrit Muhakeme Modları – Hem anında yanıtlar hem de yapay zekanın görünür akıl yürütmeyle sorunları adım adım ele aldığı Genişletilmiş Düşünme modu sunar. Kullanıcılar sorgu başına modu seçerek hızlı sohbeti ve derin analizi tek bir sistemde birleştirir.
- Birleşik Model Felsefesi – Kullanım kolaylığı için hızlı ve yansıtıcı düşünmeyi tek bir AI "beyninde" bütünleştirir. Bu, birden fazla model veya eklenti gerektiren rakiplerle tezat oluşturarak son kullanıcı için karmaşıklığı azaltır.
- Hız ve Duyarlılık – Claude 3.5'ten daha hızlı yanıtlar sunar. İlk testler standart modda gözle görülür derecede daha hızlı performans göstermektedir.
- Genişletilmiş Düşünme Kontrolü – Kullanıcılar, API aracılığıyla AI'nın muhakeme uzunluğunu (128,000 token'a kadar) ihtiyaç duyulduğunda hız ile kalite arasında denge kurmak için sınırlayabilir veya uzatabilir. Bu, genişletilmiş modun yalnızca gerektiği kadar kullanılmasını sağlar.
- Gerçek Dünya Görev Odaklı – Şirkete göre, Claude 3.7'nin eğitimi, zorlu matematik Olimpiyat bulmacaları yerine pratik iş ve yaratıcı görevlere kaydırıldı. Model, günlük problem çözme ve yaygın kullanım durumlarını yansıtan görevlerde mükemmeldir.
- Kodlama ve Araç Kullanımı – Özellikle ön uç web geliştirme olmak üzere programlama görevlerinde daha güçlü performans. Anthropic, hatta bir yardımcı araç bile başlattı, Claude KoduGeliştiricilerin Claude'u komut satırından kod yazmak ve düzeltmek için kullanmalarına olanak tanıyan . İlk kıyaslamalar, Claude 3.7'nin gerçek yazılım sorunlarını çözmede listelerde zirveye çıktığını gösteriyor.
Yapay Zeka Kullanıcıları İçin Sınırlamalar ve Sırada Ne Var?
Tüm heyecana rağmen, Claude 3.7 Sonnet sınırsız değil ve tüm yapay zeka zorlukları için sihirli bir çözüm değil. Birincisi, Anthropic bu modeli eğitirken belirli alanları bilinçli olarak önemsizleştirdi. Daha günlük iş görevleri lehine "matematik ve bilgisayar bilimi rekabet sorunları için biraz daha az optimize ettiler". Bu, Claude 3.7'nin kesinlikle matematik ve kodlama sorularını çözebilmesine rağmen (genellikle 3.5'ten daha iyi), her akademik ölçüt veya bulmacada liderlik tablosunun en üstünde olmayabileceği anlamına gelir. İhtiyaçları karmaşık matematik kanıtlarına veya özel kodlama yarışmalarına yönelen kullanıcılar, Claude'un cevaplarının iki kez kontrol edilmesini gerektiren veya o niş için ayarlanmış bir rakibin modelinin daha iyi performans gösterdiği alanlar bulabilirler. Anthropic bu takası kabul etmiş gibi görünüyor ve modeli teorik beceriden ziyade pratik faydaya hedefliyor.
Ek olarak, Genişletilmiş Düşünme modu güçlü olsa da, bazı karmaşıklıklar getirir. Standart moddan doğası gereği daha yavaştır; AI derin düşüncelerdeyken, kullanıcılar muhakemesinde çalışırken kısa bir duraklama fark edeceklerdir. Bu beklenen bir durumdur - hızdan titizliğe geçiş - ancak bu, kullanıcıların gerçekten bu ekstra güce ne zaman ihtiyaç duyduklarına karar vermeleri gerektiği anlamına gelir. Birçok günlük sohbet sorgusunda, standart mod yeterli olacak ve daha verimli olacaktır. Ayrıca, genişletilmiş muhakemenin bazen aşırıya kaçabileceği ve gerçekten ihtiyacınız olandan çok daha fazlasını sağlayabileceği gerçeği de vardır. Bazı durumlarda, bu bunaltabilir veya yoldan çıkabilir. Anthropic'in, AI'nın fikirlerle "büyük oynama" isteğinin alakalı ve konuyla ilgili kalmasını sağlaması gerekecektir. Kullanıcılar, kontrolden çıkan teğetleri engellemek için daha kesin bir şekilde istemde bulunmayı veya belirteç sınırları belirlemeyi öğrenebilirler.
Alt çizgi
Claude 3.7 Sonnet'in yayınlanması, Anthropic'in OpenAI, Google/DeepMind ve xAI gibi yeni oyuncularla birlikte oyunda olduğunun bir ifadesidir. AI meraklıları ve geliştiricileri için, hibrit mantığıyla benzersiz bir değişiklik sunan, deneyebilecekleri başka bir üst düzey model daha ekler.
Rekabetçi AI sektöründe, Anthropic'in son hamlesi şirketlerin modellerini nasıl konumlandıracağını da etkileyebilir. Büyük bir model boyutu sıçraması veya gösterişli çok modlu bir demo yapmamayı seçerek, bunun yerine kullanıcı deneyimi (modların birleştirilmesi, hız, pratik kullanım durumları) Anthropic, kullanılabilirlik ve güvenilirliğe odaklanmış bir niş oluşturuyor.
Genel olarak, Claude 3.7 Sonnet, Anthropic için önemli bir an. Şirketin topluluğun ihtiyaçlarından ders çıkardığını gösteren Claude serisinin bir evrimi - zayıflıkları ele alırken güçlü yanları ikiye katlıyor. Hala izlenecek alanlar var (ve tahmin edilecek gelecekteki Claude yinelemeleri) ancak bu sürüm açıkça Anthropic'in kullanıcı tabanını yeniden canlandırdı.












