Yapay Zekâ
LLM’ler Akıl Yürütme Yapmıyorlar – Sadece Planlama Konusunda Çok İyiler
Büyük dil modelleri (LLM’ler) gibi OpenAI’nin o3, Google’ın Gemini 2.0 ve DeepSeek’in R1 kompleks problemleri çözmekte, insan benzeri metin oluşturmekte ve hatta kod yazmakta önemli ilerleme kaydettiler. Bu gelişmiş LLM’ler, kompleks problemleri analiz etme ve çözme yetenekleri nedeniyle souvent olarak “akıl yürütme modelleri” olarak adlandırılırlar. Ancak bu modeller gerçekten “akıl yürütme” mi yapıyorlar, yoksa sadece “planlama” konusunda çok iyiler mi? Bu ayrım ince ancak önemlidir ve LLM’lerin yetenekleri ve sınırları hakkında nasıl düşündüğümüz için büyük sonuçları vardır.
Bu ayrımı anlamak için, iki senaryoyu karşılaştıralım:
- Akıl Yürütme: Bir dedektif bir suç araştırması yapıyor ve çelişkili kanıtları bir araya getirmeli, hangilerinin yanlış olduğunu belirlemeli ve sınırlı kanıtlara dayanarak bir sonuca varmalıdır. Bu süreç, çıkarım, çelişki çözümü ve soyut düşünme içerir.
- Planlama: Bir satranç oyuncusu rakibini checkmate etmek için en iyi hamle dizisini hesaplıyor.
Her iki süreç de birden fazla adıma sahiptir, ancak dedektif derin akıl yürütme yaparak çıkarımlar yapar, çelişkileri değerlendirir ve genel ilkeleri belirli bir duruma uygular. Satranç oyuncusu ise esas olarak planlama yaparak, optimal bir hamle dizisini seçer. LLM’ler, göreceğimiz gibi, satranç oyuncusuna daha çok benzerler.
Akıl Yürütme ve Planlama Arasındaki Farkı Anlamak
LLM’lerin neden planlama konusunda daha iyi olduklarını anlamak için, önce akıl yürütme ve planlama arasındaki farkı anlamak önemlidir. Akıl yürütme, verilen öncüllerden yeni sonuçlar çıkarmak için mantık ve çıkarımı içeren bir süreçtir. Çelişkileri tanımlamayı ve düzeltmeyi, yeni bilgiler üretmeyi, belirsiz durumlar için kararlar almayı ve neden-sonuç ilişkileri ve karşıt gerçeklik düşüncesi gibi “Ne olurdu?” senaryolarını içerir.
Planlama ise, belirli bir hedefi gerçekleştirmek için bir dizi eylemi yapılandırmaya odaklanır. Karmaşık görevleri daha küçük adımlara ayırma, bilinen problem çözme stratejilerini izleme, önceden öğrenilen kalıpları benzer problemlere uyarlama ve yapılandırılmış dizileri takip etme yerine yeni bilgiler üretmeyi içerir. Her iki akıl yürütme ve planlama da adım adım işlemler içerse de, akıl yürütme daha derin bir soyutlama ve çıkarımı gerektirirken, planlama kurulmuş prosedürlere uyarak yeni bilgiler üretmez.
LLM’lerin “Akıl Yürütme”ye Yaklaşımı
Modern LLM’ler, OpenAI’nin o3 ve DeepSeek-R1 gibi, problem çözme yeteneklerini geliştirmek için Zincir Düşünce (CoT) akıl yürütme tekniğini kullanıyorlar. Bu yöntem, modellerin problemleri ara adımlara ayırmasını teşvik ederek, insanların bir problemi mantıksal olarak düşünme şeklini taklit ediyor. Nasıl çalıştığını görmek için, basit bir matematik problemi düşünün:
Eğer bir mağaza elma başına 2 dolarlık bir fiyata sahipse, ancak 5’ten fazla elma satın alırsanız her elma için 1 dolarlık bir indirim sunarsa, 7 elma ne kadara mal olur?
Tipik bir LLM, CoT yönergeleri kullanarak bunu çözebilir:
- Düzenli fiyatı belirle: 7 * 2 = 14.
- İndirimin geçerli olduğunu belirle (7 > 5 olduğu için).
- İndirimi hesapla: 7 * 1 = 7.
- İndirimi toplamdan çıkar: 14 – 7 = 7.
Ara adımları açıkça belirleyerek, model bir defada cevap tahmin etme girişiminden kaynaklanan hataların olasılığını en aza indirir. Bu adım adım ayrıştırma, LLM’lerin akıl yürütme gibi görünmesini sağlar, ancak aslında yapılandırılmış problem çözme, bir tarifi takip etmek gibi bir şeydir. Öte yandan, gerçek bir akıl yürütme süreci, genel bir kuralı tanıyabilir: Eğer indirim 5 elmadan fazla olduğunda geçerliyse, her elma 1 dolarlık bir fiyata sahiptir. Bir insan, böyle bir kuralı hemen çıkarabilir, ancak bir LLM bunu yapamaz, çünkü sadece yapılandırılmış bir hesap dizisini takip eder.
Zincir Düşünce Akıl Yürütme Değil, Planlamadır
Zincir Düşünce (CoT), mantık odaklı görevlerde ve kodlama zorluklarında LLM’lerin performansını geliştirdi, ancak gerçek mantıksal akıl yürütme içermez. Bu, CoT’nin prosedürel bilgiye dayanması, yapılandırılmış adımları takip etmesi ve yeni bilgiler üretmemesinden kaynaklanır. Ayrıca, neden-sonuç ilişkileri ve soyut ilişkiler hakkında gerçek bir anlayışa sahip değildir, bu da modelin karşıt gerçeklik düşüncesi veya hipotetik durumları düşünmesini engeller. Ayrıca, CoT, önceden öğrenilen kalıpların ötesinde yaklaşımını değiştiremez, bu da yaratıcı olarak akıl yürütme veya alışılmadık senaryolarda uyum sağlama yeteneğini sınırlar.
LLM’lerin Gerçek Akıl Yürütme Makinelerine Dönüşmesi İçin Neler Gerekir?
LLM’lerin gerçekten insan gibi akıl yürütmeleri için neye ihtiyaçları var? İşte bu konuda iyileşmeleri gereken bazı ana alanlar ve bunları başarmak için potansiyel yaklaşımlar:
- Sembolik Anlama: İnsanlar, soyut semboller ve ilişkilerle akıl yürütürler. LLM’ler ise gerçek bir sembolik akıl yürütme mekanizması eksikliği yaşar. Sembolik AI veya formal mantık sistemleriyle nöral ağların birleştirildiği hibrit modelleri entegre etmek, onların gerçek akıl yürütme yeteneklerini geliştirebilir.
- Neden-Sonuç Çıkarımı: Gerçek akıl yürütme, neden-sonuç ilişkilerini anlama gerektirir, sadece istatistiksel korelasyonlar değil. Bir model akıl yürütürse, veri rather than yalnızca bir sonraki tokenı tahmin etmek için veri altındaki ilkeleri çıkarmalıdır. Neden-sonuç ilişkilerini açıkça modelleyen neden-sonuç AI araştırmaları, LLM’lerin planlamadan akıl yürütmeye geçişine yardımcı olabilir.
- Kendini Yansıtma ve Metabiliş: İnsanlar, düşüncelerini sürekli olarak değerlendirirler, “Bu sonuç mantıklı mı?” diye sorarlar. LLM’ler ise kendi çıktılarını eleştirebilecek bir mekanizmaya sahip değiller. Kendi çıktılarını eleştirebilen modeller inşa etmek, gerçek akıl yürütme yönünde bir adım olabilir.
- Ortak Anlama ve Sezgi: LLM’ler geniş bilgi erişimine sahip olsalar da, temel ortak akıl yürütme konusunda sık sık zorluk yaşarlar. Bu, gerçek dünya deneyimlerine sahip olmadıkları ve insanların hemen fark edebileceği saçmalıkları tanımakta güçlük çektikleri için olur. Ayrıca, gerçek dünya dinamiklerini karar alma süreçlerine dahil etme yoluna sahip değillerdir. Bunu geliştirmek için, gerçek dünya algı girdisini entegre eden veya modelin dünyayı insanların gördüğü şekilde daha iyi anlamasını sağlayan bir ortak akıl motoru inşa etmek olabilir.
- Karşıt Gerçeklik Düşüncesi: İnsan akıl yürütmesi souvent olarak “şeyler farklı olsaydı” gibi senaryoları içerir. LLM’ler bu tür “ne olurdu” senaryolarıyla mücadele ederler, çünkü yalnızca eğitim verilerine bağlı kalırlar. Modellerin insanların bu durumları düşündüğü gibi düşünmeleri için, hipotetik senaryoları simüle etmeleri, değişkenlerin sonuçları nasıl etkileyebileceğini anlamaları ve yeni bilgiler üretmeleri gerekir. Ayrıca, farklı olasılıkları test etme ve yeni bilgiler üretme yeteneğine sahip olmalıdırlar, yalnızca gördükleri şeyleri tahmin etmek yerine.
Sonuç
LLM’ler akıl yürütme gibi görünse de, aslında karmaşık problemleri çözmek için planlama tekniklerine güveniyorlar. Bir matematik problemi çözerken veya mantıksal çıkarımlar yaparken, esas olarak bilinen kalıpları yapılandırılmış bir şekilde organize ediyorlar, bu kalıpların arkasındaki ilkeleri derinlemesine anlamıyorlar. Bu ayrım, AI araştırmalarında kritiktir, çünkü gelişmiş planlamayı gerçek akıl yürütmeyle karıştırırsak, AI’nin gerçek yeteneklerini abartma riski taşırız.
Gerçek akıl yürütme AI’sine ulaşmak için, token tahmini ve olasılıksal planlamadan öte fundamental ilerlemeler gerekecek. Sembolik mantık, neden-sonuç anlama ve metabiliş alanlarında atılımlar gerekecek. O zamana kadar, LLM’ler yapılandırılmış problem çözme için güçlü araçlar olarak kalacaklar, ancak gerçekten insan gibi düşünmeyecekler.












