Yapay Zekâ

DeepMind’in Yeni AI’si Oyunları Oynarken Kuralları Öğreniyor

Yayınlandı 27 Aralık 2020

Güncellendi 25 Mayıs 2026

Yazan

Daniel Nelson

Alphabet’in yan kuruluşu DeepMind, oyunları oynarken kuralları öğrenmeye 能 olan bir AI sistemi geliştirdi. DeepMind daha önce Satranç, Shogi, Go ve video oyunları gibi oyunları ustaca oynayabilen AI modelleri yaratmıştı, ancak bu modellere önceden oyun kurallarının verilmesi gerekiyordu. Bu nedenle, DeepMind’in yeni AI’si, önceki AI algoritmalarına göre önemli bir ilerleme temsil ediyor.

AI Sistemi – MuZero

DeepMind, yeni AI sistemini nasıl çalıştırdığını Nature dergisinde yayınlanan bir makalede açıkladı. Yeni AI, “look-ahead search” ilkesine dayanarak oyunları oynarken kuralları öğrenmeye 能 olan MuZero olarak adlandırıldı. Engadget’in raporuna göre, MuZero, look-ahead search kullanarak hangi hamlelerin yapılacağını belirler.

Oyunlar gibi satrançta yapılabilecek tüm hamleleri düşünerek, MuZero öncelikli olarak en olası ve ilgili hamleleri belirler. MuZero, başarılı ve başarısız manevralardan da öğrenir. Tüm olası faktörleri modellemek yerine, sadece karar için en ilgili faktörleri dikkate alır. MuZero, potansiyel değişkenlerin çokluğunu, karar için en önemli özelliklere indirger. Bu özellikler, bir ağaç tabanlı arama algoritmasında temsil edilir. Ağacın içindeki olanaklar, test ortamının özelliklerine dayanan öğrenilen bir modelle birleştirilir. Look-ahead search, ortamın en ilgili yönleri belirlendikten sonra yapılır.

Karar verme aşamasında üç faktör dikkate alınır.

MuZero, önceki seçimin sonucunu, şu anki konumunu ve next adımlarını dikkate alır. Bu yaklaşım, DeepMind’in daha önce kullandığı temel look-ahead search ve ağaç tabanlı modelleri geride bırakır. MuZero, AlphaZero kadar satranç, shogi ve Go’da iyi performans gösterir ve Ms. Pac-Man oyununda sadece altı veya yedi hamle düşünerek iyi bir performans sergiler. DeepMind, MuZero’nun yeteneklerini, hamle yapmadan önce gerçekleştirebileceği simülasyon sayısını sınırlayarak da test etti. Genel olarak, programa daha fazla zaman verildiğinde, daha iyi performans gösterdi.

DeepMind’in baş araştırma bilimcisi David Silver, TechXplore’a göre, MuZero’nun, ilk kez bir AI modelinin kendi ortam kurallarını oluşturabildiği ve bu kuralları kullanarak planlar yapabildiği belirtti.

“İlk kez, gerçekten bir sisteme sahip olduğumuz için, dünyanın nasıl çalıştığını anlamak ve satranç gibi oyunlar için önce görülen sofistike look-ahead planlamayı yapabilen bir sistemimiz var” dedi Silver. “(MuZero) Hiçbir şeyden başlayabilir ve sadece deneme yanılma yoluyla, hem dünya kurallarını keşfedebilir hem de süper insan performansını elde edebilir.”

Mümkün Uygulamalar

Gerçekten de bir görevin kısıtlamalarını öğrenip bu kısıtlamalar içinde çalışabilen bir AI, birçok olası uygulama alanı sahiptir. MuZero, video sıkıştırma gibi, AI kullanarak otomatikleştirilmesiHistorik olarak zor olan görevler için kullanılabilir. MuZero, yaklaşık %5’lik bir sıkıştırma iyileştirmesi elde etti. Bu, Google ve YouTube tarafından barındırılan çok sayıda video için önemli olabilir. Videoların ötesinde, DeepMind aynı zamanda MuZero tekniklerini protein mimari tasarımı ve robotik programlama için de kullanmayı düşünüyor.

Southampton Üniversitesi’nden Bilgisayar Bilimi profesörü Wendy Hall, MuZero’nun pekiştirmeli öğrenme algoritmaları için “önemli bir adım” olduğunu belirtti. Ancak Hall, bu algoritmaların yanlış kullanılmasından endişe ediyor. Örneğin, ABD Hava Kuvvetleri, MuZero’nun erken araştırma makalelerini referans göstererek, U-2 casus uçaklarından füzeler fırlatabilecek bir AI sistemi oluşturdu. Bu, DeepMind’in araştırmacılarının, algoritmalarının hiçbir ölümcül silah için kullanılmaması gerektiğini belirten Öldürücü Otonom Silahlar Taahhüdüne imza atmalarına rağmen gerçekleşti.

David Silver, DeepMind’in geleceğe bakarak, beyin kadar güçlü ve esnek algoritmalar geliştirmeyi hedeflediğini açıkladı. Esnek, güçlü algoritmalar oluşturmanın ilk adımı, bir sistemin zeki olmasının ne anlama geldiğini anlamaktır ve zeka, karmaşık bir ortamın kalıplarını ve kurallarını ayırt etme yetisiyle bağlantılıdır. DeepMind, geleceğe bakıyor, beyin kadar güçlü ve esnek algoritmalar geliştirmeyi hedefliyor, ilk adım ise bir sistemin zeki olmasının ne anlama geldiğini anlamak ve zeka, karmaşık bir ortamın kalıplarını ve kurallarını ayırt etme yetisiyle bağlantılı.

Daniel Nelson

Blog yazarı ve programcı, Machine Learning ve Deep Learning konularında uzmanlık sahibi. Daniel, başkalarının AI'nin gücünü sosyal fayda için kullanmasına yardımcı olmak umudu taşıyor.

Unite.AI

DeepMind’in Yeni AI’si Oyunları Oynarken Kuralları Öğreniyor

AI Sistemi – MuZero

Mümkün Uygulamalar

You may like