Connect with us

Yapay Zekâ

AI, Minecraft’i Taklit Öğrenimi Yoluyla Ustalaşmada Güçlük Çekiyor

mm

Son birkaç ayda, Microsoft ve diğer şirketler, makine öğrenimi araştıran AI geliştiricileri takımlarına, Minecraft oynayabilen ve oyun içinde bir elmas bulabilen bir AI sistemi oluşturmayı挑dıkları bir yarışma düzenledi. BBC’nin haberine göre, AI platformları satranç ve go gibi oyunları domine etmeyi başarmış olsa da, Minecraft’te bir görevi ustalaşmada güçlük çekiyor.

Microsoft’un Minecraft tabanlı AI yarışması MineRL olarak adlandırıldı ve yarışma sonuçları最近 NeurIPS konferansında resmi olarak açıklandı. Yarışmanın amacı, bir AI’ı “taklit öğrenimi” yaklaşımı ile eğitmekti. Taklit öğrenimi, bir AI’ın gözlem yoluyla eğitildiği bir yöntemdir. Taklit öğrenimi, AI sistemlerinin insanlara belirli eylemleri yaparken izleyerek öğrenmelerini ve gözlem yoluyla öğrenmelerini amaçlar. Taklit öğrenimi, pekiştirme öğrenimi ile karşılaştırıldığında, çok daha az hesaplama gücü gerektiren ve podstat olarak daha verimli bir AI eğitimi yöntemidir.

Pekiştirme öğrenimi genellikle bir görevi etkili bir şekilde öğrenmek için birçok güçlü bilgisayar ağının bir araya gelmesi ve yüzlerce veya binlerce saatlik eğitimi gerektirir. Buna karşılık, taklit öğrenimi yöntemi ile eğitilen bir AI, çok daha kısa sürede eğitilebilir, çünkü AI, insan operatörlerden önce gelen bir temel bilgi birikimine sahiptir.

Taklit öğrenimi, AI’ı güvenli bir şekilde keşfedebilmesi için doğru eylemleri öğrenmesi gereken senaryolarda pratik uygulamalara sahiptir. Bu senaryolar arasında, bir otonom aracın eğitimi bulunur, çünkü araç, istenilen davranışları öğrenene kadar sokakta dolaşmasına izin verilemez. İnsan demonstratörün verilerini kullanarak aracı eğitmek, süreci daha hızlı ve daha güvenli hale getirebilir.

Minecraft’te bir elmas bulmak, birçok adımdan oluşur, Örneğin, aletler yapmak için ağaçları kesmek, elmasların bulunduğu mağaraları keşfetmek ve mağarada gerçekten bir elmas bulmak. Görevin karmaşıklığına rağmen, oyunu bilen bir insan oyuncusu, yaklaşık 20 dakika içinde bir elmas bulabilmelidir.

Yarışmaya 660’dan fazla farklı AI ajanı katıldı, ancak hiçbir AI, bir elmas bulmayı başaramadı. AI’ı eğitmek için sağlanan veriler, birçok insan oyuncusundan toplanan 60 milyondan fazla oyun karesi içeren bir veri setini içeriyordu. Elmasların konumları, oyun örneğinin başladığında rastgele belirlenir, bu nedenle AI’lar, insan oyuncularının elmasları bulduğu yerlere bakamaz. Başka bir deyişle, AI’lar, aletler yapmak, aletler kullanmak, keşfetmek ve kaynakları bulmak gibi kavramların nasıl bağlantılı olduğunu anlamak zorundadır.

Hiçbir AI ajanının başarılı bir şekilde bir elmas bulamamasına rağmen, organizasyon ekibi, yarışma sonuçlarından memnun kaldı ve deneyden çok şey öğrenildi. AI takımlarının yaptığı araştırmalar, AI alanını ilerletmeye yardımcı olabilir ve pekiştirme öğrenimi stratejilerine alternatifler bulabilir.

Pekiştirme öğrenimi genellikle taklit öğrenimine göre üstün performans gösterir, pekiştirme öğreniminin nổi bật bir başarısı da DeepMind’in AlphaGo’sudur. Ancak, daha önce de belirtildiği gibi, pekiştirme öğrenimi büyük ölçekli bilgisayar işlemcilerine ihtiyaç duyar, bu da büyük ölçekli bilgisayar işlemcilerine sahip olmayan organizasyonların kullanımını sınırlar.

Carnegie Mellon Üniversitesi’nden PhD öğrencisi ve yarışmanın baş organizatörü William Guss, BBC’ye şunları söyledi: “Sorunlara büyük ölçekli işlem gücü uygulamak, bu alanda ilerlemeyi sağlamak için doğru yol olmayabilir… Doğrudan, bu pekiştirme öğrenimi sistemlerine erişimi demokratikleştirmeye karşı çalışır ve komplex ortamlarda ajanları eğitmek yeteneğini, büyük ölçekli bilgisayar işlemcilerine sahip şirketlere bırakır.”

Blog yazarı ve programcı, Machine Learning ve Deep Learning konularında uzmanlık sahibi. Daniel, başkalarının AI'nin gücünü sosyal fayda için kullanmasına yardımcı olmak umudu taşıyor.