Connect with us

Google’ın AI’sı köpekleri izleyerek robotlara nasıl hareket edeceklerini öğretiyor

Yapay Zekâ

Google’ın AI’sı köpekleri izleyerek robotlara nasıl hareket edeceklerini öğretiyor

mm

Hatta günümüzde en gelişmiş robotların bile hareketleri biraz hantal ve sıçrayışlıdır. Robotların daha gerçekçi ve akıcı bir şekilde hareket etmelerini sağlamak için Google’daki araştırmacılar, gerçek hayvanların hareketlerinden öğrenme yeteneğine sahip bir AI sistemi geliştirdiler. Google araştırma ekibi, yaklaşımını geçen hafta sonlarında yayımladıkları bir ön baskı makalesinde detaylandırdı. Makalede ve eşlik eden blog gönderisinde, araştırma ekibi sistemi anlatıyor. Makale yazarları, robotlara daha doğal hareket kazandırmak, gerçek dünya görevlerini gerçekleştirmelerine yardımcı olabileceğine inanıyor, bu görevler arasında binaların farklı katları arasında eşyalar teslim etmek gibi kesin hareket gerektiren görevler bulunmakta.

VentureBeat’in haberine göre, araştırma ekibi robotlarını eğitmek için pekiştirme öğrenimi kullandı. Araştırmacılar, gerçek hayvanların hareketlerini gösteren klipler topladılar ve pekiştirme öğrenimi (RL) tekniklerini kullanarak, robotları video kliplerindeki hayvanların hareketlerini taklit etmeye yönelttiler. Bu durumda, araştırmacılar, robotları bir köpeğin hareketlerini taklit etmesi için eğittiler, bu köpek bir fizik simülatöründe tasarlandı ve dört ayaklı Unitree Laikago robotuna köpeğin hareketlerini taklit etmesi talimatı verildi. Robot eğitildikten sonra, zıplama, dönme ve yaklaşık 2.6 mil/saat hızda hızlı yürüme gibi karmaşık hareketleri gerçekleştirebildi.

Eğitim verisi, yaklaşık 200 milyon köpek hareketi örneğinden oluşuyordu, bu örnekler bir fizik simülasyonunda izlenmişti. Farklı hareketler daha sonra öğrenilen ajanların ödül fonksiyonları ve politikalarıyla çalıştırıldı. Politikalar simülasyonda oluşturulduktan sonra, gerçek dünyaya latent space adaptation adlı bir teknik kullanılarak transfer edildiler. Çünkü robotları eğitmek için kullanılan fizik simülatörleri, gerçek dünya hareketinin yalnızca belirli yönlerini yaklaşık olarak hesaplayabiliyordu, araştırmacılar simülasyona farklı koşullarda çalışmayı simüle etmek amacıyla çeşitli pertürbasyonlar uyguladılar.

Araştırma ekibine göre, sadece 50 farklı denemeden topladıkları 8 dakika veri kullanarak simülasyon politikalarını gerçek dünya robotlarına uyarlayabildiler. Araştırmacılar, gerçek dünya robotlarının çeşitli spesifik hareketleri taklit edebildiklerini gösterdiler, bu hareketler arasında tölt, dönme, zıplama ve tempolu yürüme bulunuyordu. Hatta animasyon sanatçıları tarafından oluşturulan animasyonları bile taklit edebildiler, örneğin bir zıplama ve dönme kombinasyonu.

Araştırmacılar, makalede bulgularını özetliyor:

“Referans hareket verilerini kullanarak, tek bir öğrenme tabanlı yaklaşımın, bacaklı robotlar için çeşitli davranışlar için kontrolleri otomatik olarak sentezleyebileceğini gösteriyoruz. Eğitim sürecine örnek verimli alan adaptasyon tekniklerini entegre ederek, simülasyonda öğrenen politikaları gerçek dünya dağıtımına hızla uyarlayabilen bir sistem geliştirdik.”

Pekiştirme öğrenimi过程inde kullanılan kontrol politikaları sınırlamalara sahipti. Donanım ve algoritmalar tarafından uygulanan kısıtlamalar nedeniyle, robotların yapamayacağı beberapa şey vardı. Örneğin, koşamıyor veya büyük atlayışlar yapamıyorlardı. Öğrenilen politikalar ayrıca, elle tasarlanan hareketlere kıyasla daha az stabilite sergiledi. Araştırma ekibi, kontrolörleri daha güçlü ve farklı türden verilerden öğrenme yeteneğine sahip hale getirmek için çalışmayı daha da ilerletmek istiyor. İdeal olarak, çerçevenin gelecekteki sürümleri video verisinden öğrenabilecektir.

Blog yazarı ve programcı, Machine Learning ve Deep Learning konularında uzmanlık sahibi. Daniel, başkalarının AI'nin gücünü sosyal fayda için kullanmasına yardımcı olmak umudu taşıyor.