Kecerdasan buatan
AI Google Mengajarkan Robot Cara Bergerak dengan Menonton Anjing

Bahkan beberapa robot paling canggih saat ini masih bergerak dengan cara yang sedikit kaku dan bergetar. Untuk membuat robot bergerak dengan cara yang lebih hidup dan alami, peneliti di Google telah mengembangkan sistem AI yang dapat belajar dari gerakan hewan nyata. Tim peneliti Google menerbitkan sebuah makalah pra-cetak yang menjelaskan pendekatan mereka akhir pekan lalu. Dalam makalah dan posting blog yang menyertainya, tim peneliti menjelaskan rasional di balik sistem tersebut. Penulis makalah tersebut percaya bahwa memberi robot dengan gerakan yang lebih alami dapat membantu mereka menyelesaikan tugas dunia nyata yang memerlukan gerakan yang presisi, seperti mengantarkan barang antara berbagai tingkat bangunan.
Seperti yang dilaporkan VentureBeat, tim peneliti menggunakan pembelajaran penguatan untuk melatih robot mereka. Peneliti memulai dengan mengumpulkan klip hewan nyata yang bergerak dan menggunakan teknik pembelajaran penguatan (RL) untuk mendorong robot untuk meniru gerakan hewan dalam klip video. Dalam hal ini, peneliti melatih robot dengan klip anjing, yang dirancang dalam simulator fisika, menginstruksikan robot Unitree Laikago empat kaki untuk meniru gerakan anjing. Setelah robot dilatih, robot tersebut dapat melakukan gerakan kompleks seperti melompat, berputar, dan berjalan cepat, dengan kecepatan sekitar 2,6 mil per jam.
Data pelatihan terdiri dari sekitar 200 juta sampel anjing dalam gerakan, yang dilacak dalam simulator fisika. Gerakan yang berbeda kemudian dijalankan melalui fungsi penghargaan dan kebijakan yang dipelajari oleh agen. Setelah kebijakan dibuat dalam simulasi, kebijakan tersebut dipindahkan ke dunia nyata menggunakan teknik yang disebut adaptasi ruang laten. Karena simulator fisika yang digunakan untuk melatih robot hanya dapat mengapproximasi beberapa aspek gerakan dunia nyata, peneliti secara acak menerapkan berbagai gangguan pada simulasi, yang dimaksudkan untuk mensimulasikan operasi di bawah kondisi yang berbeda.
Menurut tim peneliti, mereka dapat menyesuaikan kebijakan simulasi dengan robot dunia nyata menggunakan hanya delapan menit data yang dikumpulkan dari 50 trial yang berbeda. Peneliti berhasil menunjukkan bahwa robot dunia nyata dapat meniru berbagai gerakan spesifik seperti trotting, berputar, melompat, dan berjalan. Mereka bahkan dapat meniru animasi yang dibuat oleh seniman animasi, seperti kombinasi lompatan dan putaran.
Peneliti merangkum temuan mereka dalam makalah:
“Kami menunjukkan bahwa dengan menggunakan data gerakan referensi, satu pendekatan berbasis pembelajaran dapat secara otomatis mensintesis pengontrol untuk berbagai perilaku untuk robot berkaki. Dengan mengintegrasikan teknik adaptasi domain yang efisien sampel ke dalam proses pelatihan, sistem kami dapat belajar kebijakan adaptif dalam simulasi yang kemudian dapat dengan cepat disesuaikan untuk penerapan dunia nyata.”
Kebijakan pengontrol yang digunakan selama proses pembelajaran penguatan memiliki keterbatasan. Karena keterbatasan yang diberlakukan oleh perangkat keras dan algoritma, ada beberapa hal yang robot tidak bisa lakukan. Mereka tidak bisa berlari atau membuat lompatan besar, misalnya. Kebijakan yang dipelajari juga tidak menunjukkan stabilitas yang sama seperti gerakan yang dirancang secara manual. Tim peneliti ingin mengembangkan pekerjaan lebih lanjut dengan membuat pengontrol lebih robust dan dapat belajar dari berbagai jenis data. Idealnya, versi masa depan kerangka kerja akan dapat belajar dari data video.












