Connect with us

Kecerdasan buatan

KI Untuk Bersaing Dalam Kompetisi Pembelajaran Mesin Minecraft

mm

Seperti yang dilaporkan oleh Nature, sebuah kompetisi KI baru akan segera terjadi, kompetisi MineRL, yang akan mendorong insinyur dan pengkode KI untuk membuat program yang dapat belajar melalui pengamatan dan contoh. Kasus uji untuk sistem KI ini akan menjadi permainan video crafting dan survival yang sangat populer, Minecraft.

Sistem kecerdasan buatan telah mencapai beberapa prestasi yang mengesankan baru-baru ini dalam hal permainan video. Baru-baru ini, KI mengalahkan pemain manusia terbaik di dunia dalam permainan strategi StarCraft II. Namun, StarCraft II memiliki tujuan yang dapat didefinisikan dengan lebih mudah dan dipecah menjadi langkah-langkah yang koheren yang dapat digunakan KI untuk berlatih. Tugas yang jauh lebih sulit adalah membuat KI belajar bagaimana menavigasi permainan sandbox dunia terbuka seperti Minecraft. Peneliti berusaha membantu program KI belajar melalui pengamatan dan contoh, dan jika mereka berhasil, mereka dapat secara substansial mengurangi jumlah daya pengolahan yang diperlukan untuk melatih program kecerdasan buatan.

Peserta kompetisi akan memiliki empat hari untuk membuat KI yang akan diuji dengan Minecraft, dengan waktu pelatihan hingga delapan juta langkah. Tujuan KI adalah menemukan berlian dalam permainan dengan menggali. Delapan juta langkah pelatihan adalah waktu yang jauh lebih singkat daripada waktu yang diperlukan untuk melatih model KI yang kuat saat ini, sehingga peserta kompetisi perlu merancang metode yang secara drastis memperbaiki metode pelatihan saat ini.

Pendekatan yang digunakan oleh peserta didasarkan pada jenis pembelajaran yang disebut pembelajaran imitasi. Pembelajaran imitasi berbeda dengan pembelajaran penguatan, yang merupakan metode populer untuk melatih sistem yang canggih seperti lengan robot di pabrik atau KI yang dapat mengalahkan pemain manusia di StarCraft II. Kekurangan utama dari algoritma pembelajaran penguatan adalah bahwa mereka memerlukan daya pengolahan komputer yang besar untuk berlatih, bergantung pada ratusan atau bahkan ribuan komputer yang terhubung untuk belajar. Sebaliknya, pembelajaran imitasi adalah metode pelatihan yang jauh lebih efisien dan kurang mahal secara komputasi. Algoritma pembelajaran imitasi berusaha untuk meniru bagaimana manusia belajar dengan pengamatan.

William Guss, seorang kandidat PhD di teori pembelajaran dalam dari Carnegie Mellon University, menjelaskan kepada Nature bahwa membuat KI untuk menjelajahi dan belajar pola dalam lingkungan adalah tugas yang sangat sulit, tetapi pembelajaran imitasi memberikan KI dengan pengetahuan dasar, atau asumsi yang baik, tentang lingkungan. Ini dapat membuat pelatihan KI jauh lebih cepat dibandingkan dengan pembelajaran penguatan.

Minecraft berfungsi sebagai lingkungan pelatihan yang sangat berguna karena beberapa alasan. Alasan satu adalah bahwa Minecraft memungkinkan pemain untuk menggunakan blok bangunan sederhana untuk membuat struktur dan item yang kompleks, dan banyak langkah yang diperlukan untuk membuat struktur ini berfungsi sebagai penanda kemajuan yang nyata yang dapat digunakan peneliti sebagai metrik. Minecraft juga sangat populer, dan karena itu, relatif mudah untuk mengumpulkan data pelatihan. Penyelenggara kompetisi MineRL merekrut banyak pemain Minecraft untuk mendemonstrasikan berbagai tugas seperti membuat alat dan memecahkan blok. Dengan memanfaatkan pembuatan data, peneliti dapat menangkap 60 juta contoh tindakan yang dapat diambil dalam permainan. Peneliti memberikan sekitar 1000 jam video kepada tim kompetisi.

Gunakan pengetahuan yang telah dibangun manusia, kata Rohin Shah, kandidat PhD di ilmu komputer di University of California, Berkeley, menjelaskan kepada Nature bahwa kompetisi ini kemungkinan besar pertama yang berfokus pada menggunakan pengetahuan yang telah dibangun manusia untuk mempercepat pelatihan KI.

Guss dan peneliti lainnya berharap bahwa kontes ini dapat memiliki hasil dengan implikasi di luar Minecraft, memberikan rise pada algoritma pembelajaran imitasi yang lebih baik dan menginspirasi lebih banyak orang untuk mempertimbangkan pembelajaran imitasi sebagai bentuk pelatihan KI yang layak. Penelitian ini dapat membantu menciptakan KI yang lebih mampu berinteraksi dengan manusia dalam lingkungan yang kompleks dan berubah.

Blogger dan programmer dengan spesialisasi di Machine Learning dan Deep Learning topik. Daniel berharap untuk membantu orang lain menggunakan kekuatan AI untuk kebaikan sosial.