სტუბი ხელოვნური ინტელექტი იბრძვის იმიტაციური სწავლის საშუალებით დაეუფლოს Minecraft - Unite.AI
დაკავშირება ჩვენთან ერთად

ხელოვნური ინტელექტი

ხელოვნური ინტელექტი ცდილობს დაეუფლოს Minecraft-ს იმიტაციის სწავლის გზით

mm
განახლებულია on

გასული რამდენიმე თვის განმავლობაში, Microsoft-მა და სხვა კომპანიებმა, რომლებიც იკვლევდნენ მანქანურ სწავლებას, დაუპირისპირდნენ AI დეველოპერების გუნდებს, შეექმნათ AI სისტემა, რომელსაც შეეძლო ეთამაშა Minecraft და იპოვა ალმასი თამაშის ფარგლებში. იტყობინება BBCმიუხედავად იმისა, რომ ხელოვნური ინტელექტის პლატფორმებმა მოახერხეს ჭადრაკის დომინირება და წავიდნენ, მაგრამ მან იბრძოდა დავალების დაუფლება Minecraft-ში.

Microsoft-ის Minecraft-ზე დაფუძნებულ AI გამოწვევას ეწოდა MineRL და კონკურსის შედეგები ოფიციალურად გამოცხადდა ბოლო NeurIPS კონფერენციაზე. კონკურსის მიზანი იყო ხელოვნური ინტელექტის მომზადება „იმიტაციის სწავლის“ მიდგომის მეშვეობით. იმიტაციის სწავლა არის მეთოდი, სადაც AI სწავლობს დაკვირვების გამოყენებით. იმიტაციის სწავლება მიზნად ისახავს ხელოვნური ინტელექტის სისტემებს ასწავლოს მოქმედებები იმ მოქმედებების ყურებით, თუ როგორ ახორციელებენ ადამიანები და სწავლობენ დაკვირვების აქტით. იმიტაციის სწავლება, განმამტკიცებელ სწავლასთან შედარებით, არის გამოთვლით ნაკლებად ძვირი და არსებითად უფრო ეფექტური გზა ხელოვნური ინტელექტის მომზადებისთვის.

განმამტკიცებელი სწავლა ხშირად მოითხოვს ბევრ მძლავრ კომპიუტერს, რომლებიც დაკავშირებულია ქსელში და ასობით ან ათასობით საათის ტრენინგს, რათა ეფექტური გახდეს ამოცანა. ამის საპირისპიროდ, იმიტაციური სწავლის მეთოდით გაწვრთნილი AI შეიძლება ბევრად უფრო სწრაფად ივარჯიშოს, რადგან AI-ს უკვე აქვს ცოდნის საბაზისო დონე, რომ იმუშაოს იმ ადამიანური ოპერატორების თავაზიანობით, რომლებმაც ეს განახორციელეს.

იმიტაციის სწავლას აქვს პრაქტიკული აპლიკაციები ხელოვნური ინტელექტის გაწვრთნაში, სადაც ხელოვნური ინტელექტი უსაფრთხოდ ვერ იკვლევს მანამ, სანამ არ გამოიცნობს სწორ მოქმედებებს. ასეთი სცენარები მოიცავს ავტონომიური სატრანსპორტო საშუალების სწავლებას, რადგან მანქანას არ უნდა მიეცეს ქუჩაში გადაადგილების უფლება, სანამ ის არ ისწავლის სასურველ ქცევას. ადამიანის დემონსტრატორის მონაცემების გამოყენებამ მანქანის გასაწვრთნელად შეიძლება პროცესი უფრო სწრაფი და უსაფრთხო გახადოს.

Minecraft-ში ბრილიანტის პოვნის აქტი მოითხოვს მრავალი ნაბიჯის თანმიმდევრობით შესრულებას, როგორიცაა ხეების მოჭრა ხელსაწყოების დასამზადებლად, გამოქვაბულების შესწავლა, რომლებიც შეიცავს ბრილიანტს და რეალურად გამოქვაბულში ალმასის პოვნა. მიუხედავად ამოცანის სირთულისა, თამაშში გაცნობილ ადამიანს უნდა შეეძლოს ალმასის მიღება დაახლოებით 20 წუთში.

კონკურსში მონაწილეობდა 660-ზე მეტი სხვადასხვა ხელოვნური ინტელექტის აგენტი, მაგრამ ვერც ერთმა AI-მ ვერ შეძლო ალმასის პოვნა. ხელოვნური ინტელექტის მომზადებისთვის მოწოდებული მონაცემები იყო მონაცემთა ნაკრები, რომელიც შეიცავდა 60 მილიონზე მეტ კადრს, რომელიც შეგროვდა მრავალი ადამიანის მოთამაშისგან. ბრილიანტების მდებარეობები რანდომიზირებულია, როდესაც თამაშის ინსტანცია იწყება, ასე რომ, ეს ნიშნავს, რომ AI-ები უბრალოდ ვერ ხედავენ სად იპოვეს ადამიანმა მოთამაშეებმა ბრილიანტები. სხვა სიტყვებით რომ ვთქვათ, AI-ებმა უნდა ჩამოაყალიბონ იმის გაგება, თუ როგორ არის დაკავშირებული ცნებები, როგორიცაა ხელსაწყოების შექმნა, ხელსაწყოების გამოყენება, რესურსების შესწავლა და მოძიება.

იმისდა მიუხედავად, რომ ხელოვნური ინტელექტის ვერც ერთმა აგენტმა ვერ შეძლო ალმასის პოვნა წარმატებით, ორგანიზაციის გუნდი მაინც კმაყოფილი დარჩა კონკურსის შედეგებით და ექსპერიმენტიდან ბევრი რამ მაინც შეიტყო. AI გუნდების მიერ ჩატარებულმა კვლევამ შეიძლება ხელი შეუწყოს ხელოვნური ინტელექტის სფეროს წინსვლას, ალტერნატივის პოვნაში განმტკიცების სწავლის სტრატეგიებისთვის.

განმტკიცების სწავლა ხშირად იძლევა უფრო მაღალ შესრულებას იმიტაციურ სწავლასთან შედარებით, განმამტკიცებელი სწავლის ერთ-ერთი მნიშვნელოვანი წარმატებაა DeepMind's AlphaGo. თუმცა, როგორც უკვე აღვნიშნეთ, განმამტკიცებელი სწავლა მოითხოვს მასიური გამოთვლითი რესურსების გამოყენებას, რაც ზღუდავს მის გამოყენებას იმ ორგანიზაციების მიერ, რომლებსაც არ შეუძლიათ კომპიუტერული პროცესორების დიდი მასშტაბის შეძენა.

უილიამ გასი, კარნეგი მელონის უნივერსიტეტის დოქტორანტი და კონკურსის მთავარი ორგანიზატორი, განუმარტა BBC- ს რომ MineRL კონკურსი მიზნად ისახავდა გამოთვლებით ამაღლებული ხელოვნური ინტელექტის ალტერნატივების გამოსაკვლევად. თქვა გასმა:

„...პრობლემებზე მასიური გამოთვლების გამოყენება სულაც არ არის სწორი გზა ჩვენთვის, რომ მივაღწიოთ ხელოვნების დონეს, როგორც დარგს… ის პირდაპირ მუშაობს ამ გაძლიერებული სწავლის სისტემებზე დემოკრატიზაციის წინააღმდეგ და ტოვებს აგენტების მომზადების უნარს რთულ გარემოში. კორპორაციები, რომლებსაც აქვთ გამოთვლები.”