ხელოვნური ინტელექტი

ტექნიკა AI-ს საშუალებას აძლევს იფიქროს შორს მომავალზე

განახლებულია on დეკემბერი 9, 2022

MIT-ის, MIT-IBM Watson AI Lab-ის და სხვა ინსტიტუტების მკვლევართა ჯგუფმა შეიმუშავა ახალი მიდგომა, რომელიც ხელოვნური ინტელექტის (AI) აგენტებს საშუალებას აძლევს მიაღწიონ შორსმჭვრეტელ პერსპექტივას. სხვა სიტყვებით რომ ვთქვათ, AI-ს შეუძლია იფიქროს შორს მომავალზე, როდესაც განიხილავს, თუ როგორ შეიძლება შეიცავდეს მათ ქცევას სხვა AI აგენტების ქცევები დავალების შესრულებისას.

ის კვლევის დაგეგმილია წარდგენა კონფერენცია ნერვული ინფორმაციის დამუშავების სისტემებზე.

AI განიხილავს სხვა აგენტების მომავალ ქმედებებს

გუნდის მიერ შექმნილი მანქანური სწავლების ჩარჩო საშუალებას აძლევს კოოპერატიულ ან კონკურენტუნარიან AI აგენტებს განიხილონ რას გააკეთებენ სხვა აგენტები. ეს ეხება არა მხოლოდ შემდეგ ნაბიჯებს, არამედ როგორც დრო უახლოვდება უსასრულობას. აგენტები ადაპტირებენ თავიანთ ქცევებს შესაბამისად, რათა გავლენა მოახდინონ სხვა აგენტების მომავალ ქცევებზე, დაეხმარონ მათ ოპტიმალური, გრძელვადიანი გადაწყვეტილებების მიღწევაში.

გუნდის თქმით, ჩარჩოს გამოყენება შეიძლება, მაგალითად, ავტონომიური დრონების ჯგუფის მიერ, რომლებიც ერთად მუშაობენ დაკარგული ლაშქრობის მოსაძებნად. ის ასევე შეიძლება გამოყენებულ იქნას თვითმართვადი სატრანსპორტო საშუალებების მიერ სხვა მანქანების სამომავლო მოძრაობების მოსალოდნელი მგზავრების უსაფრთხოების გასაუმჯობესებლად.

დონგ-კი კიმი არის MIT-ის საინფორმაციო და გადაწყვეტილების სისტემების ლაბორატორიის (LIDS) კურსდამთავრებული და კვლევითი ნაშრომის წამყვანი ავტორი.

„როდესაც ხელოვნური ინტელექტის აგენტები თანამშრომლობენ ან კონკურენციას უწევენ, ყველაზე მნიშვნელოვანი ის არის, როცა მათი ქცევები ერთმანეთს ემთხვევა მომავალში“, - ამბობს კიმი. ”გზაში არის ბევრი გარდამავალი ქცევა, რომელსაც დიდი მნიშვნელობა არ აქვს გრძელვადიან პერსპექტივაში. ამ კონვერგირებული ქცევის მიღწევა არის ის, რაც ჩვენ ნამდვილად გვაინტერესებს და ახლა გვაქვს მათემატიკური გზა ამის გასააქტიურებლად. ”

პრობლემას, რომელსაც მკვლევარები აგვარებენ, ეწოდება მულტი-აგენტური გაძლიერების სწავლებას, სადაც განმტკიცების სწავლა არის მანქანათმცოდნეობის ფორმა, სადაც AI აგენტები სწავლობენ საცდელი და შეცდომით.

როდესაც რამდენიმე კოოპერატივი ან კონკურენტი აგენტი ერთდროულად სწავლობს, პროცესი შეიძლება ბევრად უფრო რთული გახდეს. ვინაიდან აგენტები განიხილავენ სხვა აგენტების სამომავლო ნაბიჯებს, ასევე საკუთარ ქცევას და იმაზე, თუ როგორ ახდენს ის გავლენას სხვებზე, პრობლემა მოითხოვს ძალიან დიდ გამოთვლით ძალას.

RoboSumo: FURTHER vs LILI

Watch this video on YouTube

AI ფიქრობს უსასრულობაზე

"AI-ს ძალიან უნდათ იფიქრონ თამაშის დასრულებაზე, მაგრამ მათ არ იციან, როდის დასრულდება თამაში", - ამბობს კიმი. „მათ უნდა იფიქრონ იმაზე, თუ როგორ გააგრძელონ თავიანთი ქცევის ადაპტაცია უსასრულობაში, რათა მომავალში გაიმარჯვონ. ჩვენი ნაშრომი არსებითად გვთავაზობს ახალ მიზანს, რომელიც AI-ს საშუალებას აძლევს იფიქროს უსასრულობაზე.”

შეუძლებელია უსასრულობის ალგორითმში ინტეგრირება, ამიტომ გუნდმა შეიმუშავა სისტემა ისე, რომ აგენტები ფოკუსირება მოახდინონ მომავალ წერტილზე, სადაც მათი ქცევა სხვა აგენტებთან გადაიყრება. ეს მოიხსენიება როგორც წონასწორობა და წონასწორობის წერტილი განსაზღვრავს აგენტების გრძელვადიან მოქმედებას.

შესაძლებელია მრავალი წონასწორობის არსებობა მრავალ აგენტის სცენარში და როდესაც ეფექტური აგენტი აქტიურად ახდენს გავლენას სხვა აგენტების მომავალ ქცევებზე, მათ შეუძლიათ მიაღწიონ სასურველ წონასწორობას აგენტის პერსპექტივიდან. როდესაც ყველა აგენტი გავლენას ახდენს ერთმანეთზე, ისინი გადადიან ზოგად კონცეფციასთან, რომელსაც ეწოდება "აქტიური წონასწორობა".

შემდგომი ჩარჩო

გუნდის მანქანათმცოდნეობის ჩარჩოს ეწოდება FURTHER და ის აგენტებს საშუალებას აძლევს ისწავლონ როგორ შეცვალონ თავიანთი ქცევები სხვა აგენტებთან ურთიერთქმედების საფუძველზე აქტიური წონასწორობის მისაღწევად.

ჩარჩო ეყრდნობა მანქანური სწავლების ორ მოდულს. პირველი არის დასკვნის მოდული, რომელიც საშუალებას აძლევს აგენტს გამოიცნოს სხვა აგენტების მომავალი ქცევები და მათ მიერ გამოყენებული სასწავლო ალგორითმები წინა ქმედებების საფუძველზე. ინფორმაცია შემდეგ იკვებება განმტკიცების სასწავლო მოდულში, რომელსაც აგენტი ეყრდნობა თავისი ქცევის ადაპტირებისთვის და სხვა აგენტებზე გავლენის მოხდენისთვის.

„გამოწვევა იყო უსასრულობაზე ფიქრი. ჩვენ მოგვიწია ბევრი სხვადასხვა მათემატიკური ხელსაწყოების გამოყენება, რათა ამის საშუალება მიგვეღო და გარკვეული ვარაუდები გამოგვეტანა, რომ ის პრაქტიკაში გამოგვეყენებინა“, - ამბობს კიმი.

გუნდმა გამოსცადა თავისი მეთოდი სხვა მრავალაგენტიანი გაძლიერების სწავლის ჩარჩოების წინააღმდეგ სხვადასხვა სცენარებში, სადაც AI აგენტები FURTHER-ის გამოყენებით გამოდიოდნენ წინ.

მიდგომა დეცენტრალიზებულია, ამიტომ აგენტები სწავლობენ დამოუკიდებლად გამარჯვებას. გარდა ამისა, ის უკეთესად არის შემუშავებული მასშტაბით, ვიდრე სხვა მეთოდებთან შედარებით, რომლებიც საჭიროებენ ცენტრალურ კომპიუტერს აგენტების კონტროლისთვის.

გუნდის თქმით, FURTHER შეიძლება გამოყენებულ იქნას მრავალ აგენტური პრობლემების ფართო სპექტრში. კიმი განსაკუთრებით იმედოვნებს ეკონომიკაში მისი აპლიკაციების მიმართ, სადაც ის შეიძლება გამოყენებულ იქნას ჯანსაღი პოლიტიკის შემუშავებისთვის სიტუაციებში, რომელშიც შედის მრავალი ურთიერთდამოკიდებული სუბიექტი ქცევებითა და ინტერესებით, რომლებიც დროთა განმავლობაში იცვლება.

დაკავშირებული თემები:AI ხელოვნური ინტელექტი გაძლიერების სწავლება

შემდეგი

მონაცემთა გადაღებიდან მონაცემთა ინტეგრაციამდე

არ გამოტოვოთ

რა არის დიფერენციალური კონფიდენციალურობა?

ალექს მაკფარლანდი

ალექს მაკფარლანდი არის ხელოვნური ინტელექტის ჟურნალისტი და მწერალი, რომელიც იკვლევს ხელოვნურ ინტელექტის უახლეს მოვლენებს. ის თანამშრომლობდა მრავალრიცხოვან AI სტარტაპთან და პუბლიკაციებთან მთელ მსოფლიოში.