სტუბი Amazon Alexa-ს მთავარი მკვლევარი ამტკიცებს, რომ ტურინგის ტესტი მოძველებულია - Unite.AI
დაკავშირება ჩვენთან ერთად

ხელოვნური გენერალური ინტელექტი

Amazon Alexa-ს მთავარი მკვლევარი ამტკიცებს, რომ ტურინგის ტესტი მოძველებულია

mm
განახლებულია on

როჰიტ პრასადი, Amazon-ის ვიცე პრეზიდენტი და Alexa-ს ხელმძღვანელი მეცნიერი, ახლახანს ამტკიცებდნენ რომ ტურის ტესტი, რომელიც დიდი ხანია გამოიყენებოდა ხელოვნური ინტელექტის მოდელების დახვეწილობის გასაზომად, უნდა გამოირიცხოს, როგორც AI-ის საორიენტაციო ნიშანი.

კომპიუტერულმა მეცნიერმა და მათემატიკოსმა ალან ტურინგმა თავდაპირველად შემოიტანა ტურინგის ტესტის კონცეფცია 70 წელზე მეტი ხნის წინ. ტურინგის ტესტის მიზანი იყო დაეხმარა პასუხის გაცემას მანქანური ინტელექტის შესახებ, იმის დადგენაში, შეეძლო თუ არა მანქანას „აზროვნება“ ადამიანის გაგებით. ამ კითხვაზე პასუხის გასაცემად, ტურინგი ამტკიცებდა, რომ თუ მანქანებს შეეძლოთ ისეთი დახვეწილი საუბრის ქცევა გამოეჩინათ, რომ დამკვირვებელს არ შეეძლო კომპიუტერის დიალოგისა და ადამიანის დიალოგის გარჩევა, მანქანა უნდა ჩაითვალოს აზროვნების უნარით.

ტურინგის ტესტის შეზღუდვები

პრასადი ამტკიცებდა, რომ ტურინგის ტესტი მრავალი თვალსაზრისით შეზღუდულია და რომ თავად ტურინგმაც კი შენიშნა ამ შეზღუდვების შესახებ. თავის საწყის ნაშრომში. რამდენადაც ხელოვნური ინტელექტი უფრო და უფრო ინტეგრირდება ჩვენი ცხოვრების ყველა ასპექტში, ადამიანებს ნაკლებად აინტერესებთ, რომ ის ადამიანისგან არ განსხვავდებოდეს და უფრო მეტად, რომ მათი ურთიერთქმედება ხელოვნურ ინტელექტუალთან ერთგვაროვანი იყოს, ამტკიცებს პრასადი. ამ მიზეზით, ტურინგის ტესტი უნდა ჩაითვალოს მოძველებულად და ჩაანაცვლოს უფრო სასარგებლო კრიტერიუმებით.

პრასადმა აღნიშნა, რომ ბევრი ადრეული ჩატბოტი შეიქმნა ტურინგის ტესტის ჩაბარების გათვალისწინებით და ბოლო წლებში ზოგიერთმა ჩატბოტმა მუდმივად ახერხებს ადამიანის მოსამართლეების მესამედზე მეტის მოტყუება (ბარი, რომელიც საჭირო იყო ტურინგის ტესტის ჩაბარებისთვის). თუმცა, შეუძლია წარმატებით მიბაძოს ადამიანების მეტყველების ნიმუშებს არ ნიშნავს, რომ მანქანა ნამდვილად შეიძლება ჩაითვალოს "ინტელექტუალურად". ხელოვნური ინტელექტის მოდელები შეიძლება იყოს ძალიან მცოდნე ერთ სფეროში და უკიდურესად მოკლებული იყოს სხვაში და არ გააჩნდეს ზოგადი ინტელექტის ფორმა. ამის მიუხედავად, ტურინგის ტესტი რჩება საყოველთაოდ გამოყენებულ ეტალონად ჩეთბოტებისა და ციფრული ასისტენტებისთვის, პრასადი აღნიშნავს, რომ ბიზნეს ლიდერები და ჟურნალისტები მუდმივად კითხულობენ, როდის შეძლებს Alexa-ს ტურინგის ტესტის ჩაბარება.

Prasad-ის თანახმად, ტურინგის ტესტის მანქანური ინტელექტის შესაფასებლად ერთ-ერთი მთავარი პრობლემა არის ის, რომ ის თითქმის მთლიანად ამცირებს მანქანების უნარს, მოიძიონ ინფორმაცია და განახორციელონ ელვისებური სწრაფი გამოთვლები. ხელოვნური ინტელექტის პროგრამები ქმნიან ხელოვნურ პაუზებს მათემატიკისა და გეოგრაფიის რთულ კითხვებზე, რათა მოატყუონ ადამიანები, მაგრამ მათ აქვთ პასუხი ასეთ კითხვებზე თითქმის მყისიერად. გარდა ამისა, ტურინგის ტესტი არ ითვალისწინებს ხელოვნური ინტელექტის მზარდ უნარს გამოიყენოს გარე სენსორების მიერ შეგროვებული მონაცემები, უგულებელყოფს, თუ როგორ შეუძლიათ AI-ებს ურთიერთქმედება სამყაროსთან ხედვისა და მოძრაობის ალგორითმების მეშვეობით, მხოლოდ ტექსტურ კომუნიკაციაზე დაყრდნობით.

ახალი კრიტერიუმების შექმნა

პრასადი ამტკიცებდა, რომ უნდა შეიქმნას ინტელექტის გაზომვის ახალი ფორმები, მეთოდები, რომლებიც უკეთესად შეეფერება ზოგადი ტიპის ინტელექტის შეფასებას. ეს ტესტები უნდა ასახავდეს, თუ როგორ გამოიყენება AI რეალურად თანამედროვე საზოგადოებაში და ხალხის მიზნები მისი გამოყენებისას. ტესტებს უნდა შეეძლოთ იმის დადგენა, თუ რამდენად აძლიერებს AI ადამიანის ინტელექტს და რამდენად აუმჯობესებს AI ადამიანების ყოველდღიურ ცხოვრებას. გარდა ამისა, ტესტმა უნდა გაიგოს, თუ როგორ ავლენს ხელოვნური ინტელექტი ადამიანის მსგავსი ინტელექტის მახასიათებლებს, მათ შორის ენის ცოდნას, თვითკონტროლს და „საღი აზროვნებას“.

ხელოვნური ინტელექტის კვლევის ამჟამინდელი და მნიშვნელოვანი სფეროები, როგორიცაა მსჯელობა, სამართლიანობა, საუბარი და სენსორული გაგება, არ ფასდება ტურინგის ტესტით, მაგრამ მათი გაზომვა შესაძლებელია სხვადასხვა გზით. პრასადმა განმარტა, რომ ინტელექტის ამ მახასიათებლების გაზომვის ერთ-ერთი გზა არის გამოწვევების დაყოფა შემადგენელ ამოცანებად. შეფასების კიდევ ერთი მეთოდი არის ადამიანისა და კომპიუტერის ურთიერთქმედების მასშტაბური რეალური გამოწვევის შექმნა.

როდესაც ამაზონმა შექმნა Alexa Prize, მან შექმნა რუბრიკა, რომელიც სოციალურ ბოტებს სთხოვდა ადამიანთან საუბარი 20 წუთის განმავლობაში. ბოტები შეფასდებიან მათი უნარის მიხედვით, თანმიმდევრულად ისაუბრონ მრავალფეროვან თემებზე, როგორიცაა ტექნოლოგია, სპორტი, პოლიტიკა და გართობა. კლიენტები პასუხისმგებელნი იყვნენ ბოტების გატანაზე განვითარების ფაზაში, ანიჭებდნენ მათ ქულებს ბოტთან ხელახლა საუბრის სურვილის საფუძველზე. დასკვნითი რაუნდის განმავლობაში დამოუკიდებელ მოსამართლეებს ევალებოდათ ბოტების შეფასება 5-ბალიანი სკალის გამოყენებით. მოსამართლეების მიერ გამოყენებული რუბრიკა ეყრდნობოდა მეთოდებს, რომლებიც საშუალებას აძლევდა AI-ებს გამოავლინონ ისეთი მნიშვნელოვანი ადამიანური ატრიბუტები, როგორიცაა თანაგრძნობა, საჭიროების შემთხვევაში.

საბოლოო ჯამში, პრასადი ამტკიცებდა, რომ AI-ზე მომუშავე მოწყობილობების მზარდი გავრცელება, როგორიცაა Alexa, წარმოადგენს მნიშვნელოვან შესაძლებლობას ხელოვნური ინტელექტის პროგრესის გასაზომად, მაგრამ ჩვენ დაგვჭირდება სხვადასხვა მეტრიკა, რომ ვისარგებლოთ ამ ახალი შესაძლებლობით.

„ასეთი AI-ები უნდა იყვნენ ექსპერტები დავალებების დიდი, მუდმივად მზარდი რაოდენობით, რაც შესაძლებელია მხოლოდ უფრო განზოგადებული სწავლის შესაძლებლობით და არა კონკრეტული ამოცანების ინტელექტით“, - განმარტა პრასადმა. „აქედან გამომდინარე, მომდევნო ათწლეულის განმავლობაში და შემდგომში, ხელოვნური ინტელექტის სერვისების გამოყენება, მათი საუბრისა და პროაქტიული დახმარების შესაძლებლობებით გარემო მოწყობილობებზე, ღირსეული გამოცდაა.

 

ბლოგერი და პროგრამისტი სპეციალობით მანქანა სწავლა მდე ღრმა სწავლება თემები. დანიელი იმედოვნებს, რომ დაეხმარება სხვებს გამოიყენონ ხელოვნური ინტელექტის ძალა სოციალური სიკეთისთვის.