სტუბი ჯეიმს კაპლანი, აღმასრულებელი დირექტორი და MeetKai Metaverse-ის თანადამფუძნებელი - ინტერვიუების სერია - Unite.AI
დაკავშირება ჩვენთან ერთად

ინტერვიუები

ჯეიმს კაპლანი, აღმასრულებელი დირექტორი და MeetKai Metaverse - ინტერვიუს სერიის თანადამფუძნებელი

mm

გამოქვეყნებულია

 on

ჯეიმს კაპლანი, არის აღმასრულებელი დირექტორი და თანადამფუძნებელი გაიცანი კაი ხელოვნური ინტელექტის, VR და საუბრის საძიებო კომპანია, რომელიც დაფუძნებულია ლოს-ანჯელესში, კალიფორნია, რომელიც ამჟამად ლიდერობს ხელოვნური ინტელექტის მეტყველების რბოლაში აქამდე ნანახი ფუნქციებით. მის სასაუბრო AI-ს შეუძლია გაიგოს უფრო რთული მეტყველება და მისცეს პერსონალიზებული შედეგები ბუნებრივ საუბარში ბევრ თემაზე, სხვადასხვა რეალობაში. MeetKai-ს ტექნოლოგია გლობალურადაა გავრცელებული iOS-ის, Google Play-ისა და AppGallery-ის მეშვეობით.

6 წლის ასაკში გქონდათ გატაცება ხელოვნური ინტელექტის მიმართ, პირველად როგორ გაეცანით ამ ტექნოლოგიას?

ჩემი გაცნობა AI-ში მოვიდა ვიდეო თამაშებიდან. პირველ რიგში, ეს იყო იმის გაგება, თუ როგორ მუშაობდა AI თამაშში Oregon Trail - არც ისე ინტელექტუალური, მაგრამ მაინც AI-ს ფორმა. იქიდან ჩემი ინტერესი ხელოვნური ინტელექტის მიმართ კიდევ უფრო გაიზარდა, როგორც კი MMORPG-ში შევედი. ძალიან მომწონდა ონლაინ თამაშების თამაში, მაგრამ მძულდა ნივთების დაფქვა. ამიტომ დავიწყე ბოტების წერა.

რომელი იყო პირველი AI აპლიკაციებიდან, რომლებიც დაშიფრეთ?

MMO-სთვის ბოტების დაწერა ნამდვილად იყო პირველი შეტევა, რაც მე მქონდა ხელოვნური ინტელექტის სპეციფიკური ფორმის შემუშავებაში. თავიდან ჩემი ბოტები საკმაოდ მარტივი და უფრო ახლოს იყო მაკროებთან, ვიდრე ხელოვნური ინტელექტი. მაგრამ რაც უფრო გავიზარდე და როცა ბოტების ამოცნობა უმჯობესდებოდა ბევრ თამაშში, ამან მოითხოვა, რომ ბოტები უფრო და უფრო ჰგავდნენ მოთამაშეს. მე ყოველთვის მსიამოვნებდა ბოტების წერა - სკოლაში სწავლის დროს ტეილორ სვიფტის კონკურსის მოსაგებად ბოტის წერა დავასრულე (და ის მართლაც მოვიდა შესასრულებლად!). ანალოგიურად, მე ასევე დავწერე პირველი Pokémon Go ბოტი და, სამწუხაროდ, ბევრი ადამიანი აკრძალეს, როდესაც დავკარგე ინტერესი გამოვლენის თავიდან აცილების მიმართ.

თქვენ გაუშვით MeetKai 2018 წელს, მას შემდეგ, რაც იმედგაცრუებული ხართ ამჟამინდელი AI ხმოვანი ასისტენტებით. რატომ გვთავაზობს ხელოვნური ინტელექტის ასისტენტების უმეტესობა არასასიამოვნო გამოცდილებას?

საკითხის მთავარი ის არის, რომ AI ასისტენტების უმეტესობა ზედმეტად არის დამოკიდებული გარე API-ებზე შესრულებისთვის. მაშინაც კი, როდესაც ისინი აკონტროლებენ შესრულებას, როგორიცაა Alexa ელექტრონული კომერციის საძიებლად, ისინი განიცდიან იგივე პრობლემებს. მარტივად რომ ვთქვათ, როგორ შეიძლება ველოდოთ, რომ ხმოვანი ასისტენტი იქნება ჭკვიანი, როდესაც ის მხოლოდ მეტყველების ტექსტად გადაქცევას და ტექსტზე დაფუძნებულ საძიებო სისტემაში ათავსებს? ჩვენ დავიწყეთ MeetKai იმ იდეით, რომ შეგვეძლო მოგვაწოდოთ "ნახტომი" AI ასისტენტი მთელი ბოლოდან ბოლომდე დამუშავების მილსადენის კონტროლით, რომელიც ქმნის ხმოვან ასისტენტს. ჩვენ შევიმუშავეთ სასაუბრო საძიებო სისტემა, ვიდრე საკვანძო სიტყვებზე დაფუძნებული, უფრო რთული მოთხოვნებისა და საუბრების მხარდასაჭერად. სხვა ასისტენტები განიცდიან უამრავ გამოცდილებას, რადგან მათ არ შეუძლიათ შექმნან მრავალმხრივი საუბრის მხარდაჭერა ასეთი შემზღუდველი ფაქტორების გარდა. მიუხედავად იმისა, რომ ჩვენი მიზანია იქ მოხვედრა, ჩვენ ჯერ კიდევ ძალიან ადრეულ ეტაპზე ვართ ჩვენი ტექნოლოგიის მასშტაბურობის შესასრულებლად იმ დომენების იგივე რაოდენობის შესასრულებლად, როგორც არსებული მოთამაშეები.

რა არის ბუნებრივი ენის გაგებისა და ბუნებრივი ენის დამუშავების ზოგიერთი გამოწვევა ხმოვანი ასისტენტის უახლესი გამოცდილების შექმნის უკან?

შემდეგი თაობის NLU-ს ერთ-ერთი მთავარი გამოწვევა არის მიზნებისა და არსებების მიღმა გადაადგილება. NLU-ს უმეტესობა ორიენტირებულია ენის გაგებისადმი ძალიან ტრადიციულ მიდგომაზე. თითოეული შეყვანის გამოთქმა კლასიფიცირდება intent-ად, შემდეგ კი შიგნით არსებული ნიშნები იარლიყება ერთეულებად მიმდევრობის მარკირების მოდელის გამოყენებით. მე შემიძლია ჩამოვთვალო ათობით პრობლემა ამ სტანდარტული მიდგომით. თუმცა, ყველაზე კრიტიკულები არიან:

  1. განზრახვის კლასიფიკაცია, რომელიც კონტექსტისგან თავისუფალია, ვერ უმკლავდება მრავალმხრივ საუბარს. მიდგომების უმეტესობას მხოლოდ გადაწერილი ტექსტი აინტერესებს. მათ არ აინტერესებთ კონტექსტი - არა ვინ არის მომხმარებელი, არა რა მოსწონს მომხმარებელს, მხოლოდ ის, რაც მათ უბრალოდ ჰკითხეს. ეს განსაკუთრებით მნიშვნელოვანია, როდესაც მომხმარებელი ამბობს რაღაც ლექსს მოკლედ. მაგალითად, თუ ვინმე ამბობს კოსმოპოლიტი, ეს შეიძლება ნიშნავდეს სასმელს ან ჟურნალს და დიდად არის დამოკიდებული ადამიანზე.
  2. ერთეულების ამოცნობის მოდელები ცუდად ასრულებენ ყველაფერს, რაც არ არის კატეგორიული მნიშვნელობა. მსხვილ ენობრივ მოდელებს არ შეუძლიათ საკმარისად სწრაფად ადაპტირება ახალ ერთეულებთან, რომლებიც ველურ ბუნებაში არიან, რადგან ისინი არ არიან მონაცემთა ბაზაში. AI-ს უნდა ჰქონდეს ბევრად უფრო დახვეწილი გზა სუბიექტების ამოცნობისთვის ბევრად უფრო ღრმა კონტექსტის გათვალისწინებით. მაგალითად, მომხმარებლის მდებარეობამ დიდი გავლენა უნდა მოახდინოს, თუ რამე არის რესტორნის სახელი სხვა რამის წინააღმდეგ.
  3. სუბიექტების ურთიერთობები კარგად არ არის გათვალისწინებული. ჩემი საყვარელი მაგალითია, თუ რამდენად ხშირად მარცხდება საძიებო სისტემების უმეტესობა, როდესაც საქმე ეხება უარყოფას. სცადეთ მოძებნოთ ფილმი რომანტიკის გარეშე სხვა ხმოვან ასისტენტებზე და მიხვდებით, რასაც ვგულისხმობ.

ამჟამად ხმოვანი ასისტენტების უმეტესობა უბრალოდ თარგმნის ხმას ტექსტად და ახორციელებს Google ძიებას. როგორ მუშაობს MeetKai AI ამისგან განსხვავებულად?

პირველადი განსხვავება MeetKai-სა და Google-ს შორის, როდესაც საქმე ეხება ძიებას, არის ის, რომ ჩვენ ვიყენებთ ბევრად უფრო მდიდარ ენის გაგების მოდელს თავად ნივთების მოსაძიებლად და არა მხოლოდ ვებ გვერდებზე. როდესაც თქვენ ეძებთ „ტომ კრუზის ფილმებს მოქმედების გარეშე“, Google ეძებს გვერდებს, რომლებზეც ამ ტოკენების ნაკრები გამოჩნდება გვერდზე (ტომ კრუზი, ფილმები, მოქმედებები). MeetKai-ში ჩვენ სწორად გვესმის, რომ ტომ კრუზი მსახიობია, ფილმები არის მედიის კლასი, რომელსაც ისინი ეძებენ და რომ მოქმედება არასასურველი ჟანრია. ამით ჩვენ შეგვიძლია ჩავატაროთ ბევრად უფრო ინტელექტუალური ძიება.

Meetkai-მ ახლახან გამოუშვა თავისი პირველი ცხოვრების სტილის VR სამყარო: MeetKai Metaverse. შეგიძლიათ განიხილოთ რა არის ეს აპლიკაცია კონკრეტულად?

მეტავერსიის სივრცეში კომპანიების უმეტესობა მუშაობს ადამიანთან<>პიროვნების ურთიერთქმედებით. ამის გარდა, შინაარსი ასევე დიდწილად არის მულტფილმური ან უბრალოდ 360° ვიდეო. ჩვენი მიზანი MeetKai Metaverse-თან არის ფოკუსირება სრულიად განსხვავებულ კუთხეზე — პიროვნება<>AI. ჩვენ ვავითარებთ მეტავერსიას, სადაც პერსონაჟები, რომლებთანაც თქვენ ურთიერთობთ, ყველანი იკვებება ჩვენი უახლესი სასაუბრო ხელოვნური ინტელექტის მეშვეობით. გარდა ამისა, ჩვენ ვმუშაობთ გარემოს პროცედურული გენერირების შესასრულებლად, რათა ის ბევრად უფრო რეალისტური და ჩაძირული გავხადოთ სხვა კომპანიებთან შედარებით სივრცეში. ორი საწყისი სამყარო, რომელიც ხელმისაწვდომია ჩვენს მეტავერსიაში შესასწავლად, არის ორი საწყისი გამოყენების შემთხვევისთვის: მედიტაცია და მუზეუმები. პირველში ჩვენ გავაციფრეთ Wing Chun ექსპერტი და პირველად შევქმენით AI პერსონაჟი, რომელსაც შეუძლია მომხმარებლებს ასწავლოს, თუ როგორ გამოიყენონ რევოლუციური მედიტაციის ტექნიკა რელაქსაციის მდგომარეობაში შესვლისთვის. ამ უკანასკნელში ჩვენ შევქმენით მუდმივად მზარდი ხელოვნების მუზეუმი და მივაწოდეთ ხელოვნური ინტელექტის მქონე კურატორი, რომელსაც შეუძლია უპასუხოს კითხვებს სივრცეში ხელოვნების შესახებ და მოაწყოს ტურები.

რა არის რამდენიმე მაგალითი იმისა, თუ როგორ გამოიყენება AI ამ Metaverse-ში?

ჩვენ ვიყენებთ AI სამ ადგილას:

  1. ჩვენი მეტავერსიის თითოეული პერსონაჟის სასაუბრო შესაძლებლობების გასაძლიერებლად.
  2. დინამიურად შექმნათ კონტენტი, რომელიც ხელმისაწვდომია მომხმარებლისთვის ხმოვანი ხელმძღვანელობით. ამის მაგალითები მოიცავს მედიტაციის სესიებს და ხელოვნების გალერეის ტურებს ჩვენს თავდაპირველ ორ გამოცდილებაში.
  3. 3D სივრცის პროცედურულად შექმნა და არა ხელის განლაგება.

როგორია თქვენი ხედვა ხმის ასისტენტების მომავალზე?

ხმის ასისტენტებს რომ ჰქონდეთ მომავალი, მათ უნდა გადაიქცნენ უფრო მეტს, ვიდრე ბრძანებაზე დაფუძნებულ სისტემაში. ეს ნიშნავს ღრმა ექსპერტიზისა და შესაძლებლობების მიღებას ბევრ კონკრეტულ დომენში. მე ვფიქრობ, რომ სხვადასხვა დომენის სპეციფიკური ხმოვანი ასისტენტების შეკრება იქნება სრულიად ინტელექტუალური მეტა ასისტენტის შექმნის გასაღები. ეს სრულიად ეწინააღმდეგება მცდელობებს „გააკეთო ეს ყველაფერი ერთდროულად“, რაც ჩვენ ვნახეთ მას შემდეგ, რაც ხმოვანი ასისტენტები პირველად შევიდნენ სივრცეში.

არის კიდევ რაიმე, რისი გაზიარებაც გსურთ MeetKai-ზე ან MeetKai Metaverse-ზე?

ჩვენ ჯერ კიდევ ჩვენი მეტავერსიის საგზაო რუქის დასაწყისში ვართ. ჩვენი საბოლოო მიზანი არის ის, რომ ჩვენ გვსურს შეგვეძლოს განმეორდეს ნებისმიერი გამოცდილება, რომელიც თქვენ გაქვთ რეალურ სამყაროში მეტავერსიასთან და შემდეგ მის ფარგლებს გარეთ. ეს ნიშნავს, რომ ჩვენ გვინდა აღმოვფხვრათ ხარჯები და დროში ამკრძალავი ფაქტორები, რომლებიც ზღუდავს იგივე გამოცდილებას რეალობაში. მეტავერსია საშუალებას მოგვცემს ვიცხოვროთ უფრო მდიდარი ცხოვრებით და არა მათი ჩანაცვლება. ჩვენ გვაქვს რამდენიმე ტექნიკური გამოწვევა, რომელიც ჯერ კიდევ უნდა გადაიჭრას, თუმცა, ჩვენ გვაქვს ეტაპების მკაფიო ნაკრები, რომელთა მიღწევაც შესაძლებელია, თუ ვივარაუდებთ, რომ აპარატურა გაგრძელდება გაუმჯობესებაში. ჩვენ მჭიდროდ ვთანამშრომლობთ ტექნიკის პარტნიორებთან, რათა უზრუნველვყოთ, რომ VR სივრცე სწრაფად მიიწევს წინ. უბრალოდ VR-ს მიღმა, ჩვენ გვინდა, რომ ჩვენი მეტავერსიული გამოცდილება VR-ს გარეთ გავხადოთ შესაძლებელი. ამის შესახებ დამატებით ინფორმაციას უახლოეს თვეებში გამოვაცხადებთ.

გმადლობთ შესანიშნავი ინტერვიუსთვის, მოუთმენლად ველი თქვენს პროგრესს მეტავერსიის თქვენს ვერსიაში. მკითხველს, ვისაც სურს მეტი გაიგოს, უნდა ეწვიოს გაიცანი კაი.

unite.AI-ს დამფუძნებელი პარტნიორი და წევრი Forbes-ის ტექნოლოგიური საბჭო, ანტუანი არის ა ფუტურისტი რომელიც გატაცებულია ხელოვნური ინტელექტისა და რობოტიკის მომავლის მიმართ.

ის ასევე არის დამფუძნებელი Securities.io, ვებსაიტი, რომელიც ფოკუსირებულია დამრღვევ ტექნოლოგიებში ინვესტირებაზე.