სტუბი იაშარ ბეჰზადი, Synthesis AI-ს აღმასრულებელი დირექტორი - ინტერვიუს სერია - Unite.AI
დაკავშირება ჩვენთან ერთად

ინტერვიუები

იაშარ ბეჰზადი, Synthesis AI - ინტერვიუს სერიის აღმასრულებელი დირექტორი

mm

გამოქვეყნებულია

 on

Yashar Behzadi PhD არის აღმასრულებელი დირექტორი და დამფუძნებელი სინთეზის AI. ის არის გამოცდილი მეწარმე, რომელმაც შექმნა ტრანსფორმაციული ბიზნესი AI, სამედიცინო ტექნოლოგიებისა და IoT ბაზრებზე. მან ბოლო 14 წელი გაატარა სილიკონის ველის მშენებლობაში და მონაცემთა ბაზაზე ორიენტირებული ტექნოლოგიური კომპანიების მასშტაბირებაში. იაშარს აქვს 30-ზე მეტი პატენტი და მომლოდინე პატენტი და დოქტორი. UCSD-დან, ფოკუსირებულია ტვინის ფუნქციური გამოსახულების სივრცით-დროის მოდელირებაზე.

სინთეზის AI არის სტარტაპი ღრმა სწავლისა და CGI-ის კვეთაზე, რომელიც ქმნის ახალ პარადიგმას კომპიუტერული ხედვის მოდელის განვითარებისთვის. ისინი მომხმარებელს საშუალებას აძლევს შეიმუშაონ უკეთესი მოდელები ტრადიციული ადამიანის ანოტაციაზე დაფუძნებული მიდგომების დროისა და ხარჯების მცირე ნაწილით.

როგორ ჩაერთეთ თავდაპირველად კომპიუტერულ მეცნიერებაში და AI-ში?

დავიმსახურე დოქტორის ხარისხი. UCSD-დან 2006 წელს ფოკუსირებული იყო კომპიუტერულ ხედვაზე და ტვინის გამოსახულების მონაცემების სივრცით და დროებით მოდელირებაზე. შემდეგ ვმუშაობდი სილიკონის ველში სენსორების, მონაცემებისა და მანქანათმცოდნეობის კვეთაზე მომდევნო 16 წლის განმავლობაში. თავს ძალიან ბედნიერად ვგრძნობ, რომ მაქვს შესაძლებლობა ვიმუშაო რამდენიმე გასაოცარ ტექნოლოგიაზე და მაქვს გაცემული ან შეტანილი 30-ზე მეტი პატენტი, რომელიც ორიენტირებულია სიგნალის დამუშავებაზე, მანქანათმცოდნეობასა და მონაცემთა მეცნიერებაზე.

შეგიძლიათ გაგიზიაროთ Synthesis AI-ის გენეზის ისტორია?

სანამ Synthesis AI-ს დავაარსებდი 2019 წელს, მე ვხელმძღვანელობდი გლობალური AI სერვისების კომპანიას, რომელიც ორიენტირებულია კომპიუტერული ხედვის მოდელების შემუშავებაზე წამყვანი ტექნოლოგიური საწარმოებისთვის. არ აქვს მნიშვნელობა კომპანიის ზომას, აღმოვაჩინე, რომ ჩვენ უკიდურესად შეზღუდული ვიყავით ეტიკეტირებული ტრენინგის მონაცემების ხარისხითა და რაოდენობით. როდესაც კომპანიები გაფართოვდნენ გეოგრაფიულად, გაზარდეს თავიანთი მომხმარებელთა ბაზა, ან შეიმუშავეს ახალი მოდელები და ახალი აპარატურა, საჭირო იყო ახალი ტრენინგის მონაცემები, რათა უზრუნველყოფილიყო მოდელების ადეკვატურად შესრულება. ასევე ცხადი გახდა, რომ კომპიუტერული ხედვის მომავალი არ იქნებოდა წარმატებული დღევანდელი ადამიანის ანოტაციის პარადიგმით. ავტონომიის, რობოტიკისა და AR/VR/metaverse აპლიკაციებში კომპიუტერული ხედვის განვითარებადი აპლიკაციები მოითხოვს 3D ეტიკეტების მდიდარ კომპლექტს, სიღრმის ინფორმაციას, მასალის თვისებებს, დეტალურ სეგმენტაციას და ა.შ., რომლებსაც ადამიანები ვერ ასახელებენ. საჭირო იყო ახალი პარადიგმა, რათა უზრუნველყოს ეტიკეტების საჭირო მდიდარი ნაკრები ამ ახალი მოდელების მოსამზადებლად. ტექნიკური დრაივერების გარდა, ჩვენ დავინახეთ მომხმარებელთა მზარდი და მარეგულირებელი კონტროლი მოდელის მიკერძოებასთან და მომხმარებელთა კონფიდენციალურობასთან დაკავშირებული ეთიკური საკითხების გარშემო.

მე დავაარსე Synthesis AI, რომელიც აპირებდა კომპიუტერული ხედვის პარადიგმის გარდაქმნას. კომპანიის სინთეზური მონაცემთა გენერირების პლატფორმა საშუალებას აძლევს მოთხოვნის შესაბამისად წარმოქმნას ფოტორეალისტური გამოსახულების მონაცემები 3D პიქსელებით სრულყოფილი ეტიკეტების გაფართოებული ნაკრებით. ჩვენი მისიაა სინთეზური მონაცემთა ტექნოლოგიების პიონერება, რაც საშუალებას მისცემს უფრო ეფექტური მოდელების ეთიკურ განვითარებას.

მკითხველებისთვის, რომლებიც არ იცნობენ ამ ტერმინს, შეგიძლიათ განსაზღვროთ რა არის სინთეზური მონაცემები?

სინთეზური მონაცემები არის კომპიუტერის მიერ გენერირებული მონაცემები, რომლებიც ემსახურება რეალურ სამყაროში არსებული მონაცემების ალტერნატივას. სინთეზური მონაცემები იქმნება სიმულაციურ ციფრულ სამყაროებში, ვიდრე შეგროვებული ან გაზომილი რეალურ სამყაროში. აერთიანებს ინსტრუმენტებს ვიზუალური ეფექტების სამყაროდან და CGI გენერაციულ AI მოდელებთან, Synthesis AI საშუალებას აძლევს კომპანიებს შექმნან დიდი რაოდენობით ფოტორეალისტური, მრავალფეროვანი მონაცემები მოთხოვნით კომპიუტერული ხედვის მოდელების მოსამზადებლად. კომპანიის მონაცემთა გენერირების პლატფორმამ შეამცირა მაღალი ხარისხის გამოსახულების მონაცემების მოპოვების ღირებულება და სიჩქარე კონფიდენციალურობის დაცვით.

შეგიძლიათ ისაუბროთ იმაზე, თუ როგორ იქმნება სინთეზური მონაცემები?

სინთეზური მონაცემთა ნაკრები იქმნება ხელოვნურად და არა რეალურ სამყაროში არსებული მონაცემების მეშვეობით. ვიზუალური ეფექტების ინდუსტრიის ტექნოლოგიები შერწყმულია გენერაციულ ნერვულ ქსელებთან, რათა შეიქმნას უზარმაზარი, მრავალფეროვანი და ფოტორეალისტური ეტიკეტირებული გამოსახულების მონაცემები. სინთეზური მონაცემები საშუალებას გაძლევთ შექმნათ სასწავლო მონაცემები მიმდინარე მიდგომების ღირებულებისა და დროის ფრაქციაში.

როგორ ქმნის სინთეზური მონაცემების გამოყენება კონკურენტულ უპირატესობას?

ამჟამად, ხელოვნური ინტელექტის სისტემების უმეტესობა იყენებს „ზედამხედველობით სწავლას“, სადაც ადამიანები აწერენ სურათებს მიკუთვნებულ კლავიშს და შემდეგ ავარჯიშებენ AI ალგორითმებს სურათების ინტერპრეტაციისთვის. ეს არის რესურსი და დროში ინტენსიური პროცესი და შემოიფარგლება იმით, რაც ადამიანებს შეუძლიათ ზუსტად დაასახელონ. გარდა ამისა, გაიზარდა შეშფოთება ხელოვნური ინტელექტის დემოგრაფიული მიკერძოებისა და მომხმარებელთა კონფიდენციალურობის შესახებ, რაც სულ უფრო ართულებს ადამიანის წარმომადგენლობითი მონაცემების მოპოვებას.

ჩვენი მიდგომაა შევქმნათ ფოტორეალისტური ციფრული სამყაროები, რომლებიც სინთეზირებენ გამოსახულების კომპლექსურ მონაცემებს. მას შემდეგ, რაც ჩვენ ვაწარმოებთ მონაცემებს, ჩვენ ვიცით ყველაფერი სცენების შესახებ, მათ შორის, აქამდე არასოდეს ხელმისაწვდომი ინფორმაცია ობიექტების 3D მდებარეობისა და მათი რთული ურთიერთქმედების შესახებ ერთმანეთთან და გარემოსთან. ამ მოცულობის მონაცემების მოპოვებას და მარკირებას მიმდინარე მიდგომების გამოყენებით დასჭირდება თვეები, თუ არა წლები. ეს ახალი პარადიგმა საშუალებას მისცემს 100-ჯერ გაზარდოს ეფექტურობა და ღირებულება და გაზარდოს უფრო ეფექტური მოდელების ახალი კლასი.

ვინაიდან სინთეზური მონაცემები წარმოიქმნება ხელოვნურად, ეს გამორიცხავს ბევრ მიკერძოებას და კონფიდენციალურობის შეშფოთებას რეალურ სამყაროდან მონაცემთა ნაკრების ტრადიციულად შეგროვებასთან დაკავშირებით.

როგორ უზრუნველყოფს მოთხოვნილ მონაცემთა გენერაციას დაჩქარებული მასშტაბირება?

მოდელის ტრენინგისთვის რეალური მონაცემების აღება და მომზადება ხანგრძლივი და დამღლელი პროცესია. საჭირო ტექნიკის განლაგება შეიძლება ძალიან ძვირი იყოს რთული კომპიუტერული ხედვის სისტემებისთვის, როგორიცაა ავტონომიური მანქანები, რობოტები ან სატელიტური გამოსახულება. მონაცემების დაჭერის შემდეგ, ადამიანები ასახელებენ ეტიკეტს და ანოტირებენ არსებით მახასიათებლებს. ეს პროცესი მიდრეკილია შეცდომისკენ და ადამიანებს შეზღუდული აქვთ ძირითადი ინფორმაციის მარკირება, როგორიცაა 3D პოზიცია, რომელიც საჭიროა მრავალი აპლიკაციისთვის.

სინთეზური მონაცემები მასშტაბის რიგითობით უფრო სწრაფი და იაფია, ვიდრე ადამიანის მიერ ანოტირებული რეალური მონაცემების ტრადიციული მიდგომები და დააჩქარებს ახალი და უფრო ეფექტური მოდელების გავრცელებას ინდუსტრიებში.

როგორ უზრუნველყოფს სინთეზური მონაცემები ხელოვნური ინტელექტის მიკერძოების შემცირებას ან პრევენციას?

ხელოვნური ინტელექტის სისტემები ყველგან არის, მაგრამ შეიძლება შეიცავდეს თანდაყოლილ მიკერძოებებს, რომლებსაც შეუძლიათ გავლენა მოახდინონ ადამიანების ჯგუფებზე. მონაცემთა ნაკრები შეიძლება იყოს გაუწონასწორებელი მონაცემთა გარკვეული კლასებით და ადამიანთა ზედმეტად ან ნაკლებად წარმოდგენილი ჯგუფებით. ადამიანზე ორიენტირებული სისტემების აშენებამ ხშირად შეიძლება გამოიწვიოს გენდერული, ეთნიკური და ასაკობრივი მიკერძოება. ამის საპირისპიროდ, დიზაინის მიერ გენერირებული ტრენინგის მონაცემები სათანადოდ არის დაბალანსებული და არ გააჩნია ადამიანური მიკერძოება.

სინთეზური მონაცემები შეიძლება გახდეს ძლიერი გამოსავალი ხელოვნური ინტელექტის მიკერძოების პრობლემის გადასაჭრელად. სინთეზური მონაცემები წარმოიქმნება ნაწილობრივ ან მთლიანად ხელოვნურად, ვიდრე გაზომილი ან ამოღებული რეალური მოვლენებისა თუ ფენომენებისგან. თუ მონაცემთა ნაკრები არ არის მრავალფეროვანი ან საკმარისად დიდი, ხელოვნური ინტელექტის მიერ გენერირებული მონაცემები შეიძლება შეავსონ ხვრელები და შექმნან მიუკერძოებელი მონაცემთა ნაკრები. Საუკეთესო ნაწილი? ამ მონაცემთა ნაკრების ხელით შექმნას გუნდებს შეიძლება რამდენიმე თვე ან წელი დასჭირდეს. როდესაც შექმნილია სინთეზური მონაცემებით, ეს შეიძლება გაკეთდეს ღამით.

კომპიუტერული ხედვის მიღმა, რა არის სინთეზური მონაცემების სხვა პოტენციური გამოყენების შემთხვევები?

გარდა კომპიუტერის ხედვის გამოყენების უამრავი შემთხვევისა, რომლებიც დაკავშირებულია სამომხმარებლო პროდუქტებთან, ავტონომიასთან, რობოტიკასთან, AR/VR/metaverse-სთან და სხვასთან, სინთეზური მონაცემები ასევე გავლენას მოახდენს მონაცემთა სხვა მოდალობაზე. ჩვენ უკვე ვხედავთ, რომ კომპანიები იყენებენ სინთეზურ მონაცემთა მიდგომებს სტრუქტურირებული ცხრილის მონაცემების, ხმის და ბუნებრივი ენის დამუშავებისთვის. ძირითადი ტექნოლოგიები და გენერაციის მილსადენები განსხვავდება თითოეული მოდალისთვის და უახლოეს მომავალში ჩვენ ველოდებით მრავალმოდალურ სისტემებს (მაგ. ვიდეო + ხმა).

არის კიდევ რამე, რისი გაზიარებაც გსურთ Synthesis AI-ის შესახებ?

გასული წლის ბოლოს გამოვედით HumanAPI, Synthesis AI-ს სინთეზური მონაცემების შესაძლებლობების მნიშვნელოვანი გაფართოება, რაც საშუალებას აძლევს მილიონობით უნიკალური, მაღალი ხარისხის 3D ციფრული ადამიანის პროგრამულ გენერირებას. ეს განცხადება მოდის FaceAPI სინთეზური მონაცემების სერვისის პროდუქტის გამოშვებიდან რამდენიმე თვის შემდეგ, რომელმაც მიაწოდა 10 მილიონზე მეტი ეტიკეტირებული სახის გამოსახულება წამყვანი სმარტფონების, ტელეკონფერენციის, საავტომობილო და ტექნოლოგიური კომპანიებისთვის. HumanAPI არის შემდეგი ნაბიჯი კომპანიის მოგზაურობისას, მხარდასაჭერად გაფართოებული კომპიუტერული ხედვის ხელოვნური ინტელექტის (AI) აპლიკაციების მხარდასაჭერად.

HumanAPI ასევე უამრავ ახალ შესაძლებლობებს აძლევს ჩვენს მომხმარებლებს, მათ შორის ჭკვიანი AI ასისტენტები, ვირტუალური ფიტნეს მწვრთნელები და რა თქმა უნდა, მეტავერსიული აპლიკაციების სამყარო.

რეალური სამყაროს ციფრული დუბლის შექმნით, მეტავერსი საშუალებას მისცემს ახალ აპლიკაციებს, დაწყებული ხელახლა წარმოსახვითი სოციალური ქსელებიდან, გასართობი გამოცდილებიდან, ტელეკონფერენციებიდან, თამაშებიდან და სხვა. კომპიუტერული ხედვის ხელოვნური ინტელექტი ფუნდამენტური იქნება იმისთვის, თუ როგორ ხდება რეალური სამყაროს აღბეჭდვა და ხელახლა შექმნა მაღალი ერთგულებით ციფრულ სფეროში. ფოტორეალისტური, ექსპრესიული და ქცევით ზუსტი ადამიანები კომპიუტერული ხედვის აპლიკაციების მომავლის მნიშვნელოვანი კომპონენტი იქნება. HumanAPI არის პირველი პროდუქტი, რომელიც კომპანიებს საშუალებას აძლევს შექმნან სრულყოფილად ეტიკეტირებული მთელი სხეულის მონაცემები მოთხოვნით, რათა შექმნან უფრო ეფექტური AI მოდელები, მათ შორის პოზების შეფასება, ემოციების ამოცნობა, აქტივობისა და ქცევის დახასიათება, სახის რეკონსტრუქცია და სხვა.

გმადლობთ შესანიშნავი ინტერვიუსთვის, მკითხველს, ვისაც სურს მეტი გაიგოს, უნდა ეწვიოს სინთეზის AI.

unite.AI-ს დამფუძნებელი პარტნიორი და წევრი Forbes-ის ტექნოლოგიური საბჭო, ანტუანი არის ა ფუტურისტი რომელიც გატაცებულია ხელოვნური ინტელექტისა და რობოტიკის მომავლის მიმართ.

ის ასევე არის დამფუძნებელი Securities.io, ვებსაიტი, რომელიც ფოკუსირებულია დამრღვევ ტექნოლოგიებში ინვესტირებაზე.