სტუბი სარა ნაგი, Seek AI-ის დამფუძნებელი და აღმასრულებელი დირექტორი - ინტერვიუს სერია - Unite.AI
დაკავშირება ჩვენთან ერთად

ინტერვიუები

სარა ნაგი, Seek AI - ინტერვიუს სერიის დამფუძნებელი და აღმასრულებელი დირექტორი

mm

გამოქვეყნებულია

 on

სარა ნაგი არის დამფუძნებელი და აღმასრულებელი დირექტორი ეძებეთ AI, პლატფორმა, რომელიც საშუალებას აძლევს ბიზნესის საბოლოო მომხმარებლებს დაუსვან Seek ზუსტად იგივე კითხვები, რასაც ისინი ამჟამად სვამენ მონაცემთა გუნდს, პირდაპირ Slack-ში, Teams-ში და ელფოსტაში. არავითარი „დახვეწა“ იმის შესახებ, თუ როგორ წერენ მათ კითხვას და არ სწავლობენ ახალ პლატფორმას.

თქვენ თავდაპირველად დაიწყეთ როგორც მკვლევარი ჰაბლის კოსმოსური ტელესკოპის მონაცემებით. რაზე მუშაობდი?

მე ვაკეთებდი კვლევას UCLA-სა და კალტექში, ვუყურებდი ზოგიერთ ყველაზე შორეულ გალაქტიკას, რომელთა დაკვირვებაც შესაძლებელი იყო ტელესკოპით, და ვმუშაობდი მათი ზოგიერთი თვისების ანალიზზე, როგორიცაა მათი მასა და ზომა. ამ კვლევის მიზანი იყო დაგვეხმარა გვესმოდეს განსხვავება ძალიან შორეულ გალაქტიკებსა და ჩვენს გალაქტიკებს შორის, რომლებიც უფრო ახლოს არიან ჩვენს გალაქტიკებთან და შეგვემუშავებინა მოდელები, თუ როგორ წარმოიქმნება ეს გალაქტიკები დროთა განმავლობაში.

შემდეგ მუშაობდით მონაცემთა მეცნიერად სხვადასხვა სტარტაპში. რომელი იყო უფრო საინტერესო პროექტებიდან?

ერთი პროექტი, რომელიც გამოირჩევა ბუნებრივი ენის დამუშავების (NLP) გამოყენებით საცალო პროდუქტებთან დაკავშირებული არასტრუქტურირებული ტექსტის კლასიფიკაციისთვის. მაგალითად, ნედლი ტექსტის აღება (მაგ. „air jordans green“) და მარკირება, როგორც სავარაუდო ბრენდი („Nike“). მე მყავდა კოლეგა, რომელიც სპეციალიზირებული იყო NLP-ში, რომელიც დაკავებული იყო სხვა პროექტით, ასე რომ, მე ნამდვილად არ უნდა მემუშავა ამ პროექტზე. ის საბოლოოდ გადმომცეს, რადგან ისინი დაკავებული იყვნენ. იმ დროს მე არც კი ვიცოდი არაფერი NLP-ის შესახებ, ამიტომ გავიარე რამდენიმე უფასო კურსი სტენფორდისგან და Fast.ai-დან, რათა გამეძლიერებინა ცოდნა. ძალიან მომეწონა NLP-ის სწავლა და დავიწყე იმის გაგება, თუ რატომ არის ეს ასე მნიშვნელოვანი და რატომ არის ხელოვნური ინტელექტის (AI) ენის გაგება დიდი ნაბიჯი ეგრეთ წოდებული „ზოგადი AI“-სკენ. ამ გამოცდილებამ ნამდვილად მიბიძგა, რომ სწრაფად გამეგო GPT-3-ის მნიშვნელობა, როდესაც ის პირველად გამოვიდა.

შეგიძლიათ გაგიზიაროთ გენეზისის ისტორია Seek AI-ის უკან?

როდესაც OpenAI-ს GPT-3 მოდელი გამოვიდა, მაშინვე მივხვდი, რა წარმოუდგენელი წინსვლა იყო ეს და განსაკუთრებით აღფრთოვანებული დავრჩი GPT-3 კოდის ჩაწერის აპლიკაციებით. ბოლოს და ბოლოს, მე კოდს ვწერდი მთელი დღე, როგორც მონაცემთა მეცნიერი, და იმის დანახვა, რომ ხელოვნური ინტელექტი ამას აკეთებდა - და იდეალურად აწარმოებდა კოდს - ყბის ჩავარდნა იყო. მე შევადარებდი ჩემს რეაქციას GPT-3-ზე იმ ფაქტს, რომ პირველად ვისწავლე VR-ის შესახებ ჯერ კიდევ 2013 წელს, რაც ჩემთვის კიდევ ერთი საინტერესო გამოცდილება იყო. საბოლოოდ გადავწყვიტე, რომ მჭირდებოდა სტარტაპის ჩამოყალიბება ამ ტექნოლოგიაზე ფსონის დასადებად. ზუსტად არ ვიცოდი, რის აშენებას ვაპირებდი, მაგრამ გულში მქონდა განცდა, რომ თუ ამ მოდელების შესახებ მეტს გავიგებდი, რაღაც ღირებული დარჩებოდა.

მას შემდეგ რაც ნამდვილად გავიგე მოდელების შესახებ, სწორედ მაშინ მივხვდი, რომ შემეძლო ამომეხსნა ტკივილის წერტილი, რომელსაც ვხვდებოდი ყველგან, სადაც ვმუშაობდი კვანტად ან მონაცემთა მეცნიერად. საკითხში მტკივნეული წერტილი ის იყო, რომ ბიზნესმენებს არ გააჩნდათ შესაბამისი ინსტრუმენტები, რომ უპასუხონ საკუთარ მონაცემებს. როგორც მონაცემთა მეცნიერი, მე ხშირად ვმუშაობდი პრობლემებზე, რომლებიც დიდ ყურადღებას მოითხოვდა, მაგრამ მე ხშირად მაწყვეტინებდნენ საქმიანი მხარის კოლეგები, რომლებსაც ჰქონდათ შეკითხვები მონაცემებთან დაკავშირებით, მაიძულებდნენ შემეჩერებინა ის, რასაც ვაკეთებდი. პროცესი არქაული და არაეფექტური ჩანდა. მივხვდი, რომ თუ ამ ახალ ტექნოლოგიაზე გავამახვილებ ყურადღებას პრობლემის გადაჭრაზე, ეს იქნებოდა კატეგორიის განმსაზღვრელი გადაწყვეტა ამ ძალიან მნიშვნელოვანი და ყველგან გავრცელებული პრობლემისა.

Seek AI იყენებს გენერაციულ AI-ს. შეგიძლიათ აუხსნათ ჩვენს მკითხველებს რა არის ეს?

"გენერაციული AI" ძალიან აჟიოტაჟური სიტყვაა, მაგრამ სხვა ზარმაცი სიტყვებისგან განსხვავებით, არ მჯერა, რომ აჟიოტაჟი დაუსაბუთებელია. ტერმინი ეხება მანქანათმცოდნეობის დიდ მოდელებს ასობით მილიარდი პარამეტრით, როგორიცაა Open AI's SLAB მდე GPT-3. ამ მოდელების ინოვაცია არის ის, რომ მათ შეუძლიათ ბუნებრივი ენის გაგება და ტექსტის, სურათების, კოდის და სხვათა გენერირება. თუ თქვენ ოდესმე თამაშობთ DALL-E-ით ან სტაბილური დიფუზიით, მაგალითად, სწრაფად მიხვდებით, რატომ არის ეს მოდელები ასე გაჟღენთილი; მათ აქვთ წარმოუდგენლად ადამიანის მსგავსი უნარი, გაიგონ ბუნებრივი ენის ბრძანებები და შეუძლიათ შექმნან ხელოვნება, რომელიც კონკურენციას უწევს საუკეთესო ადამიან მხატვრებს.

კოდის გენერირება არის გენერაციული AI-ს ერთ-ერთი ყველაზე ნიშური, მაგრამ ყველაზე მნიშვნელოვანი პროგრამა. მონაცემები სულ უფრო დიდი და რთული ხდება და, შესაბამისად, უფრო რთულია ადამიანის ხელით ანალიზი და ორგანიზება. თუმცა, ამ მონაცემებში იმდენი ინფორმაციაა დაშიფრული. ეს ინფორმაცია არ არის მხოლოდ მძლავრი ორგანიზაციებისთვის, მას ასევე შეუძლია გამოიწვიოს წარმოუდგენელი სამეცნიერო გარღვევა აკადემიურ მხარეზე. ხელოვნური ინტელექტის შექმნა მონაცემებიდან მნიშვნელობის ამოსაღებად განბლოკავს წარმოუდგენელ მნიშვნელობას სასარგებლო ინფორმაციის სახით.

Seek AI აშენებს ინტერფეისს, რომელიც საშუალებას აძლევს მომხმარებლებს დაუკავშირდნენ მონაცემებს ბუნებრივი ენის გამოყენებით. მცოდნე მუშაკებს შეუძლიათ წვდომა Seek AI-ს ბუნებრივი ენის ინტერფეისზე ელფოსტის, Slack-ის, ტექსტის და მომხმარებელთან ურთიერთობის მართვის (CRM) სისტემების მეშვეობით.

რა სხვა სახის მანქანური სწავლება გამოიყენება Seek AI-ში?

მიუხედავად იმისა, რომ გენერაციული AI არის ჩვენი მანქანათმცოდნეობის არქიტექტურის ნაწილი, ჩვენი არქიტექტურა ასევე მოიცავს ღია კოდის ღრმა სწავლის მოდელების რამდენიმე ჩანგლს. ტრანსფორმატორის მოდელები (რომლის "გენერაციული AI" ვარიანტია) მოიცავს ბევრ (მაგრამ არა ყველა) მოდელს, რომელსაც Seek იყენებს.

რატომ არის ასე მნიშვნელოვანი არატექნიკური მომხმარებლებისთვის, რომ შეძლონ მონაცემთა სწრაფად წვდომა?

რა სარგებლობა მოაქვს მონაცემებს, თუ ის არ ქმნის ROI-ს და როგორ შეუძლია ბიზნესს მიიღოს ეს ROI, თუ ბიზნესის მომხმარებლებმა მასზე წვდომაც კი არ შეუძლიათ? სწორედ ამიტომ, აბსოლუტურად აუცილებელია რაც შეიძლება მეტ ადამიანზე წვდომის მიცემა, სიზუსტის კომპრომისის გარეშე.

როდესაც მე ვიყავი მონაცემთა მეცნიერი, ზოგჯერ ვიღებდი თხოვნას აღმასრულებელი დირექტორისგან გარკვეული მონაცემების გაანალიზების შესახებ, რათა დავეხმარო ჩვენი კომპანიის პროდუქტს ან ბაზარზე გასვლის სტრატეგიას. ამ პროექტებს შეიძლება კვირები ან მეტი დრო დასჭირდეს. როგორც აღმასრულებელი დირექტორი ახლა, მე ნამდვილად მესმის ამ პროექტების მნიშვნელობა უფრო ღრმა დონეზე, ვიდრე მაშინ, როცა მონაცემთა მხარეზე ვიყავი. ხშირად ვხვდები, რომ მსურს, რომ უბრალოდ შემეძლოს მონაცემების ხელზე მოხვედრა, რათა უფრო სწრაფად მივიღო ჩემი გადაწყვეტილებები. ეს არის მაგალითი იმისა, რასაც ჩვენ ვხსნით Seek-ში.

როგორ ხდის Seek AI ამ მონაცემებს ასე ადვილად მოძიებას?

საინტერესოა ის, რომ მონაცემების გაანალიზება შესაძლებელია მხოლოდ კოდით. მართალია, არის პლატფორმები, რომლებიც აბსტრაქციულია ამ კოდზე (მაგ. მონაცემთა დაფები), მაგრამ თავსახურის ქვეშ არის მონაცემთა ანალიტიკოსების მიერ ხელით დაწერილი კოდი, რომელიც საშუალებას აძლევს მონაცემთა წარდგენას ბიზნესის საბოლოო მომხმარებლებს.

ცოდნის მუშაკთა უმეტესობამ არ იცის კოდირება, არ სურს კოდირება, ან უბრალოდ ვერც კი იღებს მონაცემებზე წვდომას მაშინაც კი, თუ მათ სურთ დაწერონ კოდი მის გასაანალიზებლად. ამიტომ, როდესაც მათ ესაჭიროებათ მონაცემები, მათ ან უნდა მოძებნონ ისინი დაფაზე, ან ჰკითხონ მონაცემთა ჯგუფს, თუ ვერ პოულობენ მას. რაც უფრო დიდი იქნება მონაცემთა ნაკრები, მით მეტი მოხდება ეს.

ამიტომ მონაცემთა გუნდები უნდა იყვნენ მათთვის მიმართული ბუნებრივი ენის კითხვების „მთარგმნელები“ ​​და თავად მონაცემები, რომლებსაც ისინი კითხულობენ კოდის გამოყენებით. ამ „მთარგმნელის“ შუამავლის ამოღება არის მთავარი, რასაც Seek აკეთებს.

როგორ უზრუნველყოფენ საწარმოები, რომ მათ მიერ გამოყენებული მონაცემები ზუსტია?

მონაცემთა სიზუსტესა და ხელმისაწვდომობას შორის ურთიერთგაგების მართვა უზარმაზარი გამოწვევაა. როგორც ბოლო ინტერვიუში ვთქვი, ერთის მხრივ, ხელმისაწვდომობა საშუალებას აძლევს ნაკლებად ტექნიკურ ადამიანებს დაიწყონ ურთიერთქმედება ცოდნის წყაროსთან, რომელიც არის კომპანიის მონაცემები. მეორე მხრივ, რა სარგებლობა მოაქვს დაბინძურებული წყლის (ანუ ცუდი მონაცემების) წყაროს?

მონაცემთა საუკეთესო გუნდები არიან ისეთები, რომლებიც მართავენ ამ გაცვლას მაქსიმალურად ოპტიმალური გზით, და ამის დიდი ნაწილი არის საგულდაგულო ​​კალიბრაცია და შემოწმება ნებისმიერი ხელსაწყოსთან, რომელთანაც არატექნიკურ მომხმარებლებს შეუძლიათ ურთიერთქმედება.

რა არის გამოყენების შემთხვევების რამდენიმე მაგალითი Seek AI პლატფორმისთვის?

ჩვენ უკვე ვაწვდით ღირებულებას კლიენტებისთვის და დიზაინის პარტნიორებისთვის B2B SaaS, Fintech, სამომხმარებლო პროდუქტის საქონლის (CPG) და B2C ელექტრონული კომერციის ვერტიკალურ ბაზრებზე.

Battlefinმაგალითად, არის ალტერნატიული ფინანსური მონაცემთა ნაკრების წამყვანი ბაზარი. მათ მიაჩნიათ, რომ სწრაფი, მაღალი ხარისხის პასუხების გაცემა საკუთარი მომხმარებლების კითხვებზე არის განსხვავება მათ კონკურენტებთან გამარჯვებასა და წაგებას შორის. კომპანიის აღმასრულებელმა დირექტორმა, ტიმ ჰარინგტონმა, აღნიშნა, „საძიებო AI-ს გადამწყვეტი როლი ითამაშა ჩვენი კომპანიის 2023 წლის სტრატეგიაში იმ უპირატესობის გამო, რომელიც გვაძლევს ჩვენს 2,400+ მონაცემთა ნაკრების წვდომას და ანალიზს მომხმარებელთა კითხვების საპასუხოდ. მე ვფიქრობ, რომ ჩვენი ROI Seek AI-ზე არის დაახლოებით 10x იმის საფუძველზე, თუ რას დავხარჯავდით ამ დონის ეფექტურობის მისაღწევად პლატფორმის გარეშე.

არის კიდევ რაიმე, რისი გაზიარებაც გსურთ Seek AI-ის შესახებ?

ეს შეიძლება იყოს სწორი ადგილი უსირცხვილო დანამატისთვის. Seek ამჟამად გთავაზობთ ჩვენი პლატფორმის უფასო საცდელებს, რომლებზეც წვდომა შესაძლებელია ეძიე.აი. ჩვენ მოხარულნი ვართ, რომ ვიქნებით პიონერები გენერაციული AI-ს მონაცემთა გუნდებში შემოტანის საქმეში და მოუთმენლად ველი ამ მოგზაურობას ჩვენს მომხმარებლებთან ერთად.

გმადლობთ შესანიშნავი ინტერვიუსთვის, მკითხველს, ვისაც სურს მეტი გაიგოს, უნდა ეწვიოს ეძებეთ AI.

unite.AI-ს დამფუძნებელი პარტნიორი და წევრი Forbes-ის ტექნოლოგიური საბჭო, ანტუანი არის ა ფუტურისტი რომელიც გატაცებულია ხელოვნური ინტელექტისა და რობოტიკის მომავლის მიმართ.

ის ასევე არის დამფუძნებელი Securities.io, ვებსაიტი, რომელიც ფოკუსირებულია დამრღვევ ტექნოლოგიებში ინვესტირებაზე.