სტუბი Thuy Le, პროდუქტის ხელმძღვანელი Speechmatics - ინტერვიუს სერია - Unite.AI
დაკავშირება ჩვენთან ერთად

ინტერვიუები

Thuy Le, პროდუქტის ხელმძღვანელი Speechmatics - ინტერვიუების სერია

mm

გამოქვეყნებულია

 on

Thuy Le არის პროდუქტის ხელმძღვანელი მეტყველებატიკა, Thuy-ს აქვს ორი ათწლეულის ღირებულების გამოცდილება ტექნოლოგიაში და ინოვაციური იდეების შემუშავებაში, ასევე აქვს ბაკალავრის ხარისხი მექანიკურ ინჟინერიაში MIT-დან და MS პროდუქტის დიზაინში სტენფორდიდან. Thuy-ს აქვს ფართო გამოცდილება პროდუქტის მენეჯმენტში, დიზაინსა და განვითარებაში, ასევე R&D, ინჟინერიაში, მედიის განვითარებასა და ბიზნეს სტრატეგიაში. Speechmatics-ში მას ევალება გამოუშვას ინოვაციური პროდუქტები და სერვისები, რათა უზრუნველყოს ბიზნესი დარჩეს ბაზარზე ლიდერი ყველაფერში, რასაც აკეთებს.

თქვენ შეუერთდით Speechmatics-ს 2019 წლის ნოემბერში მას შემდეგ, რაც იმუშავეთ ინდუსტრიების მრავალფეროვან სპექტრში, მათ შორის თვითმართვადი მანქანებისა და B2B ანალიტიკური პროგრამული უზრუნველყოფის ჩათვლით. რამ მოგხიბლათ მეტყველების ამოცნობაში მუშაობამ?

მე ყოველთვის მიზიდავდა ახალი ტექნოლოგიების გამოყენება საინტერესო გამოყენების შემთხვევებისთვის და მნიშვნელოვანი ზემოქმედებისთვის. მეტყველების ამოცნობა, განსაკუთრებით Speechmatics-ში, აკმაყოფილებს ამ კრიტერიუმებს. რა თქმა უნდა, ძალიან კარგი იყო, რომ ჩვენს მომხმარებლებს საშუალება მიეცათ გამოიყენონ მეტყველების ტექსტის მნიშვნელობა თავიანთი მრავალფეროვანი პროდუქტის შეთავაზებაში.

როგორც Speechmatics-ის პროდუქტის ხელმძღვანელი, რისგან შედგება თქვენი დღე? 

Speechmatics არის მასშტაბური და ჩვენი პროდუქტის გუნდი პატარაა (და მზარდი!), ასე რომ, არცერთი დღე არ არის მსგავსი და ყველა ჩიპს იღებს სადაც/როდესაც საჭიროა. როგორც პროდუქტის ხელმძღვანელი, ყველაფერი უმაღლესი დონის კომპანიისა და პროდუქტის სტრატეგიიდან დაწყებული, თქვენი ტიპიური პროდუქტის მოვალეობებით, საგზაო რუქის პრიორიტეტებით და მომხმარებლებთან ურთიერთქმედებით და დამთავრებული მიწოდების ირგვლივ პრობლემის დეტალური პრაქტიკული გადაწყვეტით, ყველაფერი სამართლიანი თამაშია. ცხადია, ურთიერთობის დამყარება ორგანიზაციაში სხვადასხვა ფუნქციებს შორის და რეკრუტირება ასევე როლის მნიშვნელოვანი ნაწილია.

შეგიძლიათ განიხილოთ სხვადასხვა დიალექტითა და აქცენტებით მონაცემთა ნაკრების წვდომის გამოწვევები? 

მეტყველების ტექნოლოგიაში, ძრავა, როგორც წესი, აგებულია ენის ერთ დიალექტზე გაწვრთნით, რაც ამ დიალექტს ყველაზე ზუსტად ამოიცნობს და გადაწერს. ინგლისურად, ეს არის ამერიკული ინგლისური და შეცდომის მაჩვენებელი ჩვეულებრივ უფრო მაღალია ავსტრალიური აქცენტებისთვის, ბრიტანული აქცენტებისთვის, იამაიკური აქცენტებისთვის და ა.შ. ასე რომ, კომპანიებისთვის, რომლებიც იყენებენ ტექნოლოგიას გლობალურ მომხმარებელთა ბაზასთან ურთიერთობისთვის, ეს წარმოადგენს დიდ გამოწვევას. სამი წლის წინ, 2018 წელს, ჩვენ გავუშვით Global English, ჩვენი ინდუსტრიის წამყვანი ენების პაკეტი, რომელიც ესმის ყველა ინგლისურ აქცენტს და დიალექტს და გასულ წელს, ჩვენ გავაგრძელეთ ეს მისია გლობალური ესპანურის გამოშვებით. ჩვენ გვჯერა, რომ იმისათვის, რომ მეტყველების ტექნოლოგიამ მიაღწიოს თავის უმაღლეს პოტენციალს, მან უნდა გაიგოს ყველა, ვისთანაც ურთიერთობს. ჩვენ მოუთმენლად ველით, რომ კიდევ უფრო დავხუროთ ხელოვნური ინტელექტის „აქცენტის ხარვეზი“ მეტი ინოვაციებით, რომლებიც ამ წლის ბოლოს მოვა.

რა არის მანქანური სწავლების ზოგიერთი მეთოდოლოგია, რომელიც გამოიყენება ამ მონაცემთა ნაკრებიდან ვარჯიშისთვის? 

ჩვენ ვიყენებთ ნაცნობ ზედამხედველობით ღრმა სწავლის ტექნიკას და ნერვულ ქსელებს ჩვენს ძრავში. ჩვენ ასევე მუდმივად ვიკვლევთ ახალ მიდგომებს, კერძოდ, როგორ შევამციროთ ASR მოდელებში საჭირო მარკირებული მონაცემების რაოდენობა. მეტყველების ამოცნობის ტექნოლოგიის შექმნისას მონაცემები მეფეა, ამიტომ კვლევის წინსვლა, რომელიც საშუალებას გვაძლევს გავაფართოვოთ ჩვენი მონაცემები, აუცილებელია. ჩვენს ძრავში ნერვული ქსელების გამოყენება საშუალებას გვაძლევს უკეთ განვაზოგადოთ სხვადასხვა კონტექსტში და ენაზე.

Speechmatics ამჟამად ინდუსტრიის ლიდერია, ტესტირების შედეგად დადგინდა, რომ Global Spanish არის 3-20% უფრო ზუსტი ვიდრე Google-ის შეთავაზება და 4-13% უფრო ზუსტი ვიდრე Microsoft-ის შესადარებელი პროდუქტი. რას მიაწერთ ამ წარმატებას? 

როგორც უკვე აღვნიშნე, იმისთვის, რომ მეტყველების ტექნოლოგია მართლაც იყოს ბიზნესისთვის აქტივი, ის უნდა დაეხმაროს მათ გაიგონ თავიანთი მომხმარებელთა მთელი ბაზა, არ აქვს მნიშვნელობა რომელ ენაზე საუბრობენ ან რა დიალექტზე იყენებენ. ეს არის Speechmatics-ის ინოვაციების საფუძველი და ჩვენ მზად ვართ გადავჭრათ ეს რთული გამოწვევები. და, ჩვენ გვყავს საოცარი გუნდი, რომელიც ვნებიანი, ამოძრავებულია და ინვესტიციას ახდენს ღრმა სწავლის უახლესი ტექნიკის გამოყენებით, რათა ჩვენს მომხმარებლებს შესთავაზოს საუკეთესო ტექნოლოგია ბაზარზე.

რომელ ენებს გვთავაზობენ ამჟამინდელი და რომელი ენების დასამატებლად მიმდინარეობს ამჟამად კვლევა? 

ჩვენ ამჟამად გთავაზობთ 30-ზე მეტ კომერციულ ენას, არაბულიდან მანდარინიდან, პოლონურიდან პორტუგალიურამდე და ბევრ სხვაზე. მაგრამ ეს ჩვენი ინგლისური და ესპანური ენების პაკეტებია გლობალური. წინსვლისას, ჩვენ ვეძებთ ახალ ტექნიკას, რომელიც არა მხოლოდ საშუალებას მოგვცემს დავამატოთ ახალი ენები უფრო სწრაფად, არამედ გავაუმჯობესოთ არსებული ენები უფრო რეგულარულად.

როგორია თქვენი შეხედულება მეტყველებით გააქტიურებულ მომავალზე, სადაც ხმა კომუნიკაციის ძირითადი ფორმაა? 

ბიზნესები სულ უფრო აგრძელებენ მეტყველების ამოცნობის ტექნოლოგიაში ღირებულების დანახვას: 2020 წელს საწარმოებს შორის აღინიშნა ტექნოლოგიების დანერგვის მკვეთრი ზრდა, გამოკითხულთა 68%-მა განაცხადა, რომ მათ კომპანიას აქვს ხმოვანი ტექნოლოგიების სტრატეგია - 18%-ით მეტი გასულ წელთან შედარებით. მაგრამ იმისათვის, რომ მან მიაღწიოს მაქსიმალურ მნიშვნელობის პოტენციალს, ტექნოლოგია განპირობებულია დონის ამაღლებით. საუბარი უფრო მეტს ეხება, ვიდრე უბრალოდ სიტყვებს – ის ასევე შედგება კონტექსტური მინიშნებებისგან, როგორიცაა სენტიმენტი, კადენცია, პუნქტუაცია, ფონის ხმაური, ტონი, მეტყველების ცვლილებები და სხვა. მიუხედავად იმისა, რომ ტექსტი მხოლოდ მეტყველების ამოცნობის ტექნოლოგიიდან იძლევა თავისთავად დიდ მნიშვნელობას, როდესაც საქმე ეხება აუდიო ფაილებს, ან თუნდაც ვიდეო ფაილებს, ჩაწერილი ფაქტობრივი მეტყველება ახლა მხოლოდ სიტყვების მიღმა შეიძლება გაგრძელდეს. მეტყველების ამოცნობის ტექნოლოგიის მომავალი ყველა ამ სხვა ფაქტორს მხედველობაში მიიღებს. მხოლოდ ამ შემთხვევაში იქნება არა მხოლოდ მეტყველების ტექსტად გადაქცევა, არამედ მეტყველების ფასეულობად და ყოველი ხმის ჭეშმარიტად გაგება.

არის კიდევ რაიმე, რისი გაზიარებაც გსურთ Speechmatics-ის შესახებ? 

ჩვენ გვაქვს რამდენიმე მართლაც საინტერესო წინსვლა, რომელიც გამოვა ამ წლის ბოლოს, რომელთა გაზიარებაც მოხარულნი ვართ, ასე რომ თვალი ადევნეთ მათ!

გმადლობთ შესანიშნავი ინტერვიუსთვის, მკითხველს, ვისაც სურს მეტი გაიგოს, უნდა ეწვიოს მეტყველებატიკა.

unite.AI-ს დამფუძნებელი პარტნიორი და წევრი Forbes-ის ტექნოლოგიური საბჭო, ანტუანი არის ა ფუტურისტი რომელიც გატაცებულია ხელოვნური ინტელექტისა და რობოტიკის მომავლის მიმართ.

ის ასევე არის დამფუძნებელი Securities.io, ვებსაიტი, რომელიც ფოკუსირებულია დამრღვევ ტექნოლოგიებში ინვესტირებაზე.