Wywiady
Dr Lingjia Tang, CTO i współzałożycielka Clinc – seria wywiadów

Dr Lingjia Tang, CTO i współzałożycielka klinika, jest profesorem informatyki na Uniwersytecie Michigan. Badania dr Tanga dotyczące budowania wielkoskalowej infrastruktury produkcyjnej dla inteligentnych aplikacji są powszechnie uznawane i szanowane w społeczności akademickiej. Oprócz pracy w Microsoft i Google Lingjia uzyskała tytuł doktora informatyki na Uniwersytecie Wirginii. Lingjia otrzymała niedawno prestiżowe nagrody, w tym ISCA Hall of Fame, Facebook Research Awards i Google Research Award.
Co początkowo przyciągnęło Cię do AI? Kiedy po raz pierwszy odkryłeś, że chcesz rozpocząć działalność związaną ze sztuczną inteligencją?
W połowie pierwszej dekady XXI wieku prowadziłem badania nad systemami wielkoskalowymi obsługującymi różne aplikacje i zastanawiałem się, jak zaprojektować serwery jako system oprogramowania, aby te aplikacje działały wydajniej. W tym czasie przechodziliśmy od pracy z tradycyjnymi aplikacjami internetowymi do funkcji opartych na uczeniu maszynowym. Wtedy zacząłem zwracać uwagę na algorytmy związane ze sztuczną inteligencją (AI) i zainteresowałem się fundamentalnym zrozumieniem działania aplikacji AI. Wkrótce potem zespół badawczy, z którym pracowałem, zdecydował się na zmianę podejścia i stworzenie własnych aplikacji AI jako punktów odniesienia do badań, co doprowadziło nas do opublikowania kilku pierwszych artykułów naukowych i opracowania naszego pierwszego produktu, Siriusa – otwartego, kompleksowego asystenta osobistego z obsługą głosu i obrazu.
Jako oprogramowanie typu open source, Sirius umożliwił ludziom samodzielne tworzenie konwersacyjnych wirtualnych asystentów. W tamtym czasie była to bardzo ograniczona możliwość dla ogółu społeczeństwa i tak naprawdę kontrolowana była tylko przez duże firmy, takie jak Google i Apple. Jednak kiedy wypuściliśmy oprogramowanie, zauważyliśmy, że wypełniamy krytyczną lukę i że w pierwszym tygodniu pobrano je dziesiątki tysięcy! To był punkt zwrotny, w którym wiedzieliśmy, że istnieje duże zapotrzebowanie rynku na tego typu oprogramowanie.
W 2015 roku uruchomiliśmy Clinc z myślą, że będziemy w stanie zapewnić każdemu – każdemu programiście, firmie, osobie – która chce móc zbudować wirtualnego asystenta z dostępem do wiedzy specjalistycznej, narzędzi i innowacji, aby móc to zrobić .
Clinc oferuje konwersacyjne rozwiązania AI bez polegania na słowach kluczowych i skryptach. Czy mógłbyś podać kilka szczegółów dotyczących sposobu osiągnięcia tego celu? Jakie wyzwania związane z przetwarzaniem języka naturalnego (NLP) należało pokonać?
Tym, co naprawdę odróżnia Clinc od innych konwersacyjnych platform sztucznej inteligencji dostępnych na rynku, są podstawowe algorytmy sztucznej inteligencji, które umożliwiają korzystanie z doświadczenia „człowieka w pokoju”, który rozumie niechlujny i nieskryptowany język. Pozwala to na wprowadzanie poprawek w celu wycofywania się i „naprawiania” błędów popełnionych w ludzkiej rozmowie oraz umożliwia złożony przebieg konwersacji — rozmowy, które prawdziwy człowiek byłby w stanie zrozumieć. W przeciwieństwie do algorytmu dopasowywania słów z mowy na tekst, Clinc analizuje dziesiątki czynników wprowadzanych przez użytkownika, w tym sformułowania, nastroje, intencje, ton głosu, porę dnia, lokalizację i relacje, a następnie wykorzystuje te czynniki, aby dostarczyć odpowiedź, która reprezentuje kompozycję wiedzy wydobytej z wytrenowanego mózgu. Na przykład, jeśli zapytam mojego wirtualnego asystenta: „ile wydałem na burgera?” musi zrozumieć, że pytam o pieniądze i wydatki, że pytam konkretnie o hamburgera i że hamburger jest rodzajem jedzenia i powinien być dostosowany do moich ostatnich wydatków w restauracji.
Osiągnięcie tego poziomu zrozumienia nie jest łatwe. Ogólnie rzecz biorąc, podzielilibyśmy konwersacyjną sztuczną inteligencję na dwa komponenty: rozumienie języka naturalnego (NLU) i zarządzanie dialogiem. Wyzwaniem, któremu musieliśmy sprostać, było znalezienie sposobu na zbudowanie systemu, który będzie w stanie dokładnie wyodrębnić kluczowe informacje i przewidzieć, o co pyta użytkownik.
Jesteśmy w stanie to zrobić poprzez wyrafinowaną, kontekstową, odgórną NLU, która jest przeszkolona pod kątem intuicyjności, aby nadążać za naturalnym przebiegiem rozmowy, rozumiejąc slang i kontekst. Dzieje się tak w porównaniu z konkurencyjnymi rozwiązaniami, które mają odgórne, oparte na regułach podejście do przetwarzania języka naturalnego (NLP), które nie pozwala na uzdrowienie poprzez konwersację, co oznacza, że jeśli klient popełni błąd, konkurencyjne rozwiązania sprawią, że wróci do punktu wyjścia , marnując czas i tylko frustrując użytkownika. Korzystamy również z crowdsourcingu, aby wyodrębnić nasze dane językowe w celu stworzenia bogatszego, zróżnicowanego zestawu danych, który można natychmiast wykorzystać do szkolenia modeli sztucznej inteligencji.
Czy mógłbyś omówić, w jaki sposób głębokie uczenie się jest wykorzystywane w systemie Clinc AI?
Clinc stosuje hybrydowe podejście do głębokiego uczenia się, w którym do pewnego stopnia korzystamy z tradycyjnego modelu starej szkoły i w razie potrzeby wykorzystujemy głębokie uczenie się. W szczególności używamy głębokiego uczenia się, aby zrozumieć słowa i języki w celu określenia przepływu dialogu. Ogólnie rzecz biorąc, cały nasz dialog jest połączeniem głębokiego uczenia się i symbolicznej sztucznej inteligencji. Nie używamy jeszcze głębokiego uczenia się do generowania języków, ponieważ w przypadku naszych klientów, którzy działają głównie w branży bankowej, istnieje wiele przepisów, których musi przestrzegać wirtualny asystent, które określają, co może, a czego nie może powiedzieć swoim klientom . Dlatego nadal istnieje duża niepewność co do tego, czy głębokie uczenie się będzie w stanie przestrzegać ustalonych ograniczeń językowych.
W tej chwili nie sądzę, że społeczność konwersacyjna AI jest całkowicie gotowa na pełne przyjęcie głębokiego uczenia się, podczas gdy społeczność akademicka jest w 100% gotowa, ale nie mogę się doczekać, aby zobaczyć, co potrafią nowe modele.
Jak wygląda proces w firmie, która chce dostosować reakcje sztucznej inteligencji do konkretnych odbiorców? Czy mógłbyś podać kilka przykładów tego, jak klienci korzystają obecnie z Clinc?
Umożliwiamy klientom licencjonowanie platformy, na której mogą budować według własnego uznania, lub korzystanie z naszego w pełni zbudowanego i przeszkolonego chatbota Finie, dostosowywanie go i integrowanie ze swoimi aplikacjami lub usługami przesyłania wiadomości. Finie może zająć się sprawami związanymi z saldami, transakcjami, historią wydatków, lokalizacją bankomatu, realizacją przelewu i nie tylko.
Moim ulubionym przykładem tego, jak klient dostosował sztuczną inteligencję Clinc do kierowania do określonej grupy odbiorców, jest İşbank. Jako największy prywatny bank w Turcji, już w 2018 roku zwrócili się do nas z prośbą o opracowanie swojego asystenta bankowości cyfrowej, Maxi. Aby nadać Maxi wyjątkową osobowość, İşbank zorganizował 14 grup fokusowych, aby ocenić, jakich cech i umiejętności oczekują klienci banku w wirtualnym asystent. Zatrudnili także aktorkę głosową, która miała recytować po turecku zdania związane z zadaniami bankowymi. Zespół bankowości konwersacyjnej İşbanku wymyślił te zdania, rozważając sposób, w jaki prawdziwi ludzie formułowaliby swoje potrzeby. Zgodnie z naszym zaleceniem zespół płacił uczestnikom rynków crowdsourcingu, takich jak Amazon Mechanical Turk, za podanie różnych sposobów wyrażania tych samych pytań, na przykład prośby o sprawdzenie salda („Jakie jest moje saldo”, „Ile mam pieniędzy na moim koncie”, „pokaż mi środki na moim koncie”) lub zapłacić rachunek („zapłać mój rachunek”, „płatności za rachunki”).
Ten przykład naprawdę pokazuje, jak bardzo İşbank zainwestował w oferowanie asystenta bankowości cyfrowej, który pomaga swoim klientom lepiej poruszać się po kontach. Dzięki Clinc İşbank udostępnił Maxi ponad 7.5 milionom osób w języku tureckim. Od momentu uruchomienia İşbank został szeroko przyjęty przez ponad 5.5 miliona użytkowników, przy średniej liczbie 9.8 interakcji na użytkownika. W ostatnich miesiącach, gdy w Turcji wzrosła liczba przypadków Covid-19, İşbank szybko przeszkolił Maxi w zakresie reagowania na zapytania związane z Covid-19. Od marca 2020 r. Maxi odpowiedziała na ponad 1.2 miliona zapytań klientów związanych z COVID-19, co oznacza wzrost wykorzystania o ponad 62%.
Co powiedziałabyś kobietom, które chcą dowiedzieć się więcej o sztucznej inteligencji, ale niechętnie się angażują, ponieważ jest to dziedzina zdominowana przez mężczyzn?
Na początek, nie sądzę, żeby istniał jakikolwiek powód, dla którego sztuczna inteligencja miałaby być uważana za dziedzinę zdominowaną przez mężczyzn. Myślę, że wiele kobiet-pionierek w dziedzinie sztucznej inteligencji radzi sobie naprawdę dobrze i ma ogromny wpływ. Myślę, że połączenie sztucznej inteligencji z polityką społeczną to wyjątkowy obszar, który ma potencjał, by wywrzeć ogromny wpływ na codzienne życie ludzi. Myślę, że w tym obszarze bardziej zróżnicowane spojrzenie na wszystkie aspekty byłoby dla nas bardzo korzystne, zwłaszcza że toczy się wiele dyskusji na temat uprzedzeń w sztucznej inteligencji związanych z rasą i płcią. Wierzę, że istnienie szerokiej społeczności programistów zajmujących się sztuczną inteligencją będzie nadal miało nieproporcjonalnie duży wpływ na społeczeństwo i politykę.
Kobietom zainteresowanym dołączeniem do branży AI gorąco polecam tę opcję, zwłaszcza jeśli chcesz wywrzeć wpływ. Przez lata sztuczna inteligencja bardzo się rozwinęła i wprowadziła innowacje, a bycie jej częścią to naprawdę ekscytujący czas.
Czy jest coś jeszcze, czym chciałbyś się podzielić na temat Clinc?
Clinc robi obecnie ogromne postępy. Osobiście, właśnie objąłem nową rolę dyrektora ds. technicznych w Clinc i jestem bardzo podekscytowany możliwością skupienia się na tym, jak możemy dalej współpracować z programistami i analitykami danych, aby zwiększyć zasięg naszej technologii. Patrząc w przyszłość, widzę, że zapotrzebowanie na aplikacje oparte na sztucznej inteligencji będzie się zmieniać, aby umożliwić korzystanie z nich również osobom bez wieloletniego doświadczenia w nauce o danych i uczeniu maszynowym. Na przykład, nie trzeba mieć dyplomu z projektowania graficznego, aby móc korzystać z Photoshopa. Myślę, że sztuczna inteligencja zmierza w kierunku, w którym programiści bez przeszkolenia w zakresie sztucznej inteligencji i uczenia maszynowego będą w stanie osiągać rezultaty i tworzyć wysokiej jakości aplikacje. Ogólnie rzecz biorąc, chcemy podkreślić, że jesteśmy oddani nie tylko użytkownikowi końcowemu, ale także programistom, niezależnie od poziomu, którzy są zainteresowani naszym rozwiązaniem.
Dziękuję za wspaniały wywiad, z niecierpliwością będę śledzić Twoje postępy. Każdy, kto chce dowiedzieć się więcej, powinien odwiedzić klinc.