Wywiady
Dr. Judith Bishop, Dyrektor Senior ds. Specjalistów AI w Appen – Seria Wywiadów

Dr. Judith Bishop jest Dyrektorem Senior ds. Specjalistów AI dla regionu APAC/USA w Appen. Prowadzi i rozwija zespół wybitnych i doświadczonych lingwistów, lingwistów komputacyjnych oraz ekspertów we wszystkich formach komunikacji ludzkiej (mowy, pisania i gestów), aby dostarczać dane szkoleniowe AI o niezrównanej kombinacji jakości i szybkości.
Czym było to, co początkowo przyciągnęło Cię do lingwistyki?
Po raz pierwszy usłyszałam o lingwistyce od ulubionego nauczyciela angielskiego w szkole średniej. Byłam jednym z tych dzieci, które są równie zainteresowane językami obcymi i naukami humanistycznymi, jak i matematyką i naukami ścisłymi. Lingwistyka jest nauką o tym, jak działa język, więc połączyła moje zainteresowania. Jak wiele osób, gdy tylko dowiedziałam się o tym, byłam całkowicie zaangażowana. Co może być bardziej fascynujące niż to, jak komunikujemy swoje myśli i uczucia innym? Lingwistyka bada struktury językowe, które, pomimo różnic w dźwiękach i systemach pisma, są często podobne na powierzchni, ponieważ wszystkie są produktem naszego wspólnego ludzkiego istnienia.
Czy mógłbyś podzielić się historią, jak znalazłeś się pracując w AI?
Pracuję w Appen od 2004 roku, wspierając rozwój produktów i usług związanych z technologią językową. W tym czasie AI wyłoniło się jako kompleksowa struktura, misja i wizja technologii, które naśladują i rozszerzają ludzkie możliwości komunikacji, rozumowania i percepcji. W 2019 roku nasz zespół zmienił nazwę na Specjaliści AI, uznając, że nasza wiedza lingwistyczna i językowa jest kluczowa dla przedsięwzięcia AI. Nasze dane anotowane zapewniają niezbędne wsparcie dla sukcesu interakcji człowieka z produktami i usługami AI.
Pracujesz w AI przez ponad 16 lat, jakie są największe zmiany, które widziałeś?
Główną zmianą było rozproszenie uwagi z rozwoju podstawowej technologii na długi ogon przypadków użycia i aplikacji. Przez większość mojej kariery głównym celem opartych na języku AI było rozwinięcie i udoskonalenie podstawowego zestawu modeli, które naśladują ludzką percepcję i produkcję mowy, a mianowicie rozpoznawanie mowy, syntezę mowy i przetwarzanie języka naturalnego. Zbiory danych zwykle odpowiadały standardom etykietowania i pobierania danych oraz konwencjom, takim jak te opracowane przez konsorcjum Speecon (Interfejsy sterowane mową dla urządzeń konsumenckich). Te standardy pozwoliły deweloperom technologii podstawowej na porównanie ich wyników z wspólnymi strukturami danych i wspierają szybką ewolucję AI.
Rozszerzenie przypadków użycia AI w ostatnich latach spowodowało jednak uznanie, że modele AI ogólne, opracowane z tymi danymi, nie działają wystarczająco dobrze na bardziej specjalistyczne typy danych bez dalszego dostrajania. Ponadto, ponieważ zostały one opracowane na danych, które zostały celowo oczyszczone i „ustandaryzowane”, te modele muszą teraz być szkolone lub aktualizowane, aby zrozumieć i odpowiedzieć na całą różnorodność ludzkich danych wejściowych: wszystkie dialekty, wszystkie akcenty, wszystkie etniczności, wszystkie płcie i wszystkie inne wymiary ludzkiej różnorodności.
Czy mógłbyś omówić znaczenie niezbyt zorientowanych danych w uczeniu maszynowym?
Modele uczenia maszynowego, niezależnie od tego, czy są to modele nadzorowane, nienadzorowane, czy wzmocnione, będą odzwierciedlać uprzedzenia obecne w danych, na których są szkolone. Alyssa Simpson Rochwerger i Wilson Pang przedstawiają kilka doskonałych przykładów tego problemu w swojej niedawnej książce Real World AI. Jeśli brakuje wystarczających danych szkoleniowych dla segmentu populacji, model AI będzie mniej dokładny dla tego segmentu.
W innym powszechnym przypadku reprezentacja populacji może być wystarczająca, ale jeśli dane szkoleniowe zawierają korelacje między punktami danych, które odzwierciedlają rzeczywiste, ale niepożądane, warunki na świecie (takie jak niższy wskaźnik zatrudnienia kobiet lub wyższy wskaźnik przestępczości wśród Afroamerykanów), wynikające z tego aplikacje AI mogą utrwalać i nasilać te warunki.
Stowarzyszenia obecne w języku ogólnym mogą tworzyć uprzedzenia w aplikacjach NLP, które opierają się na statystycznych związkach znanych jako word embeddings. Jeśli „ona” i „pielęgniarka” są częściej kojarzone w wybranych danych szkoleniowych niż „oni” lub „on” i „pielęgniarka”, wówczas wynikowa aplikacja będzie używać „ona”, gdy będzie zmuszona wybrać singularną formę, aby odnieść się do pielęgniarki. Aby rozwiązać ten konkretny problem, naukowcy opracowali niedawno wariant słownika GN-GloVe, który jest neutralny pod względem płci.
W wrażliwych aplikacjach problemy z uprzedzeniami, takie jak te, mogą mieć dewastujący wpływ na użytkowników i mogą zniszczyć inwestycje biznesowe. Dobra wiadomość jest taka, że oprócz opracowania nowych, bardziej przejrzystych i inkluzywnych zbiorów danych, rośnie liczba aplikacji nauki o danych, które są opracowane w celu sprawdzenia obecności uprzedzeń w istniejących zbiorach danych szkoleniowych i aplikacjach AI.
Appen niedawno uruchomił nowe, różnorodne zbiory danych szkoleniowych dla inicjatyw NLP. Czy mógłbyś podzielić się niektórymi szczegółami na temat tego, jak te zbiory danych umożliwią użytkownikom końcowym otrzymanie tego samego doświadczenia, niezależnie od odmiany języka, dialektu, etnolektu, akcentu, rasy czy płci?
Z powodów wymienionych powyżej potrzebne są zbiory danych, które korygują istniejące uprzedzenia w systemach produkcyjnych AI, a także bardziej inkluzywne zbiory danych do szkolenia przyszłych systemów. Zbiory danych Appen, o których mowa, będą wspierać korektę uprzedzeń związanych z etnicznością i powiązanymi z nią etnolektami, takimi jak afroamerykańska odmiana języka angielskiego. Będą one zapewniać uzupełniające dane szkoleniowe, aby zwiększyć reprezentację tej populacji w modelach językowych AI.
Etniczność staje się kluczowym wymiarem demograficznym do jawnej etykietowania w danych AI. Lingwiści odnoszą się do odmian językowych związanych z określonymi etnicznościami jako „etnolektów”. Dostawcy danych AI, tacy jak Appen, uznają teraz, że jeśli kluczowe i różnorodne populacje mniejszościowe nie są reprezentowane jawnie w zbiorach danych szkoleniowych AI, nie możemy zagwarantować, że wynikające z tego systemy będą działać równie dobrze dla tych populacji.
Równa wydajność oznacza, że system rozpoznaje z równą dokładnością słowa i intencje użytkownika (ich znaczenia lub działania, które chcą osiągnąć) i w niektórych przypadkach sentyment; oraz że odpowiada w sposób, który równie zadowala potrzeby użytkownika i nie powoduje bardziej negatywnego wpływu na określoną populację użytkowników, ani praktycznie, ani psychologicznie.
Długotrwałe podejście do zbierania danych polegało na skupieniu się na geograficznie i dialektalnie reprezentatywnym próbkowaniu w bazach danych – zakładając, że technologia będzie się generalizować do całej populacji użytkowników języka. Jednakże gorsza wydajność technologii językowych, udokumentowana ostatnio dla użytkowników afroamerykańskiej odmiany języka angielskiego, pokazała, że tak nie jest. Populacje, które są różnorodne pod względem etniczności, rasy, płci i akcentu, muszą być proaktywnie włączone do zbiorów danych szkoleniowych, aby zapewnić, że ich głosy są słyszane i zrozumiane przez produkty i usługi AI. Różnorodne zbiory danych szkoleniowych AI Appen rozwiązują tę potrzebę.
Poza AI jesteś również poetką z kilkoma nagrodzonymi wierszami w różnych branżowych nagrodach. Jakie są Twoje poglądy na przyszłe AI, które będą wykazywać tego typu kreatywność, w tym pisanie wierszy?
To jest fascynujące pytanie. Poezja i inne formy ludzkiej kreatywności czerpią z wszystkich naszych ludzkich zasobów pamięci, percepcji, wrażeń i emocji, a także struktur i niuansów języka i obrazu, aby wytworzyć spostrzeżenia, które rezonują z współczesnymi problemami. Emily Dickinson napisała: „Jeśli czytam książkę i robi mi się całe ciało tak zimno, że żaden ogień nie może mnie ogrzać, wiem, że to jest poezja. Jeśli czuję fizycznie, jakby mi została ścięta głowa, wiem, że to jest poezja”. Musi być element percepcyjnego, sensorycznego lub emocjonalnego rozpoznania, ale także prawdziwe zaskoczenie.
Zaawansowane modele AI, takie jak GPT-3, statystycznie modelują prawdopodobieństwo występowania słów razem w różnych gatunkach, w tym poezji. Oznacza to, że mogą one wytworzyć coś, co rozpoznamy jako „poetycki” język, taki jak użycie podniesionego słownictwa, rymu i nieoczekiwanych lub surrealistycznych połączeń słów. Ale te generatywne modele językowe brakuje większości zasobów, wymienionych powyżej, które są potrzebne do wytworzenia dzieła sztuki, które oświetla, co to znaczy być człowiekiem we współczesnym czasie.
Co mnie fascynuje w AI w kontekście kreatywnym, to jego potencjał do wytworzenia całkowicie nowych spostrzeżeń – spostrzeżeń, które są inne co do rodzaju i poza zasięgiem jednego ludzkiego umysłu, nawet najbardziej wszechstronnego lub głęboko czytanego i doświadczonego ludzkiego umysłu. Gdy AI będzie miało stały dostęp do sensorycznych i percepcyjnych danych do analizy w szerokim zakresie ludzkich dziedzin (wizualnych, dotykowych, słuchowych, fizjologicznych, emocjonalnych), nie ma mowy o tym, co się dowiemy o sobie i świecie. Analityczne możliwości AI mogą wytworzyć nowe, żyzne obszary dla ludzkiej eksploracji kreatywnej.
Miałeś fenomenalną karierę do tej pory, co Twoim zdaniem powstrzymuje więcej kobiet przed dołączeniem do STEM i konkretnie AI?
Brak wzorów do naśladowania może być potężnym czynnikiem (i błędnym kołem). Istnieje prawdziwa trudność – kulturowa, społeczna i praktyczna – w przełamywaniu się w obszary, w których kobiety i osoby innych różnorodnych płci nie mają jeszcze głęboko ugruntowanej obecności, i w których szacunek dla tego, co możemy wnieść, jest zbyt często nieobecny. Moje doświadczenie jako lidera pokazało mi wielokrotnie, jak zespoły mogą być wytrwałe, kreatywne i skuteczne, gdy są inkluzywne dla różnorodnych doświadczeń i orientacji. Liderzy muszą być śmiali w swoich decyzjach i odważni w swojej pewności, że mogą poradzić sobie z wyzwaniami dla swojego sposobu myślenia, które różnorodne perspektywy przynoszą, wiedząc, że ta odwaga jest również silnie skorelowana z sukcesem finansowym i korporacyjnym.
Czy jest coś jeszcze, co chciałbyś podzielić się na temat Appen lub AI w ogóle?
Dostawcy danych, tacy jak Appen, mają potężny potencjał, aby wpłynąć na wyniki AI dla lepszego świata, dostarczając inkluzywne dane szkoleniowe.
Jednakże osiągnięcie celu inkluzywnego AI będzie wymagało udziału wszystkich. Nabywcy danych muszą również uznać swoją odpowiedzialność za jawne żądanie – i zapłatę – za inkluzywne dane, które zapewnią optymalną wydajność ich systemów dla wszystkich użytkowników w świecie rzeczywistym. A ci, którzy pochodzą z różnorodnych społeczności i dostarczają swoje dane do rozwoju AI, muszą być w stanie zaufać celom, którym będą używane. Budowanie tego zaufania będzie wymagało silnej przejrzystości i etycznych praktyk ze strony wszystkich, którzy zajmują się wrażliwymi danymi.
Dziękuję za wspaniały wywiad, cieszyłem się, ucząc się więcej o Twoich poglądach na AI i lingwistykę. Czytelnicy, którzy chcą dowiedzieć się więcej, powinni odwiedzić Appen.












