Connect with us

Phil Hall, Chief Growth Officer at LXT – Wywiad z serii

Wywiady

Phil Hall, Chief Growth Officer at LXT – Wywiad z serii

mm

LXT Chief Growth Officer Phil Hall jest byłym dyrektorem Appen i członkiem Forbes Technology Council. W swojej roli kierowniczej w Appen zarządzał działem z ponad 1000 pracowników i odegrał kluczową rolę w osiągnięciu 17 kolejnych lat wzrostu przychodów z utrzymaniem silnej rentowności. W swojej obecnej roli w LXT pracuje z wybranym zespołem ekspertów, aby osiągnąć ambitne cele wzrostu.

LXT jest wschodzącym liderem w dziedzinie szkolenia danych AI do zasilania inteligentnych technologii dla globalnych organizacji, w tym największych firm technologicznych na świecie. We współpracy z międzynarodową siecią współpracowników LXT gromadzi i annotuje dane w wielu modalnościach z szybkością, skalą i elastycznością wymaganą przez przedsiębiorstwa. Posiadają one globalną ekspertyzę, która obejmuje ponad 115 krajów i 750 lokalizacji językowych. Założona w 2010 roku, LXT ma siedzibę w Toronto, Kanada, z oddziałami w Stanach Zjednoczonych, Australii, Egipcie, Wielkiej Brytanii i Turcji. Firma obsługuje klientów w Ameryce Północnej, Europie, Azji i na Bliskim Wschodzie.

Kiedy po raz pierwszy odkryłeś, że jesteś pasjonowany językiem?

Zawsze byłem zainteresowany językiem, ale jeśli chodzi o moje bezpośrednie zaangażowanie w język i lingwistykę, był jeden znaczący punkt zwrotny dla mnie. Zrozumieliśmy bardzo wcześnie, że jedno z naszych dzieci jest dyslektyczne, a gdy porozmawialiśmy z ich szkołą o dodatkowym wsparciu, powiedzieli, że chociaż mają programy, które mogą uzyskać, jest też wiele rzeczy, które mogę zrobić jako wolontariusz w szkole, aby pomóc naszej córce i innym dzieciom. Wszystko poszło dobrze, a stamtąd poszedłem studiować lingwistykę i zacząłem uczyć na dwóch uniwersytetach tutaj w Sydney.

Czy nauczanie lingwistyki przed przejściem do przestrzeni danych mowy, co zainspirowało Cię do zmiany focusu?

Sydney-based Appen właśnie przechodził transformację z operacji prowadzonej w pokoju w domu do pełnoprawnej operacji komercyjnej. Powiedziano mi, że szukają lingwistów (a może bardziej dokładnie, lingwisty!) i zostałem przedstawiony założycielom Julie i Chris Vonwiller. Przejście było stopniowe i rozciągało się na około dwa lata. Byłem niechętny odejść od nauczania – praca z wysoko uzdolnionymi studentami była zarówno inspirująca, jak i bardzo przyjemna. Ale szczególnie w tych pionierskich latach rozwiązywałem trudne problemy wraz z wiodącymi ekspertami w dziedzinie technologii językowej, a poziom emocji był wysoki. Wiele rzeczy, które są dzisiaj przyjmowane jako pewnik, było wtedy bardzo wyzwaniem.

Wyłoniłeś się z emerytury, aby dołączyć do LXT. Co motywowało Cię do tego?

To jest interesujące pytanie, ponieważ naprawdę cieszyłem się emeryturą. W rzeczywistości nasz współzałożyciel i CEO Mohammad Omar podejrzewał mnie kilka miesięcy przed moją odpowiedzią na jego pierwsze zapytanie, ponieważ żyłem spokojnym życiem i nie myślałem o powrocie do pełnoetatowej pracy. Po zgodzie na pierwszą rozmowę, gdzie Mo zapytał o możliwość dołączenia do LXT, spodziewałem się tylko słuchać grzecznie i odmówić.

Ale ostatecznie okazja była po prostu zbyt dobra, aby ją odrzucić.

Podczas rozmowy z Mohammadem i innymi członkami zespołu LXT natychmiast rozpoznałem wspólną pasję do języka. Zespół, który Mohammad zebrał, składał się z kreatywnych myślicieli z nieograniczoną energią, którzy byli w pełni zaangażowani w misję firmy.

Gdy dowiedziałem się więcej o okazji z LXT, zrozumiałem, że jest to okazja, której nie chcę przegapić. Była to firma z ogromnym potencjałem do rozwoju i wzrostu w dziedzinie, której jestem pasjonatem. A ponieważ rynek AI rośnie wykładniczo, okazja do pomocy więcej organizacjom w przejściu od eksperymentowania do produkcji jest ekscytującą, której jestem bardzo zadowolony być częścią.

Jakie są obecne wyzwania związane z pozyskiwaniem danych na dużą skalę?

Wyzwania są tak różnorodne, jak aplikacje, które je napędzają.

Z praktycznego punktu widzenia wyzwania obejmują autentyczność, niezawodność, dokładność, bezpieczeństwo i zapewnienie, że dane są odpowiednie do celu – i to bez uwzględniania rosnącej liczby wyzwań prawnych i etycznych związanych z pozyskiwaniem danych.

Na przykład rozwój technologii w celu wspierania samochodów autonomicznych wymaga zbierania ogromnych ilości danych w wielu scenariuszach, aby samochód mógł zrozumieć, jak reagować w sytuacjach rzeczywistych. Istnieje nieskończona liczba przypadków brzegowych, które można napotkać podczas jazdy, więc algorytmy, które napędzają te pojazdy, potrzebują zestawów danych, które obejmują wszystko, od ulic po znaki stopu po spadające obiekty. A potem, jeśli pomnożysz to przez liczbę zdarzeń pogodowych, które mogą wystąpić, ilość danych szkoleniowych potrzebnych wzrasta wykładniczo. Firmy motoryzacyjne wkraczające w przestrzeń autonomiczną muszą ustanowić niezawodny potok danych, a robienie tego na własną rękę wymagałoby ogromnych zasobów.

Inny przypadek użycia to rozwinięcie istniejącego produktu AI głosowego na nowe rynki w celu zdobycia udziału w rynku i nowych klientów. To nieuchronnie wymaga danych językowych, a aby osiągnąć dokładność, jest krytyczne, aby źródło danych mowy z rodzimych użytkowników z różnych profili demograficznych. Po zebraniu danych pliki głosowe muszą być transkrybowane, aby przeszkolić algorytmy NLP produktu. Robienie tego dla wielu języków i w ilościach danych, które są potrzebne, aby być skutecznym, jest ekstremalnie wyzwaniem dla firm, które robią to na własną rękę, szczególnie jeśli nie mają wewnętrznej ekspertyzy w tej dziedzinie.

To są tylko dwa przykłady wielu wyzwań, które istnieją z pozyskiwaniem danych dla AI na dużą skalę, ale jak możesz sobie wyobrazić, domowa automatyka, dane urządzeń mobilnych i biometryczne zbieranie danych mają również swoje specyficzne wyzwania.

Jakie są obecne sposoby, w jakie LXT pozyskuje i annotuje dane?

W LXT zbieramy i annotujemy dane inaczej dla każdego klienta, ponieważ wszystkie nasze zaangażowania są dostosowane do spełnienia specyfikacji naszych klientów. Pracujemy w różnych typach danych, w tym audio, obraz, mowa, tekst i wideo. Dla zbierania danych pracujemy z globalną siecią kontrahentów, aby zebrać dane w tych różnych modalnościach. Zbieranie może się wahać od zbierania danych w środowiskach rzeczywistych, takich jak domy, biura lub w samochodzie, po studiu z doświadczonymi inżynierami w przypadku pewnych projektów zbierania danych mowy.

Nasze możliwości annotacji danych również obejmują wiele modalności. Nasze doświadczenie zaczęło się w przestrzeni mowy i w ciągu ostatnich 12 lat rozwinęliśmy się do ponad 115 krajów i ponad 750 lokalizacji językowych. To oznacza, że firmy wszystkich rozmiarów mogą polegać na LXT, aby im pomóc w przeniknięciu na wiele rynków i zdobyciu nowych segmentów klientów. Ostatnio rozwinęliśmy się w kierunku danych tekstowych, obrazowych i wideo, a nasza platforma wewnętrzna jest używana do dostarczania wysokiej jakości danych naszym klientom.

Inną ekscytującą dziedziną wzrostu dla nas jest nasza praca z annotacją zabezpieczeń. W zeszłym roku rozszerzyliśmy nasze obiekty zabezpieczeń ISO 27001 z dwóch do pięciu lokalizacji na całym świecie. Rozwinęliśmy już podręcznik, który pozwala nam tworzyć nowe obiekty w ciągu kilku miesięcy. Usługi, które koncentrujemy się w tych zabezpieczonych obiektach, są obecnie annotacją danych mowy i transkrypcją, ale mogą być używane do annotacji wielu typów danych.

Dlaczego pozyskiwanie danych w ten sposób jest lepszą alternatywą dla danych syntetycznych?

Dane syntetyczne to ekscytujący rozwój w dziedzinie AI i są dobrze przystosowane do określonych przypadków użycia, szczególnie przypadków brzegowych, które są trudne do uchwycenia w świecie rzeczywistym. Użycie danych syntetycznych rośnie, szczególnie we wczesnych stadiach dojrzałości AI, gdy firmy są nadal w trybie eksperymentowania. Jednak nasze własne badania pokazują, że gdy organizacje dojrzewają swoje strategie AI i wprowadzają więcej modeli do produkcji, są znacznie bardziej skłonne do używania nadzorowanych lub półnadzorowanych metod uczenia maszynowego, które polegają na danych annotowanych przez ludzi.

Ludzie są po prostu lepsi niż komputery w zrozumieniu niuansów, aby stworzyć dane potrzebne do szkolenia modeli ML do pracy z wysoką dokładnością, a nadzór ludzki jest również krytyczny, aby zmniejszyć stronniczość.

Dlaczego te dane są tak ważne dla mowy i przetwarzania języka naturalnego?

Dla algorytmów mowy i przetwarzania języka naturalnego, aby działały skutecznie na ich rynkach docelowych, muszą być szkolone z dużymi ilościami danych pochodzących od rodzimych użytkowników, którzy mają kontekst kulturowy użytkowników końcowych, których reprezentują. Bez tych danych, adopcja AI głosowej będzie miała poważne ograniczenia.

Ponadto środowisko musi być uwzględnione przy zbieraniu danych mowy. Jeśli rozwiązanie AI głosowej jest szkolone do użycia w samochodzie, na przykład, istnieją różne warunki drogowe i pogodowe, które wpływają na mowę i muszą być brane pod uwagę. Są to złożone scenariusze, w których doświadczony partner danych może pomóc.

Czy jest coś jeszcze, co chciałbyś podzielić się o LXT?

Po pierwsze, chcę podziękować za okazję do podzielenia się naszą historią! Chciałbym podkreślić, że nasza firma jest zaangażowana w pomoc organizacjom wszystkich rozmiarów w osiągnięciu sukcesu w ich inicjatywach AI. Skoncentrowaliśmy się na dostarczaniu wysokiej jakości danych AI firmom na całym świecie przez ponad 12 lat i będziemy szczęśliwi, aby połączyć się z kimkolwiek, kto szuka tworzenia niezawodnego potoku danych, aby wesprzeć swoje projekty AI.

Dziękuję za wspaniały wywiad, czytelnicy, którzy chcą dowiedzieć się więcej, powinni odwiedzić LXT.

Antoine jest wizjonerskim liderem i współzałożycielem Unite.AI, z niezachwianą pasją do kształtowania i promowania przyszłości sztucznej inteligencji i robotyki. Jako serialowy przedsiębiorca, uważa, że sztuczna inteligencja będzie tak samo przełomowa dla społeczeństwa, jak elektryczność, i często zachwycany jest potencjałem technologie przełomowych i AGI. Jako futurysta, poświęca się badaniu, jak te innowacje ukształtują nasz świat. Ponadto jest założycielem Securities.io, platformy skupiającej się na inwestowaniu w najnowocześniejsze technologie, które przeobrażają przyszłość i zmieniają całe sektory.