stub Carolyn Harvey, dyrektor ds. operacyjnych w LXT – seria wywiadów – Unite.AI
Kontakt z nami

Wywiady

Carolyn Harvey, dyrektor ds. operacyjnych w LXT – seria wywiadów

mm
Zaktualizowano on

Carolyn Harvey ma rozległe doświadczenie w prowadzeniu i rozwijaniu globalnych operacji w dziedzinie trafność wyszukiwania ranking i adnotacja dla danych ML. Carolyn jest obecnie dyrektorem operacyjnym (COO) firmy rozszerzenie LXT gdzie kieruje działem operacji globalnych firmy, zapewniając spójne dostarczanie wszystkich programów i projektów dotyczących danych AI. Koncentruje się na wysokiej jakości danych na dużą skalę, budowaniu wydajności w programach długoterminowych i skalowaniu w dużej liczbie lokalizacji na całym świecie.

Jako dyrektor operacyjna LXT Carolyn wykorzystuje swoje bogate doświadczenie, aby stworzyć najlepszą w swojej klasie organizację.

Czy możesz krótko opisać, czym zajmuje się LXT i jaką rolę pełnisz jako dyrektor operacyjny?

Sztuczna inteligencja opiera się na istnieniu danych, a LXT jest wschodzącym liderem w dostarczaniu dokładnych, etycznych danych, które napędzają innowacje AI. Jako dyrektor operacyjny moja rola polega na nadzorowaniu, kierowaniu i rozwijaniu naszych globalnych działań poprzez strategie, struktury i procesy, które pozwalają nam dostarczać naszym klientom najwyższej jakości dane AI. Zapewniam, że dostarczamy na czas w szerokim zakresie zastosowań, od generatywnej sztucznej inteligencji po trafność wyszukiwania i samochody autonomiczne i wiele innych.

Jak ewoluowała misja LXT od momentu jej powstania w 2010 roku? 

Naszą misją jest wspieranie technologii przyszłości poprzez generowanie i ulepszanie danych w każdym języku, kulturze i modalności. Naszym celem jest pomaganie firmom każdej wielkości w czerpaniu korzyści z niesamowitych korzyści, jakie zapewnia sztuczna inteligencja, poprzez zasilanie ich modeli danymi wysokiej jakości. Wraz z ewolucją misji firmy rozszerzyliśmy zakres naszych usług, począwszy od transkrypcji języków i gromadzenia mowy, aż do szerokiej gamy rozwiązań, w tym gromadzenia danych i dodawania adnotacji do tekstu, obrazów i wideo, generatywnych usług AI i nie tylko. Rozszerzyliśmy także nasz globalny zasięg o obiekty posiadające certyfikat ISO 27001, aby sprostać rosnącym potrzebom naszych klientów w zakresie bezpiecznych usług danych.

Jakie były główne czynniki wzrostu w sektorze danych szkoleniowych AI?

Ciągłe inwestycje w sztuczną inteligencję organizacji każdej wielkości napędzają nasz rozwój. Firmy wiedzą teraz, że sztuczna inteligencja to klucz do utrzymania konkurencyjności, a dane napędzają sztuczną inteligencję. Jednak nie wszystkie dane są sobie równe, a firmy, które odnoszą sukcesy w dziedzinie sztucznej inteligencji, wiedzą, że wysokiej jakości dane mają kluczowe znaczenie dla tworzenia dokładniejszej sztucznej inteligencji.

Teraz, gdy wszyscy myślą o generatywnej sztucznej inteligencji, trend ten otworzył przed LXT jeszcze więcej możliwości rozwoju. Aby rozwiązania te były dokładne, etyczne i odpowiedzialne, kluczową rolę odgrywają ludzie. Świadczymy szereg usług generatywnej sztucznej inteligencji w obszarach takich jak dostrajanie dużych modeli językowych, szybkie tworzenie i nie tylko. Nasi klienci wiedzą, że aby zbudować zaufanie użytkowników końcowych, wyniki ich generatywnych produktów AI muszą opierać się na faktach, przedstawiać zróżnicowaną publiczność i być wolne od toksycznego języka. Możemy pomóc im osiągnąć te cele dzięki naszym usługom Human in the Loop.

Jak eksplozja generatywnej sztucznej inteligencji wpłynęła na LXT i jej klientów?

LXT odnotowuje rosnące zapotrzebowanie na dane szkoleniowe dotyczące sztucznej inteligencji ze względu na generatywną sztuczną inteligencję, zarówno w przypadku podstawowych danych zorientowanych na język, jak i nowszych aspektów związanych z analizą, kreatywnością i krytycznym myśleniem. Obserwujemy także wzrost zapotrzebowania na wiedzę dziedzinową i specjalistyczne profile pracowników projektowych.

Żądania klientów w coraz większym stopniu wykraczają poza dotychczasowe dane wejściowe uczenia maszynowego oparte na mikrozadaniach, kierując się w stronę LLM i bardziej złożonych zbiorów danych wymaganych przez aplikacje takie jak ChatGPT, Gemini i wiele innych. Obecnie jesteśmy zaangażowani w kilka innowacyjnych projektów, w których piszemy podpowiedzi mające na celu zmylenie generatywnej sztucznej inteligencji, aby zobaczyć, jak reaguje, a następnie utworzenie prawidłowej odpowiedzi.

W przyszłości może to dalej ewoluować w kierunku sztucznej inteligencji ogólnej (AGI), w której zbiory danych będą mapowane na jeszcze bardziej skomplikowane i wyrafinowane działania.

Masz wieloletnie doświadczenie w pracy nad wyszukiwaniem i personalizacją, co pomaga w ulepszaniu tych algorytmów. W jaki sposób wiodące firmy poprawiają trafność wyszukiwania, aby zapewnić użytkownikom lepszą wygodę?

W świecie, w którym czas jest cenny, a informacje są wszędzie, poprawa trafności wyszukiwania może zwiększyć lojalność, zwiększyć współczynniki konwersji i zwiększyć produktywność użytkowników.

Trafność wyszukiwania zaczyna się od oczyszczenia i uporządkowania danych naszych klientów, wykorzenienia wszystkiego, co może generować fałszywe alarmy, i utworzenia dodatkowych pól danych, które wyszukiwarki i rekomendacje będą mogły przeszukać w celu wygenerowania dokładniejszych wyników. Dzięki uczeniu maszynowemu i przetwarzaniu języka naturalnego klienci mogą usprawnić swoją wyszukiwarkę, aby z czasem bardziej intuicyjnie określała zamiary użytkownika i poznawała jego preferencje. Rezultatem jest szybsze wyszukiwanie, które prowadzi do bardziej spersonalizowanych wyników.

Osiągnięcie tego celu wymaga dużych ilości danych szkoleniowych, ze szczególnym naciskiem na algorytmy szkoleniowe dotyczące rozpoznawania, uszeregowania i zwracania odpowiednich jednostek oraz radzenia sobie z literówkami, błędami gramatycznymi i innymi anomaliami w danych. Zalecamy również metodę wzmacniania typu „człowiek w pętli” (HITL), aby zapewnić dokładne dane, zmniejszyć stronniczość i zapewnić użytkownikowi końcowemu lepsze doświadczenie wyszukiwania. Dzięki postępom w zakresie uczenia maszynowego w ciągu ostatnich 10 lat firma HITL w większym stopniu skupiła się na procesach kontroli jakości, co powoduje potrzebę głębszego doświadczenia dostawców danych.

Czy możesz rozwinąć podejście LXT do adnotacji danych i sposobu, w jaki zapewnia ono jakość i dokładność danych szkoleniowych AI?

Jako zespół operacyjny musimy najpierw zrozumieć, w jaki sposób klienci wykorzystują dostarczane przez nas dane podczas opracowywania swoich produktów i usług, aby mieć pewność, że będą one odpowiadać ich potrzebom. Aby tak się stało, musimy znaleźć ekspertów zarówno w zakresie zarządzania projektami, jak i adnotacji, którzy mają doświadczenie z rodzajem wymaganych danych.

Od tego momentu chodzi w dużej mierze o przygotowanie i znalezienie odpowiednich zasobów na początku każdego projektu. Obejmuje to kontaktowanie się z klientami w sprawie czynników sukcesu na etapie ustalania zakresu, a także dogłębne procesy kwalifikacji i weryfikacji autorów adnotacji projektu, które uwzględniają ważne szczegóły, takie jak wykształcenie, specjalne zainteresowania, dane demograficzne i doświadczenie. Opracowujemy również szczegółowe materiały edukacyjne i referencyjne, dostosowane do każdego projektu. Stosujemy dojrzały nadzór nad jakością i zarządzaniem procesami we wszystkich cyklach życia projektu. Podejście, które stosujemy, jest zgodne z najlepszymi praktykami branżowymi i na nich opiera się, zapewniając, że wyniki spełniają oczekiwania klientów.

Wszystkie te metodologie służą naszej obietnicy gwarantowanej jakości danych.

Jak LXT radzi sobie z wyzwaniem opisywania nieustrukturyzowanych danych, które stanowią ponad 80% wszystkich danych?

LXT zbudowało wewnętrzną platformę dodawania adnotacji, która automatyzuje wiele części procesu dodawania adnotacji oraz zapewnia pracownikom strukturę i spójny interfejs użytkownika. Na etapie pre-processingu skupiamy się m.in. na przygotowaniu danych, formatowaniu plików wejściowych i usuwaniu duplikatów, natomiast w postprocessingu zajmujemy się adresowym pakowaniem danych, zestawianiem i formatowaniem w celu dostarczenia ich do klienta.

Przed rozpoczęciem projektu tworzymy wytyczne, które są weryfikowane z klientem i powtarzane przez cały cykl życia projektu, w miarę zmian. Proces etykietowania danych możemy podzielić na wiele zadań, aby odpowiednio skupić się na każdym elemencie projektu. Ponadto wdrażane są metodologie kontroli jakości, aby eliminować błędy na dużą skalę.

Wreszcie, nasz Zespół Doskonałości Operacyjnej jest odpowiedzialny za zaawansowane zarządzanie procesami, aby zapewnić wysoką wydajność i skalowalność naszych projektów na całym świecie.

Jakie są największe wyzwania stojące przed LXT w zakresie gromadzenia danych na skalę globalną i jak je pokonać?

Różnorodność i stronniczość uczestników oraz wynikających z nich zbiorów danych to często jedne z największych wyzwań, przed którymi stoi LXT i każdy dostawca danych szkoleniowych AI. Inne wyzwania obejmują niedawne zapotrzebowanie na specjalistyczną wiedzę dziedzinową i szybko zmieniający się krajobraz wraz z przejściem na LLM i generatywne dane AI.

Pokonujemy te wyzwania poprzez wysoce proaktywne podejście do pozyskiwania naszej puli kandydatów, podczas którego sprawdzamy wiedzę specjalistyczną, doświadczenie, poprzednie role, zainteresowania i dane demograficzne, aby zapewnić odpowiednią różnorodność między zespołami ze względu na płeć lub inne aspekty, takie jak myślenie analityczne lub kreatywne pisanie, wykształcenie m.in.

Po pozyskaniu odpowiednich kandydatów przywiązujemy dużą wagę do regularnego angażowania pracowników, aby w dłuższej perspektywie zbudować bardziej doświadczoną, lojalną i usatysfakcjonowaną siłę roboczą.

Jeśli chodzi o ocenę sztucznej inteligencji, w jaki sposób LXT działa, aby złagodzić uprzedzenia i zapewnić etyczne wyniki w systemach sztucznej inteligencji, które pomaga szkolić?

Jak wspomniano wcześniej, zapewnienie różnorodności to wyzwanie, któremu musi sprostać wielu dostawców danych szkoleniowych w zakresie sztucznej inteligencji, a to w dużym stopniu przyczyni się do ograniczenia uprzedzeń i zapewnienia etycznych wyników.

Odniosę się jeszcze raz do naszych najlepszych praktyk w zakresie zaangażowania, które obejmują znajdowanie różnorodnych i reprezentatywnych adnotatorów oraz dokładne przestrzeganie wytycznych i środków kontroli jakości. Mamy strategię pozyskiwania wpływu, która pozwala nam dostarczać pracę zróżnicowanym i nowym grupom komentatorów, na przykład z regionów językowych o długim ogonie.

Naszym celem są wyniki etyczne poprzez stosowanie najlepszych praktyk branżowych, dopasowywanie się do oczekiwań naszych klientów i zapewnianie wyższych standardów naszym kierownikom projektów i autorom komentarzy. Niezbędna jest komunikacja, podobnie jak audyty zgodności, analiza stronniczości i przestrzeganie przepisów dotyczących danych i wymogów dotyczących prywatności.

Jaka jest długoterminowa wizja LXT i jak widzisz ewolucję firmy w ciągu najbliższych pięciu lat?

 Naszą wizją jest dostarczanie dokładnych, pochodzących z etycznych źródeł danych, które pomogą we wdrażaniu sztucznej inteligencji i technologii przyszłości, które poprawią doświadczenia ludzi na całym świecie.

Chociaż automatyzacja i technologia są ważne w sztucznej inteligencji, istnieje również ważny element ludzki, który uzupełnia technologię. W miarę przechodzenia od prostych, zautomatyzowanych zadań do dużych modeli językowych (LLM) oraz od generatywnej sztucznej inteligencji do ogólnej sztucznej inteligencji (GAI), niezwykle ważne będzie, aby produkty AI wiernie reprezentowały ludzi, zarówno tych, którzy generują dane, jak i nasze globalne społeczności w duży.

W LXT dokładamy wszelkich starań, aby sztuczna inteligencja była wykorzystywana w pozytywny i transformacyjny sposób, który odzwierciedla te wartości.

Dziękuję za wspaniały wywiad. Czytelnicy chcący dowiedzieć się więcej powinni odwiedzić nas rozszerzenie LXT.

Partner-założyciel unite.AI i członek Rada Technologiczna Forbesa, Antoine jest futurysta który jest pasjonatem przyszłości sztucznej inteligencji i robotyki.

Jest także Założycielem Securities.io, witryna internetowa skupiająca się na inwestowaniu w przełomowe technologie.