interjúk

Phil Hall, az LXT növekedési igazgatója – Interjúsorozat

korszerűsített on Június 6, 2023

Az LXT növekedési igazgatója Phil Hall az Appen korábbi ügyvezetője és Forbes Technológiai Tanács tag. Az Appennél betöltött vezető szerepében több mint 1,000 fős részleget vezetett, és kulcsszerepet játszott abban, hogy 17 egymást követő évben folyamatosan erős jövedelmezőséggel növekszik a bevétel. Jelenlegi beosztásában az LXT-nél egy válogatott szakértői csapattal dolgozik azon, hogy ambiciózus növekedési céljait érje el.

LXT kiterjesztés feltörekvő vezető szerepet tölt be a mesterséges intelligencia képzési adatok terén, hogy intelligens technológiát biztosítson a globális szervezetek számára, beleértve a világ legnagyobb technológiai vállalatait is. A közreműködők nemzetközi hálózatával együttműködve az LXT a vállalat által megkívánt sebességgel, nagyságrenddel és agilitással többféle módon gyűjti és jegyzi az adatokat. Több mint 115 országra és 750 nyelvi területre kiterjedő globális szakértelemmel rendelkeznek. A 2010-ben alapított LXT központja Torontóban, Kanadában van, és jelen van az Egyesült Államokban, Ausztráliában, Egyiptomban, az Egyesült Királyságban és Törökországban. A cég Észak-Amerikában, Európában, Ázsiában és a Közel-Keleten szolgál ki ügyfeleket.

Mikor fedezte fel először, hogy szenvedélyes a nyelv iránt?

Amióta az eszemet tudom, érdekelt a nyelv, de a nyelvvel és a nyelvészettel való közvetlen kapcsolatom szempontjából egyetlen jelentős fordulópont következett be számomra. Nagyon korán rájöttünk, hogy az egyik gyermekünk diszlexiás, és amikor az iskolájával beszéltünk a további támogatásról, azt mondták, hogy bár vannak olyan programok, amelyekhez hozzáférhetnek, vannak olyan dolgok is, amelyeket önkéntesként tehetek az iskolában, hogy segítsem az iskolánkat. lánya és más gyerekek. Jól ment, és onnantól nyelvészetet tanultam, és azon kaptam magam, hogy Sydney-ben két egyetemen tanítok.

Nyelvészetet tanított, mielőtt a beszédadattérbe költözött volna, mi inspirált arra, hogy áthelyezze a hangsúlyt?

A sydney-i székhelyű Appen éppen az otthoni szabad szobából kifogyott műveletből egy teljes értékű kereskedelmi tevékenységgé vált. Azt mondták, hogy nyelvészeket keresnek (talán pontosabban nyelvészt!), és bemutattak az alapítóknak, Julie és Chris Vonwillernek. Az átállás fokozatos volt, és körülbelül két éven át tartott. Nem szívesen hagytam volna el a tanítást – a jól teljesítő tanulókkal dolgozni inspiráló és szórakoztató volt. De különösen azokban az úttörő években nehéz problémákat oldottam meg a világ vezető nyelvtechnológiai szakértőivel, és az izgalom nagy volt. Sok minden, amit ma magától értetődőnek tekintenek, akkoriban nagy kihívást jelentett.

A nyugdíjból kikerülve csatlakoztál az LXT-hez. Mi motivált erre?

Ez egy érdekes kérdés, mivel határozottan jól éreztem magam nyugdíjas koromban. Valójában társalapítónk és vezérigazgatónk, Mohammad Omar megkeresett hónapokkal azelőtt, hogy válaszoltam volna a kezdeti kérdésére, mivel nyugodt életmódot éltem, és nem igazán gondoltam arra, hogy visszatérjek a teljes munkaidős munkához. Miután beleegyeztem, hogy felvegyem az első hívást, ahol Mo az LXT-hez való csatlakozás lehetőségéről érdeklődött, arra számítottam, hogy udvariasan hallgatok, és visszautasítom.

De végül a lehetőség egyszerűen túl jó volt ahhoz, hogy ellenálljon.

Amikor Mohammaddal és az LXT csapat többi tagjával beszélgettem, azonnal felismertem a nyelv iránti közös szenvedélyt. A Mohammad által összeállított csapat határtalan energiájú kreatív gondolkodókból állt, akik teljes mértékben elkötelezettek a vállalat küldetése mellett.

Ahogy többet megtudtam az LXT-vel kapcsolatos lehetőségről, rájöttem, hogy nem akarom kihagyni ezt a lehetőséget. Itt volt egy olyan cég, amely hatalmas potenciállal rendelkezik a terjeszkedésre és növekedésre egy olyan területen, amely iránt szenvedélyes vagyok. És mivel a mesterséges intelligencia piaca továbbra is exponenciálisan növekszik, izgalmas lehetőség, hogy több szervezetet segíthessek áttérni a kísérletezésről a termelésre, és nagyon örülök, hogy részese lehetek.

Melyek a jelenlegi kihívások a nagyarányú adatgyűjtés mögött?

A kihívások éppoly változatosak, mint az őket mozgató alkalmazások.

Gyakorlati szempontból a kihívások közé tartozik a hitelesség, a megbízhatóság, a pontosság, a biztonság és annak biztosítása, hogy az adatok megfeleljenek a célnak – anélkül, hogy figyelembe vennénk az adatgyűjtésben rejlő növekvő számú jogi és etikai kihívást.

Például az autonóm járműveket támogató technológia fejlesztése rendkívül nagy mennyiségű adat gyűjtését követeli meg számos forgatókönyv szerint, hogy az autó megértse, hogyan kell reagálni a valós helyzetekre. Végtelen számú éles esettel találkozhatunk vezetés közben, ezért az ezeket a járműveket meghajtó algoritmusoknak olyan adatkészletekre van szükségük, amelyek az utcáktól a stoptáblákon át a leeső tárgyakig mindent lefednek. És ha ezt megszorozzuk az előforduló időjárási események számával, akkor a szükséges edzésadatok mennyisége exponenciálisan megnő. Az autonóm térbe merészkedő autóipari cégeknek megbízható adatfolyamot kell létrehozniuk, és ennek önálló megvalósítása hatalmas mennyiségű erőforrást igényelne.

Egy másik felhasználási eset egy meglévő hangalapú mesterséges intelligencia termék új piacokra való kiterjesztése a piaci részesedés és az új ügyfelek megszerzése érdekében. Ehhez elkerülhetetlenül nyelvi adatokra van szükség, és a pontosság elérése érdekében elengedhetetlen, hogy az anyanyelvi beszélőktől származó beszédadatokat különféle demográfiai profilokban szerezzük be. Az adatok összegyűjtése után a beszédfájlokat át kell írni a termék NLP-algoritmusainak betanításához. Ezt több nyelven és a hatékonysághoz szükséges adatmennyiséggel megtenni rendkívül nehéz a vállalatok számára önállóan megtenni, különösen, ha hiányzik a belső szakértelem ezen a területen.

Ez csak két példa a sok kihívásra, amelyek a mesterséges intelligencia céljára történő adatgyűjtéssel kapcsolatosak, de ahogy elképzelhető, az otthoni automatizálásnak, a mobileszközöknek és a biometrikus adatgyűjtéseknek is megvannak a sajátos kihívásai.

Milyen módszereket alkalmaz az LXT jelenleg az adatok forrására és megjegyzéseire?

Az LXT-nél ügyfelenként eltérően gyűjtjük és jegyezzük fel az adatokat, mivel minden megbízásunkat az ügyfeleink specifikációinak megfelelően alakítjuk ki. Számos adattípuson dolgozunk, beleértve a hangot, képet, beszédet, szöveget és videót. Az adatgyűjtéshez a vállalkozók globális hálózatával dolgozunk, hogy ezekben a különböző módozatokban gyűjtsünk adatokat. A gyűjtések a valós környezetben, például otthonokban, irodákban vagy az autóban történő adatgyűjtéstől a tapasztalt mérnökökkel végzett stúdiókig terjedhetnek bizonyos beszédadatgyűjtési projektek esetében.

Adatfeljegyzési képességeink több módozatot is felölelnek. Tapasztalataink a beszédtérben kezdődtek, és az elmúlt 12 év során több mint 115 országban és több mint 750 nyelvi területen terjeszkedtünk. Ez azt jelenti, hogy bármilyen méretű vállalat számíthat az LXT-re, hogy segítsen behatolni a piacok széles körére és új ügyfélszegmenseket ragadni meg. A közelmúltban kiterjesztettük a szöveges, képi és videoadatokra, belső platformunkat pedig arra használjuk, hogy kiváló minőségű adatokat szállítsunk ügyfeleinknek.

A növekedés másik izgalmas területe a biztonságos annotációs munkánk volt. Éppen ebben az évben világszerte kettőről ötre bővítettük ISO 27001 biztonságos létesítményünk alapterületét. Most kifejlesztettünk egy játékkönyvet, amely lehetővé teszi számunkra, hogy néhány hónap alatt új létesítményeket hozzunk létre. A szolgáltatások, amelyekre ezekben a biztonságos létesítményekben összpontosítunk, jelenleg a beszédadat-annotáció és az átírás, de számos adattípushoz használhatók megjegyzések készítésére.

Miért kiváló alternatíva az ilyen módon történő adatbeszerzés a szintetikus adatokkal szemben?

A szintetikus adatok izgalmas fejlesztés az AI területén, és jól illeszkednek speciális felhasználási esetekhez, különösen az olyan szélsőséges esetekhez, amelyeket a valós világban nehéz megragadni. A szintetikus adatok használata növekszik, különösen a mesterséges intelligencia érettségének korai szakaszában, mivel a vállalatok még mindig kísérleti módban vannak. Azonban a sajátunk kutatás azt mutatja, hogy ahogy a szervezetek kidolgozzák mesterségesintelligencia-stratégiáikat, és egyre több modellt helyeznek át a termelésbe, sokkal nagyobb valószínűséggel alkalmaznak felügyelt vagy félig felügyelt gépi tanulási módszereket, amelyek ember által jegyzett adatokra támaszkodnak.

Az emberek egyszerűen jobban megértik a számítógépeknél az árnyalatokat, amelyek az ML-modellek nagy pontosságú működéséhez szükséges adatok létrehozásához szükségesek, és az emberi felügyelet is kritikus a torzítás csökkentése érdekében.

Miért olyan fontosak ezek az adatok a beszéd és a természetes nyelv feldolgozása szempontjából?

Ahhoz, hogy a beszéd- és természetesnyelv-feldolgozó algoritmusok hatékonyan működjenek a tervezett piacokon, nagy mennyiségű adatot kell képezniük olyan anyanyelvi beszélőktől, akik rendelkeznek az általuk képviselt végfelhasználók kulturális környezetével. Ezen adatok nélkül a hangos mesterségesintelligencia bevezetésének komoly korlátai lesznek.

Ezenkívül a környezettel is számolni kell a beszédadatok gyűjtésekor. Ha a betanított hangos mesterséges intelligencia megoldást például autóban fogják használni, akkor különböző út- és időjárási viszonyok befolyásolják a beszédet, és ezeket figyelembe kell venni. Ezek összetett forgatókönyvek, ahol egy tapasztalt adatpartner segíthet.

Van még valami, amit meg szeretne osztani az LXT-vel kapcsolatban?

Először is szeretném megköszönni a lehetőséget, hogy megoszthattam történetünket! Szeretném kiemelni, hogy cégünk elkötelezett amellett, hogy bármilyen méretű szervezetet AI kezdeményezéseikkel sikerre vigyen. Több mint 12 éve arra összpontosítunk, hogy nagymértékben testreszabott mesterségesintelligencia-adatokat szállítsunk a vállalatoknak szerte a világon, és örömmel állunk kapcsolatba bárkivel, aki megbízható adatfolyamot szeretne létrehozni AI-projektjeik támogatására.

Köszönjük a remek interjút, azoknak az olvasóknak, akik többet szeretnének megtudni, látogassanak el LXT kiterjesztés.