škrbina Carolyn Harvey, vodja operacij pri LXT – serija intervjujev – Unite.AI
Povežite se z nami

Intervjuji

Carolyn Harvey, vodja operacij pri LXT – serija intervjujev

mm
Posodobljeno on

Carolyn Harvey ima bogate izkušnje z vodenjem in rastočimi globalnimi operacijami na področju ustreznost iskanja razvrstitev in opombe za podatke ML. Carolyn je trenutno glavna operativna direktorica (COO). LXT kjer vodi oddelek za globalne operacije podjetja in zagotavlja dosledno izvajanje vseh podatkovnih programov in projektov AI. Osredotoča se na visokokakovostne podatke v velikem obsegu, krepitev učinkovitosti v dolgoročnih programih in prilagajanje na veliko število globalnih območij.

Kot COO LXT Carolyn posoja svoje bogate izkušnje za razvoj najboljše organizacije v svojem razredu.

Ali lahko na kratko opišete, kaj LXT počne in vašo vlogo glavnega operativnega direktorja?

Umetna inteligenca se za obstoj zanaša na podatke in LXT je nastajajoče vodilno podjetje pri zagotavljanju natančnih, etično pridobljenih podatkov, ki poganjajo inovacije AI. Kot glavni operativni direktor je moja vloga nadzorovati, voditi in širiti naše globalne operacije s strategijami, strukturo in procesi, ki nam omogočajo, da našim strankam dostavimo najkakovostnejše podatke AI. Zagotavljam, da zagotavljamo pravočasno v številnih primerih uporabe, od generativne umetne inteligence do ustreznosti iskanja in samovozečih avtomobilov, med mnogimi drugimi.

Kako se je razvilo poslanstvo LXT od njegove ustanovitve leta 2010? 

Naše poslanstvo je poganjati tehnologije prihodnosti z ustvarjanjem in izboljšavo podatkov v vseh jezikih, kulturah in modalitetah. Naš cilj je pomagati podjetjem vseh velikosti izkoristiti neverjetne prednosti, ki jih prinaša umetna inteligenca, tako da svoje modele oskrbuje z visokokakovostnimi podatki. Z razvojem poslanstva podjetja se je obseg naših storitev razširil s transkripcije jezika in zbiranja govora na široko paleto rešitev, vključno z zbiranjem podatkov in opombami za besedilo, slike in videoposnetke, generativne storitve umetne inteligence in več. Razširili smo tudi naš globalni odtis objektov s certifikatom ISO 27001, da bi zadostili naraščajočim potrebam naših strank po varnih podatkovnih storitvah.

Kateri so bili ključni dejavniki njegove rasti v sektorju podatkov o usposabljanju z umetno inteligenco?

Nadaljnje vlaganje v AI s strani organizacij vseh velikosti je spodbudilo našo rast. Podjetja zdaj vedo, da je umetna inteligenca pomembna za njihovo konkurenčnost, podatki pa poganjajo umetno inteligenco. Vendar niso vsi podatki enaki in podjetja, ki so uspešna na področju umetne inteligence, vedo, da so visokokakovostni podatki ključnega pomena za ustvarjanje natančnejše umetne inteligence.

Ker zdaj vsi razmišljajo o generativni AI, je ta trend LXT odprl še več priložnosti za rast. Ljudje so ključni pri zagotavljanju, da so te rešitve natančne, etične in odgovorne. Ponujamo vrsto generativnih storitev umetne inteligence na področjih, kot so fino prilagajanje velikih jezikovnih modelov, hitro ustvarjanje in drugo. Naše stranke vedo, da morajo biti rezultati njihovih generativnih izdelkov umetne inteligence dejanski, predstavljati raznoliko občinstvo in brez strupenega jezika, če želijo zgraditi zaupanje pri končnih uporabnikih. Te cilje jim lahko pomagamo doseči z našimi storitvami človeka v zanki.

Kako je eksplozija generativne umetne inteligence vplivala na LXT in njegove stranke?

LXT opaža vse večje povpraševanje po svojih podatkih o usposabljanju z umetno inteligenco zaradi generativne umetne inteligence, tako za osnovne jezikovno usmerjene podatke kot tudi za novejše vidike, povezane z analizo, ustvarjalnostjo in kritičnim mišljenjem. Opažamo tudi povečano povpraševanje po področnih znanjih in specializiranih profilih projektnih delavcev.

Zahteve strank vse bolj presegajo pretekle vnose strojnega učenja za mikro opravila v smeri LLM-jev in bolj zapletene nabore podatkov, ki jih zahtevajo aplikacije, kot so ChatGPT, Gemini in številne podružnice. Trenutno smo vključeni v več inovativnih projektov, kjer pišemo pozive, katerih namen je zmešati generativno umetno inteligenco, da vidimo, kako se odziva, in nato ustvarimo pravilen odgovor.

V prihodnosti se bo to morda razvilo v splošno umetno inteligenco (AGI), kjer bodo nabori podatkov preslikali v še bolj zapletena in sofisticirana dejanja.

Imate dolgoletne izkušnje pri iskanju in prilagajanju, da pomagate izboljšati te algoritme. Na katere načine vodilna podjetja izboljšujejo ustreznost iskanja, da bi zagotovila boljšo uporabniško izkušnjo?

V svetu, kjer je čas dragocen in so informacije povsod, lahko izboljšanje ustreznosti iskanja poveča zvestobo, poveča stopnjo konverzije in naredi uporabnike bolj produktivne.

Ustreznost iskanja se začne s čiščenjem in organiziranjem podatkov naših strank, izkoreninjenjem vsega, kar bi lahko ustvarilo lažne pozitivne rezultate, in ustvarjanjem dodatnih podatkovnih polj, po katerih lahko iskalniki in motorji za priporočila brskajo, da ustvarijo natančnejše rezultate. S pomočjo strojnega učenja in obdelave naravnega jezika lahko stranke opolnomočijo svoj iskalnik, da bolj intuitivno ugotovi namen uporabnika in se sčasoma seznani z njegovimi preferencami. Rezultat je hitrejša izkušnja iskanja, ki vodi do bolj prilagojenih rezultatov.

Doseganje tega cilja zahteva velike količine podatkov za usposabljanje, s posebnim poudarkom na algoritmih za usposabljanje, kako prepoznati, razvrstiti in vrniti ustrezne entitete ter kako ravnati s tipkarskimi napakami, slovničnimi napakami in drugimi anomalijami podatkov. Priporočamo tudi okrepitveni pristop človeka v zanki (HITL), da zagotovimo natančne podatke, zmanjšamo pristranskost in zagotovimo boljšo izkušnjo iskanja za končnega uporabnika. Z napredkom ML v zadnjih 10 letih se HITL še bolj osredotoča na postopke pregleda kakovosti, kar spodbuja potrebo po globljih izkušnjah ponudnikov podatkov.

Ali lahko podrobneje opišete pristop LXT k označevanju podatkov in kako zagotavlja kakovost in točnost podatkov o usposabljanju AI?

Kot operativna ekipa moramo najprej razumeti, kako stranke uporabljajo podatke, ki jih posredujemo pri razvoju njihovih izdelkov in storitev, da zagotovimo, da bodo ustrezali njihovim potrebam. Da bi se to zgodilo, moramo poiskati strokovnjake tako za projektno vodenje kot za komentiranje, ki imajo izkušnje z vrsto zahtevanih podatkov.

Od tam naprej gre predvsem za pripravo in iskanje pravih virov na začetku vsakega projekta. To vključuje usklajevanje s strankami glede dejavnikov uspeha v fazi določanja obsega ter poglobljene postopke kvalifikacij in preverjanja za avtorje projektov, ki upoštevajo pomembne podrobnosti, kot so izobrazba, posebni interesi, demografija in izkušnje. Razvijamo tudi podrobna učna in referenčna gradiva kot vodnik, prilagojena za vsak projekt. Uporabljamo zrel nadzor nad kakovostjo in upravljanjem procesov skozi vse življenjske cikle projekta. Pristop, ki ga uporabljamo, je usklajen z najboljšimi praksami v panogi in jih uporablja, kar zagotavlja, da rezultati izpolnjujejo pričakovanja strank.

In vse te metodologije služijo naši obljubi o zajamčeni kakovosti podatkov.

Kako se LXT spopada z izzivom označevanja nestrukturiranih podatkov, ki obsegajo več kot 80 % vseh podatkov?

LXT je zgradil notranjo platformo za označevanje, ki avtomatizira številne dele postopka označevanja in zagotavlja strukturo in dosleden uporabniški vmesnik za delavce. V fazi predprocesiranja se med drugim osredotočamo na pripravo podatkov, oblikovanje vhodnih datotek in odstranjevanje dvojnikov, v naknadni obdelavi pa naslovno pakiranje podatkov, zbiranje in oblikovanje za dostavo naročniku.

Preden se projekt začne, oblikujemo smernice, ki jih pregledamo s stranko in jih ponavljamo skozi življenjski cikel projekta, ko se stvari spreminjajo. Postopek označevanja podatkov lahko razdelimo na več nalog, da se pravilno osredotočimo na vsak element projekta. Poleg tega se izvajajo metodologije nadzora kakovosti za spodbujanje odprave napak v velikem obsegu.

Nazadnje je naša ekipa za operativno odličnost odgovorna za napredno upravljanje procesov, da zagotovimo visoko učinkovitost in razširljivost za naše projekte po vsem svetu.

Kateri so nekateri največji izzivi, s katerimi se sooča LXT pri zbiranju podatkov v velikem obsegu po vsem svetu, in kako jih premagate?

Raznolikost in pristranskost udeležencev in posledičnih zbirk podatkov sta pogosto eden največjih izzivov, s katerimi se bo soočil LXT in kateri koli ponudnik podatkov o usposabljanju AI. Drugi izzivi vključujejo nedavno povpraševanje po strokovnem znanju na področju in hitro spreminjajoče se okolje s prehodom na študije LLM in generativne podatke umetne inteligence.

Te izzive premagujemo z zelo proaktivnim pristopom k pridobivanju naše skupine kandidatov, kjer pregledamo strokovno znanje, izkušnje, prejšnje vloge, interese in demografske podatke, da oblikujemo pravo raznolikost med ekipami glede na spol ali druge vidike, kot je analitično razmišljanje ali kreativno pisanje, izobrazbo, med drugim.

Ko najdemo prave kandidate, zelo skrbimo za redno zaposlovanje delavcev, da bi dolgoročno zgradili bolj izkušeno, zvesto in zadovoljno delovno silo.

Kako LXT z vidika vrednotenja umetne inteligence ublaži pristranskost in zagotovi etične rezultate v sistemih umetne inteligence, ki jih pomaga usposabljati?

Kot smo že omenili, je zagotavljanje raznolikosti izziv, ki ga morajo rešiti številni ponudniki podatkov o usposabljanju z umetno inteligenco, kar bo v veliki meri pripomoglo k ublažitvi pristranskosti in zagotavljanju etičnih rezultatov.

Ponovno se bom skliceval na naše najboljše prakse sodelovanja, ki vključujejo iskanje raznolikih in reprezentativnih označevalcev ter natančno upoštevanje smernic in ukrepov za nadzor kakovosti. Imamo strategijo pridobivanja vpliva, ki nam omogoča, da delo prenesemo na različne in nove skupine označevalcev, na primer v jezikovnih regijah z dolgim ​​repom.

Ciljamo na etične rezultate z uporabo najboljših praks v panogi, usklajevanjem pričakovanj z našimi strankami in spodbujanjem višjih standardov za naše vodje projektov in označevalce. Komunikacija je bistvena, pa tudi revizije skladnosti, analiza pristranskosti in zavezanost zakonodaji o podatkih in zahtevam glede zasebnosti.

Kakšna je dolgoročna vizija LXT in kako vidite razvoj podjetja v naslednjih petih letih?

 Naša vizija je zagotoviti natančne, etično pridobljene podatke, ki bodo pomagali pri uvedbi umetne inteligence in tehnologij prihodnosti, ki bodo izboljšale in izboljšale izkušnje ljudi po vsem svetu.

Medtem ko sta avtomatizacija in tehnologija pomembni v AI, obstaja tudi pomembna človeška komponenta, ki dopolnjuje tehnologijo. Ko se premikamo od preprostih avtomatiziranih nalog k velikim jezikovnim modelom (LLM) in od generativne umetne inteligence k splošni umetni inteligenci (GAI), bo ključnega pomena, da izdelki umetne inteligence zvesto predstavljajo ljudi, tako tiste, ki ustvarjajo podatke, kot naše globalne skupnosti na velik.

Pri LXT si prizadevamo zagotoviti, da se umetna inteligenca uporablja na pozitiven in transformativen način, ki odraža te vrednote.

Hvala za odličen intervju, bralci, ki želite izvedeti več, naj ga obiščejo LXT.

Ustanovni partner unite.AI in član Forbesov tehnološki svet, Antoine je a futurist ki je navdušen nad prihodnostjo umetne inteligence in robotike.

Je tudi ustanovitelj Securities.io, spletno mesto, ki se osredotoča na vlaganje v prelomno tehnologijo.