Интервјуа

Каролин Харви, главен оперативен директор во LXT – серија на интервјуа

Ажурирани on Февруари 27, 2024

Каролин Харви има долгогодишно искуство водење и растечки глобални операции во областа на релевантност за пребарување рангирање и прибелешка за ML податоци. Керолин моментално е главен оперативен директор (ЦОО) на LXT каде што го води глобалниот оперативен оддел на компанијата, обезбедувајќи доследна испорака на сите програми и проекти за податоци за вештачка интелигенција. Таа се фокусира на висококвалитетни податоци во обем, градење на ефикасност во долгорочните програми и скалирање низ голем број глобални локации.

Како КОО на LXT, Каролин го позајмува своето богато искуство за да развие организација која е најдобра во својата класа.

Можете ли накратко да опишете што работи LXT и вашата улога како КОО?

Вештачката интелигенција се потпира на постоењето на податоците, а LXT е нов лидер во доставувањето точни, етички извори на податоци кои ги поттикнуваат иновациите на вештачката интелигенција. Како главен оперативен директор, мојата улога е да ги надгледувам, водам и проширувам нашите глобални операции преку стратегии, структура и процеси кои ни овозможуваат да доставиме најквалитетни податоци за вештачката интелигенција на нашите клиенти. Обезбедувам дека испорачаме на време во широк опсег на случаи на употреба, од генеративна вештачка интелигенција до релевантност на пребарувањето и самоуправувачки автомобили, меѓу многу други.

Како еволуираше мисијата на LXT од нејзиното основање во 2010 година?

Нашата мисија е да ги поттикнеме технологиите на иднината преку генерирање податоци и подобрување на секој јазик, култура и модалитет. Нашата цел е да им помогнеме на компаниите од сите големини да профитираат од неверојатните придобивки што ги дава вештачката интелигенција преку напојување на нивните модели со висококвалитетни податоци. Како што еволуираше мисијата на компанијата, нашиот опсег на услуги се прошири од јазична транскрипција и собирање говор за да вклучи широк спектар на решенија, вклучувајќи собирање податоци и прибелешки за текст, слика и видео, генеративни услуги за вештачка интелигенција и многу повеќе. Исто така, го проширивме нашиот глобален отпечаток на капацитети сертифицирани со ISO 27001 за да ги задоволиме растечките потреби на нашите клиенти за безбедни услуги за податоци.

Кои беа клучните двигатели на нејзиниот раст во секторот за податоци за обука за вештачка интелигенција?

Континуираното инвестирање во вештачка интелигенција од организации од сите големини го поттикна нашиот раст. Компаниите сега знаат дека вештачката интелигенција е табела за да останат конкурентни, а податоците ја овластуваат вештачката интелигенција. Но, не се сите податоци еднакви, а компаниите кои успеваат во вештачката интелигенција знаат дека висококвалитетните податоци се клучни за создавање попрецизна вештачка интелигенција.

Сега со генеративната вештачка интелигенција на сите мисли, овој тренд отвори уште повеќе можности за раст за LXT. Луѓето се клучни за да се осигураат дека овие решенија се точни, етички и одговорни. Обезбедуваме низа генеративни услуги за вештачка интелигенција во области како што се дотерување големи јазични модели, брзо креирање и многу повеќе. Нашите клиенти знаат дека за да изградат доверба со крајните корисници, резултатот од нивните генеративни производи со вештачка интелигенција треба да биде фактички, да претставува разновидна публика и да нема токсичен јазик. Можеме да им помогнеме да ги постигнат овие цели со нашите човечки услуги во јамката.

Како експлозијата на генеративната вештачка интелигенција влијаеше на LXT и неговите клиенти?

LXT забележа зголемена побарувачка за своите податоци за обука за вештачка интелигенција поради генеративната вештачка интелигенција, како за основни податоци ориентирани кон јазикот, така и за поновите аспекти поврзани со анализа, креативност и критичко размислување. Гледаме и зголемување на побарувачката за знаење за домен и специјализирани профили за проектни работници.

Барањата на клиентите сè повеќе ги надминуваат микро задачите машинско учење влезови од минатото кон LLM и посложените збирки на податоци што ги бараат апликациите како ChatGPT, Gemini и многуте гранки. Во моментов сме вклучени во неколку иновативни проекти каде што пишуваме инструкции кои имаат за цел да ја збунат генеративната вештачка интелигенција за да видиме како таа реагира, а потоа да го создадеме точниот одговор.

Во иднина, ова може понатаму да еволуира во вештачка општа интелигенција (AGI) каде множествата на податоци ќе се пресликуваат на уште покомплицирани и пософистицирани дејства.

Имате долгогодишно искуство со работа во пребарување и персонализација за да помогнете во подобрување на овие алгоритми. Кои се некои од начините на кои водечките компании ја подобруваат нивната релевантност за пребарување за да обезбедат подобро корисничко искуство?

Во свет каде што времето е скапоцено и информациите се насекаде, подобрувањето на релевантноста на пребарувањето може да ја зајакне лојалноста, да ги зголеми стапките на конверзија и да ги направи корисниците попродуктивни.

Релевантноста на пребарувањето започнува со чистење и организирање на податоците на нашите клиенти, искоренување на сè што може да генерира лажни позитиви и создавање дополнителни полиња со податоци преку кои моторите за пребарување и препораки можат да пребаруваат за да генерираат попрецизни резултати. Со помош на машинско учење и обработка на природен јазик, клиентите можат да го поттикнат својот пребарувач поинтуитивно да ја утврдат намерата на корисникот и да дознаат за нивните преференции со текот на времето. Резултатот е побрзо искуство со пребарување кое води до поперсонализирани резултати.

Постигнувањето на оваа цел бара големи количини на податоци за обука, со посебен фокус на алгоритмите за обука како да се препознаат, рангираат и враќаат релевантните ентитети и како да се постапуваат со печатни грешки, граматички грешки и други аномалии на податоците. Исто така, препорачуваме пристап за зајакнување на човекот во јамката (HITL) за да обезбеди точни податоци, намалена пристрасност и да обезбеди подобро искуство за пребарување за крајниот корисник. Со напредокот на ML во изминатите 10 години, HITL има засилен фокус на процесите на проверка на квалитетот што ја поттикнува потребата за подлабоко искуство од давателите на податоци.

Можете ли да го елаборирате пристапот на LXT кон прибелешката на податоците и како го обезбедува квалитетот и точноста на податоците за обуката за вештачка интелигенција?

Како оперативен тим, прво мора да разбереме како клиентите ги користат податоците што ги обезбедуваме во развојот на нивните производи и услуги за да се осигураме дека ќе одговараат на нивните потреби. За да се случи ова, треба да најдеме експерти и за управување со проекти и за прибелешки кои имаат искуство со типот на потребни податоци.

Оттука, во голема мера се работи за подготовка и наоѓање на вистинските ресурси на почетокот на секој проект. Ова вклучува усогласување со клиентите за факторите на успех во текот на фазата на опфат, како и длабоки процеси на квалификација и проверка на прибележувачите на проектот кои земаат предвид важни детали како што се образовното потекло, посебните интереси, демографијата и искуството. Ние, исто така, развиваме детални материјали за учење и референтни материјали како водич, приспособени за секој проект. Ние применуваме зрел надзор на квалитетот и управувањето со процесите во текот на сите животни циклуси на проектот. Пристапот што го користиме се усогласува со и ги информира најдобрите практики на индустријата, обезбедувајќи дека резултатите ги исполнуваат очекувањата на клиентите.

И сите овие методологии се во служба на нашето гарантирано ветување за квалитетот на податоците.

Како LXT се справува со предизвикот на прибелешки неструктурирани податоци, кој опфаќа над 80% од сите податоци?

LXT има изградено внатрешна платформа за прибелешки која автоматизира многу делови од процесот на прибелешки и обезбедува структура и конзистентен кориснички интерфејс за работниците. Во фазата на претходна обработка, се фокусираме на подготовка на податоците, форматирање на влезните датотеки и отстранување на дупликати, меѓу другото, а во пост-обработка, пакување на адреси на податоците, споредување и форматирање за испорака до клиентот.

Пред да започне проектот, создаваме упатства кои се разгледуваат со клиентот и се повторуваат во текот на животниот циклус на проектот како што се менуваат работите. Можеме да го разложиме процесот на означување на податоците на повеќе задачи за правилно да се фокусираме на секој елемент од проектот. Дополнително, имплементирани се методологии за контрола на квалитетот за да се поттикне елиминацијата на грешките во обем.

Конечно, нашиот тим за оперативна извонредност е одговорен за напредно управување со процесите за да обезбеди висока ефикасност и приспособливост за нашите проекти ширум светот.

Кои се некои од најголемите предизвици со кои се соочува LXT при собирањето податоци на глобално ниво, и како ги надминувате?

Различноста и пристрасноста кај учесниците и во збирките на податоци кои произлегуваат често се едни од најголемите предизвици со кои ќе се соочи LXT и секој давател на податоци за обука за вештачка интелигенција. Други предизвици вклучуваат неодамнешна побарувачка за експертиза на доменот и брзо менување на пејзажот со промена на LLM и генеративни податоци за вештачка интелигенција.

Ние ги надминуваме овие предизвици преку високо проактивен пристап за набавка на нашиот базен на кандидати, каде што ја прегледуваме експертизата, искуството, претходните улоги, интереси и демографијата за да ја формираме вистинската разновидност меѓу тимовите по пол или други аспекти, како што се аналитичко размислување или креативно пишување. образовни средини, меѓу другото.

Откако ќе ги набавиме вистинските кандидати, многу се грижиме да ангажираме работници на редовна основа за да изградиме поискусна, лојална и позадоволна работна сила на долг рок.

Во однос на евалуацијата на вештачката интелигенција, како работи LXT за да ја ублажи пристрасноста и да обезбеди етички резултати во системите за вештачка интелигенција што им помага да се обучуваат?

Како што беше споменато претходно, обезбедувањето различност е предизвик што многу даватели на податоци за обука за вештачка интелигенција мора да го решат, а тоа ќе придонесе долг пат кон ублажување на пристрасноста и обезбедување етички резултати.

Повторно ќе се осврнам на нашите најдобри практики за ангажман, кои вклучуваат изнаоѓање разновидни и репрезентативни прибележувачи и внимателност со упатствата и мерките за контрола на квалитетот. Имаме стратегија за извори на влијание што ни овозможува да донесеме работа до разновидни и нови групи на прибележувачи, како што се регионите со долги јазици.

Ги насочуваме етичките резултати преку нашата употреба на најдобрите практики во индустријата, усогласувајќи се со очекувањата со нашите клиенти и поттикнувајќи повисоки стандарди за нашите проект менаџери и прибележувачи. Комуникацијата е од суштинско значење, како и ревизии на усогласеност, анализа на пристрасност и посветеност на регулативата за податоци и барањата за приватност.

Која е долгорочната визија за LXT и како го гледате развојот на компанијата во следните пет години?

Нашата визија е да обезбедиме точни, етички извори на податоци за да помогнеме во ширењето на вештачката интелигенција и технологиите на иднината кои ќе го подобрат и подобрат искуството на луѓето ширум светот.

Додека автоматизацијата и технологијата се важни во вештачката интелигенција, постои и важна човечка компонента која ја надополнува технологијата. Како што преминуваме од едноставни автоматизирани задачи кон големи јазични модели (LLM) и од генеративна вештачка интелигенција до општа вештачка интелигенција (GAI), од клучно значење ќе биде производите со вештачка интелигенција верно да ги претставуваат луѓето, и оние кои ги генерираат податоците и нашите глобални заедници на големи.

Во LXT, ние се стремиме да обезбедиме дека вештачката интелигенција се користи на позитивен и трансформативен начин што ги одразува овие вредности.

Ви благодариме за одличното интервју, читателите кои сакаат да дознаат повеќе треба да го посетат LXT.

Поврзани теми:интервју LXT

Не ја пропуштајте

Јури Рудницки, продукт менаџер на апликацијата ChatOn (AIBY Group) – Серија на интервјуа

Антоан Тардиф

Основачки партнер на unite.AI и член на Технолошкиот совет на Форбс, Антоан е а футуристички кој е страстен за иднината на вештачката интелигенција и роботиката.

Тој е и основач на Хартии од вредност.io, веб-страница која се фокусира на инвестирање во непушачка технологија.

Обединете се.AI

Каролин Харви, главен оперативен директор во LXT – серија на интервјуа

Интервјуа

Каролин Харви, главен оперативен директор во LXT – серија на интервјуа

Содржина

Последни пораки

Обединете се.AI

Каролин Харви, главен оперативен директор во LXT – серија на интервјуа

Содржина

Можеби ви се допаѓа

Последни пораки