peň Mohammad Omar, spoluzakladateľ a generálny riaditeľ spoločnosti LXT - Interview Series - Unite.AI
Spojte sa s nami

rozhovory

Mohammad Omar, spoluzakladateľ a generálny riaditeľ spoločnosti LXT – Interview Series

mm
Aktualizované on

Mohammad Omar je spoluzakladateľom a generálnym riaditeľom spoločnosti Rozšírenie LXT, vznikajúci líder v oblasti tréningových dát AI na podporu inteligentných technológií pre globálne organizácie vrátane najväčších technologických spoločností na svete. V spolupráci s medzinárodnou sieťou prispievateľov LXT zhromažďuje a anotuje údaje naprieč rôznymi spôsobmi s rýchlosťou, rozsahom a agilitou, ktoré podnik vyžaduje. Spoločnosť LXT bola založená v roku 2010 so sídlom v Toronte v Kanade so zastúpením v Spojených štátoch, Austrálii, Indii, Turecku, Spojenom kráľovstve a Egypte.

Mohli by ste sa podeliť o príbeh vzniku LXT?

Spoločnosť LXT bola založená ako odpoveď na akútnu potrebu dát, ktorej čelil môj zamestnávateľ spred dvanástich rokov. V tom čase spoločnosť potrebovala arabské údaje, ale nemala správnych dodávateľov, od ktorých by ich mohla čerpať. Keďže som od prírody riskantný a podnikateľ, rozhodol som sa rezignovať na svoju úlohu, založiť si novú spoločnosť a vrátiť sa späť, aby som ponúkol naše služby svojmu bývalému zamestnávateľovi. Okamžite sme dostali niektoré z ich najnáročnejších projektov, ktoré sme úspešne zrealizovali a veci sa z toho rozrástli. Teraz, o viac ako 12 rokov neskôr, sme si s touto spoločnosťou vybudovali silný vzťah a stali sme sa hlavným dodávateľom vysokokvalitných jazykových údajov.

Aké sú najväčšie výzvy nasadenia AI vo veľkom rozsahu?

To je skvelá otázka a skutočne sme ju zahrnuli do našej najnovšej výskumnej správy, Cesta k zrelosti AI. Hlavnou výzvou, ktorú respondenti uviedli, bola integrácia ich existujúcich alebo starších systémov do riešení AI. To dáva zmysel vzhľadom na skutočnosť, že sme skúmali väčšie spoločnosti, ktoré by s najväčšou pravdepodobnosťou mali vo svojich organizáciách celý rad technologických systémov, ktoré je potrebné racionalizovať do stratégie digitálnej transformácie. Ďalšími problémami, ktoré respondenti vysoko hodnotili, bol nedostatok kvalifikovaného talentu, nedostatok školení alebo zdrojov a získavanie kvalitných údajov. Nebol som prekvapený týmito odpoveďami, pretože sú bežne citované, a samozrejme aj preto, že problém s údajmi je dôvodom našej organizácie.

Pokiaľ ide o dátové výzvy, LXT môže získavať údaje a označovať ich tak, aby im algoritmy strojového učenia dali zmysel. Sme vybavení na to, aby sme to robili vo veľkom rozsahu a svižne, čo znamená, že poskytujeme vysokokvalitné údaje veľmi rýchlo. Klienti k nám často prichádzajú, keď sa pripravujú na uvedenie na trh a chcú sa uistiť, že ich produkt zákazníci dobre prijmú, 

Spoluprácou s nami na zdrojoch a označovaní údajov môžu spoločnosti riešiť nedostatok zdrojov a talentov tým, že umožnia svojim tímom sústrediť sa na vytváranie inovatívnych riešení.

LXT ponúka pokrytie pre viac ako 750 jazykov, existujú však problémy s prekladom a lokalizáciou, ktoré presahujú štruktúru samotného jazyka. Mohli by ste diskutovať o tom, ako LXT čelí týmto výzvam?

Určite existujú problémy s prekladom a lokalizáciou – najmä keď sa rozvetvíte za hranice najrozšírenejších jazykov, ktoré majú tendenciu mať oficiálny štatút a úroveň štandardizácie, ktorá s tým súvisí. Mnohé z jazykov, v ktorých pracujeme, nemajú oficiálny pravopis, takže riadenie konzistentnosti v tíme sa stáva výzvou. Tieto a ďalšie výzvy – napr. odhaľovanie podvodného správania – riešime zavedením prísnych procesov na zabezpečenie kvality. V správe o výskume zrelosti AI bolo opäť veľmi zrejmé, že pre väčšinu organizácií pracujúcich s údajmi AI bola kvalita na prvom mieste zoznamu priorít. A väčšina opýtaných organizácií vyjadrila ochotu zaplatiť viac, aby to získali. 

V prípade spoločností, ktoré vyžadujú získavanie údajov a anotáciu údajov, ako skoro na ceste vývoja aplikácie by mali začať tieto údaje získavať?

Odporúčame, aby si organizácie vytvorili dátovú stratégiu hneď, ako identifikujú svoj prípad použitia AI. Čakanie na vývoj aplikácie môže viesť k mnohým zbytočným prepracovaniam, pretože AI sa môže naučiť nesprávne veci a musí byť preškolená kvalitnými údajmi, čo môže chvíľu trvať, kým sa získa zdroj a začlení sa do procesu vývoja.

Aké je základné pravidlo pre zistenie frekvencie aktualizácie údajov?

Naozaj to závisí od typu aplikácie, ktorú vyvíjate, a od toho, ako často sa výrazne menia údaje, ktoré ju podporujú. To znamená, že údaje sú reprezentáciou skutočného života a v priebehu času sa musia údaje aktualizovať, aby poskytovali presný obraz o dianí vo svete. Tento jav nazývame drift modelu, pričom existujú dva typy, z ktorých každý vyžaduje preškolenie algoritmov.

  • K posunu konceptu dochádza, keď sa zmení významný rozdiel medzi trénovacími údajmi a výstupom AI, čo môže nastať náhle alebo postupne. Napríklad maloobchodník môže použiť historické údaje o zákazníkoch na trénovanie aplikácie AI. Ale keď dôjde k masívnemu posunu v spotrebiteľskej realite, algoritmus bude musieť byť preškolený, aby to odrážal.

 

  • K posunu údajov dochádza vtedy, keď údaje používané na trénovanie aplikácie už neodrážajú skutočné údaje, s ktorými sa stretáva pri vstupe do výroby. Môže to byť spôsobené celým radom faktorov vrátane demografických zmien, sezónnosti alebo situácie aplikácie v novom geografickom regióne.

LXT nedávno predstavila správu s názvom „Cesta k zrelosti AI 2023“. Aké boli niektoré z poznatkov v tejto správe, ktoré vás prekvapili?

Asi to nemalo byť prekvapením, ale vec, ktorá skutočne vynikla, bola rôznorodosť aplikácií. Možno ste očakávali, že budú dominovať dve alebo tri oblasti činnosti, ale keď sme sa pýtali, kam plánujú respondenti zamerať svoje úsilie v oblasti AI a kam plánujú nasadiť svoju AI, spočiatku to vyzeralo ako chaos – absencia akéhokoľvek trendu. Ale pri preosievaní údajov a pri pohľade na kvalitatívne odpovede sa ukázalo, že absencia trendu is trend. Aspoň očami našich respondentov, ak máte problém, tak je tu reálna možnosť, že niekto pracuje na jeho riešení AI.

Generatívna AI berie svet útokom, aký je váš názor na to, ako ďaleko môžu generatívne modely jazykov posunúť toto odvetvie?

Môj osobný názor na to je, že ústredným bodom skutočnej sily generatívnej umelej inteligencie – rozhodol som sa použiť slová, ktoré tu používam skôr ako skratku na zdôraznenie – je porozumenie prirodzenému jazyku. „Inteligencia“ AI sa učí prostredníctvom jazyka; schopnosť riešiť a v konečnom dôsledku riešiť zložité problémy je sprostredkovaná iteračnými a kumulatívnymi interakciami prirodzeného jazyka. S ohľadom na túto skutočnosť verím, že modely generovania jazyka budú v súlade s ostatnými prvkami AI.

Aká je vaša vízia budúcnosti AI a budúcnosti LXT?

Som od prírody optimista a to zafarbí moju reakciu, ale moja vízia budúcnosti AI je vidieť, že zlepší kvalitu života pre každého; aby sa náš svet stal bezpečnejším miestom, lepším miestom pre budúce generácie. Na mikroúrovni je mojou víziou LXT vidieť, ako organizácia naďalej stavia na svojich silných stránkach, rastie a stáva sa zamestnávateľom podľa výberu a silou dobra pre globálnu komunitu, ktorá umožňuje naše podnikanie. Na makro úrovni je mojou víziou LXT prispieť významným a zmysluplným spôsobom k naplneniu mojej optimisticky skreslenej vízie budúcnosti AI.

Ďakujeme za skvelý rozhovor, čitatelia, ktorí sa chcú dozvedieť viac, by mali navštíviť Rozšírenie LXT.

Zakladajúci partner unite.AI a člen skupiny Technologická rada Forbes, Antoine je a Futurist ktorý je nadšený budúcnosťou AI a robotiky.

Je tiež zakladateľom Cenné papiere.io, web, ktorý sa zameriava na investovanie do prevratných technológií.