rozhovory

Mohammad Omar, spoluzakladatel a CEO společnosti LXT – Interview Series

aktualizováno on Června 6, 2023

Mohammad Omar je spoluzakladatelem a CEO společnosti LXT, vznikající lídr v oblasti školicích dat AI pro podporu inteligentních technologií pro globální organizace, včetně největších technologických společností na světě. Ve spolupráci s mezinárodní sítí přispěvatelů LXT shromažďuje a anotuje data napříč různými modalitami s rychlostí, rozsahem a agilitou, které podnik vyžaduje. Společnost LXT byla založena v roce 2010 a sídlí v Torontu v Kanadě a má zastoupení ve Spojených státech, Austrálii, Indii, Turecku, Velké Británii a Egyptě.

Mohl byste se podělit o příběh vzniku LXT?

Společnost LXT byla založena v reakci na akutní potřebu dat, které čelil můj zaměstnavatel z doby před dvanácti lety. V té době společnost potřebovala arabská data, ale neměla správné dodavatele, od kterých by je mohla čerpat. Vzhledem k tomu, že jsem od přírody riskantní a podnikatel, rozhodl jsem se rezignovat na svou roli, založit novou společnost a vrátit se, abych nabídl své služby svému bývalému zaměstnavateli. Okamžitě jsme dostali některé z jejich nejnáročnějších projektů, které jsme úspěšně realizovali, a od toho se věci rozrůstaly. Nyní, o více než 12 let později, jsme si s touto společností vybudovali silný vztah a stali jsme se hlavním dodavatelem vysoce kvalitních jazykových dat.

Jaké jsou některé z největších problémů za nasazením AI ve velkém?

To je skvělá otázka a ve skutečnosti jsme ji zahrnuli do naší nejnovější výzkumné zprávy, Cesta ke zralosti AI. Největší výzvou, kterou respondenti uvedli, byla integrace jejich stávajících nebo starších systémů do řešení AI. To dává smysl vzhledem k tomu, že jsme provedli průzkum větších společností, které by s největší pravděpodobností měly ve svých organizacích řadu technologických systémů, které je třeba racionalizovat do strategie digitální transformace. Dalšími problémy, které respondenti vysoce hodnotili, byl nedostatek kvalifikovaných talentů, nedostatek školení nebo zdrojů a získávání kvalitních dat. Tyto odpovědi mě nepřekvapily, protože jsou běžně citovány, a také samozřejmě proto, že problém s daty je důvodem naší organizace.

Pokud jde o problémy s daty, LXT může jak zdrojová data, tak je označovat tak, aby jim algoritmy strojového učení dávaly smysl. Jsme vybaveni k tomu, abychom to dokázali ve velkém a svižně, což znamená, že poskytujeme vysoce kvalitní data velmi rychle. Klienti k nám často přicházejí, když se chystají na uvedení na trh a chtějí se ujistit, že jejich produkt bude zákazníky dobře přijat,

Tím, že s námi spolupracují na zdrojích a označování dat, mohou společnosti řešit nedostatek zdrojů a talentů tím, že umožní jejich týmům soustředit se na vytváření inovativních řešení.

LXT nabízí pokrytí pro více než 750 jazyků, ale existují problémy s překladem a lokalizací, které přesahují strukturu samotného jazyka. Mohl byste probrat, jak LXT čelí těmto výzvám?

Určitě existují problémy s překladem a lokalizací – zvláště poté, co se rozvětvíte za hranice nejrozšířenějších jazyků, které mívají oficiální status, a úroveň standardizace, která s tím souvisí. Mnoho jazyků, ve kterých pracujeme, nemá oficiální pravopis, takže řízení konzistence v týmu se stává výzvou. Tyto a další výzvy – např. odhalování podvodného chování – řešíme zavedením přísných postupů pro zajištění kvality. Ve zprávě o výzkumu vyspělosti AI bylo opět velmi zřejmé, že pro většinu organizací pracujících s daty AI byla kvalita na prvním místě seznamu priorit. A většina dotázaných organizací vyjádřila ochotu zaplatit více, aby to získali.

U společností, které vyžadují získávání dat a anotaci dat, jak brzy na cestě vývoje aplikací by měly začít tato data získávat?

Doporučujeme, aby organizace vytvořily datovou strategii, jakmile zjistí svůj případ použití AI. Čekání, až bude aplikace ve vývoji, může vést ke spoustě zbytečných předělávek, protože AI se může naučit špatné věci a musí být přeškolena kvalitními daty, což může chvíli trvat, než bude zdroj a integrace do vývojového procesu.

Jaké je základní pravidlo pro zjištění frekvence aktualizace dat?

Opravdu záleží na typu aplikace, kterou vyvíjíte, a na tom, jak často se významným způsobem mění data, která ji podporují. To znamená, že data jsou reprezentací skutečného života a v průběhu času musí být data aktualizována, aby poskytovala přesný obraz toho, co se děje ve světě. Tomuto jevu říkáme drift modelu, přičemž existují dva typy, z nichž každý vyžaduje přeškolení algoritmů.

K posunu konceptu dochází, když se změní významný rozdíl mezi trénovacími daty a výstupem AI, k čemuž může dojít náhle nebo postupně. Maloobchodník může například použít historická zákaznická data k výcviku aplikace AI. Ale když dojde k masivnímu posunu ve spotřebitelské realitě, bude nutné algoritmus přeškolit, aby to odrážel.

K posunu dat dochází, když data použitá k trénování aplikace již neodrážejí skutečná data, s nimiž se setká při vstupu do výroby. To může být způsobeno řadou faktorů, včetně demografických posunů, sezónnosti nebo situace aplikace v nové geografické oblasti.

LXT nedávno představila zprávu s názvem „Cesta ke zralosti AI 2023“. Jaké poznatky z této zprávy vás překvapily?

Asi by to nemělo být překvapením, ale věc, která opravdu vynikala, byla rozmanitost aplikací. Možná jste očekávali, že budou dominovat dvě nebo tři domény činnosti, ale když jsme se zeptali, kam plánují respondenti zaměřit své úsilí AI a kam plánují nasadit svou AI, zpočátku to vypadalo jako chaos – absence jakéhokoli trendu. Ale při prosévání dat a při pohledu na kvalitativní odezvy bylo jasné, že absence trendu is trend. Alespoň očima našich respondentů, pokud máte problém, pak je reálná možnost, že na jeho řešení někdo pracuje.

Generativní umělá inteligence bere svět útokem, jaký je váš názor na to, jak daleko mohou jazykové generativní modely posunout toto odvětví?

Můj osobní názor na to je, že ústředním bodem skutečné síly generativní umělé inteligence – rozhodl jsem se pro zdůraznění použít spíše tato slova než zkratku – je porozumění přirozenému jazyku. „Inteligence“ AI se učí prostřednictvím jazyka; schopnost řešit a nakonec řešit složité problémy je zprostředkována iterativními a kumulativními interakcemi přirozeného jazyka. S ohledem na to věřím, že jazykové generativní modely budou po celou dobu v souladu s ostatními prvky AI.

Jaká je vaše vize budoucnosti AI a budoucnosti LXT?

Jsem od přírody optimista a to podbarví moji odpověď, ale moje vize budoucnosti AI je vidět, jak zlepší kvalitu života pro každého; aby se náš svět stal bezpečnějším místem, lepším místem pro budoucí generace. Na mikroúrovni je mou vizí LXT vidět, jak organizace bude i nadále stavět na svých silných stránkách, růst a stát se zaměstnavatelem dle výběru a silou dobra pro globální komunitu, která umožňuje naše podnikání. Na makro úrovni je mou vizí LXT přispět významným a smysluplným způsobem k naplnění mé optimisticky zkreslené vize budoucnosti AI.

Děkuji za skvělý rozhovor, čtenáři, kteří se chtějí dozvědět více, by měli navštívit LXT.