rozhovory
Mohammad Abu Sheikh, zakladatel a generální ředitel CNTXT AI – série rozhovorů

Mohammad Abu Sheikh transformuje prostředí umělé inteligence v regionu Blízkého východu a severní Afriky a posouvá jej od pasivní spotřeby k suverénním inovacím. Jako generální ředitel společnosti CNTXT AI a zakladatel fondu umělé inteligence s hodnotou 10 milionů dolarů vedl tři úspěšné exity a zajistil financování v hodnotě přes miliardu dolarů. Jeho práce pokládá základy ekosystému umělé inteligence zakořeněného v jazyce, kultuře a datové suverenitě.
Viděli jsme množství nevyužitých dat v této části světa. Mnoho problémů se škálováním umělé inteligence pramenilo z nedostatečné datové připravenosti – což nakonec znamenalo i nedostatečnou připravenost umělé inteligence. Proto jsme spustili CNTXT AI.
Zpočátku jsme řešili stejné problémy, kterým jsme čelili při budování LocAI… Tyto výzvy jsme viděli na vlastní oči při práci s AI71, TII a G42 (IIAI). Jak jsme těmto subjektům pomáhali tyto problémy řešit, vize se vyjasňovala a podnikání dále rostlo.
Hrál jste klíčovou roli při budování největší arabské digitální knihovny pro školení v oblasti umělé inteligence. Jaké byly některé z největších výzev při tom a jak jste je překonal?
Kvalita byla jednou z největších výzev. Další byla omezená dostupnost vysoce kvalitních arabských dat online: arabština je výrazně nedostatečně zastoupena. Digitalizována byla pouze malá část arabského obsahu a pouze 3–5 % veškerého online obsahu je v arabštině. To je téměř nic. Tento problém jsme překonali nasazením značek dat, anotátorů a datových vědců, kteří si data digitalizovali, vytvářeli a spravovali sami.
Umělá inteligence (CNTXT AI) působí na průsečíku kultury a výpočetní techniky. Jak vyvažujete špičkové inovace v oblasti umělé inteligence s cílem budovat kulturně relevantní řešení pro region Blízkého východu a severní Afriky (MENA)?
Kulturně zakotvené modely vytváříme od základů. Od infrastruktury až po finální produkt je kultura zakotvena od samého začátku – není to něco, co přidáváme později. Navrhujeme, inovujeme a vytváříme s ohledem na specifické kultury, dialekty a potřeby od prvního dne. Arabština je jeden jazyk, ale nese mnoho dialektů a kulturních kontextů napříč regionem, takže vytváříme lokální produkty pro místní země. A to děláme spoluprací s místními anotátory, lidmi v terénu, v jejich vlastních zemích.
Také jste spoluzaložil LocAI a vedete fond SMPL AI Fund. Jak tyto podniky doplňují poslání CNTXT AI?
LocAI je aplikační vrstva – ta část, se kterou lidé skutečně interagují. Nachází se přímo nad daty a infrastrukturou vybudovanou CNTXT AI. To je to, co ji učinilo úspěšnou: transformuje základy AI poskytované CNTXT AI do reálných řešení, která mohou lidé používat.
SMPL AI se naopak zaměřuje na vracení komunitě. Zaměřuje se na investice do startupů v rané fázi a na pomoc při budování regionálního ekosystému umělé inteligence. Sdílíme nástroje a poznatky, které jsme se naučili při vlastním budování umělé inteligence, aby zakladatelé firem mohli růst rychleji a vyhnout se běžným nástrahám.
Munsit byl označen za nejpřesnější model rozpoznávání arabské řeči na světě. Co vedlo k vývoji tohoto modelu a proč právě teď?
To, co hnalo vývoj tohoto modelu, bylo jednoduché: potřeba.
Vždycky stavíme z nutnosti. Podívali jsme se na trh a zjistili, že situace je pro to vhodná – vládní agentury i soukromí klienti požadovali podobné řešení.
Stávající modely prostě na daný úkol nestačily. Většina z nich je postavena na anglických technologiích a následně upravena. Nejsou od základů navrženy pro arabštinu a už vůbec ne pro konkrétní problémy, které řešíme.
Tak jsme se rozhodli postavit si vlastní. Je to především arabské – už od začátku.
Výzkum, na kterém stojí Munsit, zavádí přístup slabě řízeného učení. Můžete vysvětlit, co to znamená a proč to bylo nezbytné pro školení arabského ASR ve velkém měřítku?
Anotace je drahá. Museli jsme se proto posunout od tradičních metod, které závisí na velkém množství ručního přepisu. Slabě kontrolované učení nám pomohlo škálovat se, aniž bychom museli ručně označovat každý zvukový soubor – což je obzvláště důležité pro arabštinu, jazyk s omezenými daty a mnoha různými dialekty.
Místo profesionálně přepsaného zvuku jsme začali s 30,000 15,000 hodinami neoznačené arabské řeči. Vytvořili jsme anotační kanál, který generuje, filtruje a čistí ty nejlepší pomocí automatických kontrol. To nám poskytlo vysoce kvalitní datovou sadu o délce XNUMX XNUMX hodin – to vše bez lidské transkripce.
Tento přístup umožnil rychle a nákladově efektivně trénovat náš model od nuly a zachytit tak bohatost mluvené arabštiny v reálných situacích. Bez této metody by vytvoření systému ASR pro arabštinu v tomto rozsahu trvalo roky a miliony manuálních nákladů.
Munsit v několika benchmarkových testech překonal modely od OpenAI, Microsoftu a Mety. Co tento úspěch říká o budoucnosti inovací v oblasti umělé inteligence v arabském světě?
Budoucnost arabské umělé inteligence je v našich rukou a přesně to tento úspěch dokazuje. Už si nemůžeme dovolit spoléhat se na technologie, které nevlastníme, ani na třetí strany, které neupřednostňují náš region.
Munsit ukazuje, že můžeme vybudovat umělou inteligenci světové úrovně z regionu pro region – s využitím místních talentů k řešení místních problémů. Je to jasný signál, že další vlna inovací v oblasti umělé inteligence v arabském světě přijde zevnitř.
Jak vidíte vývoj Munsitu v budoucích verzích a jaké jsou další hranice pro arabskou hlasovou umělou inteligenci v CNTXT?
Budete si muset počkat a uvidíte. Co můžu říct, je, že máme na cestě novou sadu řešení umělé inteligence založených na arabštině – všechna budou poháněna systémem Munsit a dalšími modely, které v současné době vyvíjíme v CNTXT AI. To je jen začátek.
Často mluvíte o důležitosti „suverénní umělé inteligence“. Co pro vás tento pojem znamená a proč je klíčový pro Perský záliv a širší region Blízkého východu a severní Afriky?
Pro mě znamená suverénní umělá inteligence mít plnou odpovědnost a kontrolu nad daty, infrastrukturou a modely, které utvářejí naši budoucnost. Je to zásadní, protože musíme nést odpovědnost za svůj vlastní osud, a to začíná daty.
Datová suverenita je vším. Data jsou cenná a musíme zajistit, aby zůstala v našich rukou.
Nemůžeme si dovolit vzdát se naší budoucnosti a nečinně sedět, zatímco jiní za nás budují technologie. Budoucnost umělé inteligence v tomto regionu pochází z tohoto regionu. Přesně o to usilujeme.
Jak si myslíte, že CNTXT AI bude v příštích pěti letech formovat ekosystém umělé inteligence na Blízkém východě?
Tím, že umožňujeme skutečnou připravenost na AI. Jdeme do toho, chápeme, co firmy a vlády potřebují, vytváříme data a strategie pro AI a poté jim pomáháme s tvorbou, testováním, nasazováním a škálováním.
Pokud jsou data novým olejem, pak nestrukturovaná data jsou nerafinovaným olejem – plným potenciálu, ale bezcenným, dokud nejsou zpracována. Proto jsme vytvořili CNTXT AI, která pomáhá organizacím čistit, strukturovat a aktivovat jejich data. Protože právě tam začíná skutečná transformace umělé inteligence.
Z vašeho pohledu podnikatele i investora, jakou radu byste dal ostatním zakladatelům, kteří budují startupy v oblasti umělé inteligence na rozvíjejících se trzích?
Začněte hned. Postupujte rychle. Selhejte rychle, učte se rychleji a neustále iterujte.
A co je nejdůležitější, pracujte s ohledem na skutečné problémy. Zůstaňte blízko realitě – naslouchejte uživatelům, ne jen humbuku a reklamě. Na rozvíjejících se trzích jsou klíčové relevance a přizpůsobivost.
Děkuji za skvělý rozhovor, čtenáři, kteří se chtějí dozvědět více, by měli navštívit CNTXT AI.