Connect with us

Mohammad Abu Sheikh, zakladatel a CEO CNTXT AI – Interview Series

Rozhovory

Mohammad Abu Sheikh, zakladatel a CEO CNTXT AI – Interview Series

mm

Mohammad Abu Sheikh transformuje krajinnu AI v regionu MENA, pohání posun od pasivní spotřeby k suverénní inovaci. Jako CEO CNTXT AI a zakladatel fondu AI ve výši 10 milionů dolarů vedl tři úspěšné exity a zajistil více než miliardu dolarů ve financování. Jeho práce vytváří základ pro ekosystém AI, který je zakořeněn v jazyce, kultuře a suverenitě dat.

CNTXT AI je digitální transformační společnost, která poskytuje cloudovou infrastrukturu, průmyslový software a robotické řešení, aby pomohla organizacím modernizovat operace a odemknout datové poznatky napříč Blízkým východem a Severní Afrikou.

Co vás inspirovalo k založení CNTXT AI a jak začala vaše vize suverénní AI v arabsky mluvícím světě?

Viděli jsme hojnost nevyužitého dat v této části světa. Mnohé problémy při škálování AI pocházely z nedostatku připravenosti dat — což nakonec znamenalo nedostatek připravenosti AI. Proto jsme založili CNTXT AI.

Zpočátku jsme řešili stejné problémy, se kterými jsme se setkali při budování LocAI… Viděli jsme tyto výzvy na vlastní oči, když jsme pracovali s AI71, TII a G42 (IIAI). Když jsme pomohli těmto entitám řešit tyto problémy, vize se stala jasnější a podnikání prostě rostlo.

Vyhrál jste klíčovou roli při budování největší arabské digitální knihovny pro školení AI. Jaké byly některé z největších výzev při tomto úkolu a jak jste je překonali?

Kvalita byla jednou z největších výzev. Další byla omezená dostupnost vysoce kvalitních arabských dat online: arabština je vážně podreprzentována. Pouze malá část arabsky mluvícího obsahu byla digitalizována a pouze 3–5 % všech online obsahu je v arabštině. To je téměř nic. Překonali jsme tento problém nasazením označníků dat, anotátorů a vědců, kteří data sami digitalizovali, vytvářeli a kurátorovali.

CNTXT AI operuje na průsečíku kultury a výpočetní techniky. Jak vyvažujete inovace špičkové AI s cílem budování kulturně relevantních řešení pro region MENA?

Budujeme modely založené na kultuře od základů. Od infrastruktury po konečný produkt je kultura začleněna od samého začátku — není to něco, co přidáváme později. Navrhujeme, inovujeme a budujeme s ohledem na konkrétní kultury, dialekty a potřeby od samého začátku. Arabština je jeden jazyk, ale nese mnoho dialektů a kulturních kontextů napříč regionem, takže budujeme místní produkty pro místní země. A děláme to tak, že spolupracujeme s místními anotátory, lidmi na místě, ve svých zemích.

Také jste spoluzaložili LocAI a vedete fond SMPL AI. Jak tyto podniky doplňují misi CNTXT AI?

LocAI je aplikační vrstva — část, se kterou lidé skutečně interagují. Sedí přímo na vrcholu dat a infrastruktury postavené CNTXT AI. To je to, co jej učinilo úspěšným: transformuje základy AI poskytnuté CNTXT AI do reálných řešení, která lidé mohou použít.

SMPL AI se naopak zaměřuje na návrat do komunity. Soustředí se na investice do startupů v rané fázi a pomoc při budování regionálního ekosystému AI. Sdílíme nástroje a lekce, které jsme se naučili při budování AI sami, aby mohli zakladatelé růst rychleji a vyhnout se běžným pastem.

Munsit byl nazván nejpreciznějším modelem rozpoznávání arabské řeči na světě. Co vedlo k vývoji tohoto modelu a proč právě teď?

To, co vedlo k vývoji tohoto modelu, bylo jednoduché: potřeba.

Vždycky budujeme z necessity. Podívali jsme se na trh a viděli, že krajina byla zralá — vládní agentury a soukromí klienti všichni žádali o řešení, jako je toto.

Existující modely prostě nebyly na úkolu. Most jsou postaveny na anglické technologii a poté adaptovány. Není navrženo pro arabštinu od základů, a určitě ne pro konkrétní problémy, které řešíme.

Takže jsme se rozhodli postavit svůj vlastní. Je to arabština na prvním místě — podle designu.

Výzkum za Munsitem představuje přístup slabě dohlíženého učení. Můžete vysvětlit, co to znamená a proč bylo to essenciální pro školení arabského ASR ve velkém?

Označení je drahé. Takže jsme museli jít za hranice tradičních metod, které závisí na velkém množství ručního přepisu. Slabě dohlížené učení nám pomohlo škálovat bez nutnosti označit každý audio soubor ručně — což je obzvláště důležité pro arabštinu, jazyk s omezenými daty a mnoha různými dialekty.

Místo použití profesionálně přepisovaného audiozáznamu jsme začali s 30 000 hodinami nelabelovaného arabského projevu. Postavili jsme pipeline označení, který generuje, filtruje a čistí ty nejlepší pomocí automatizovaných kontrol. To nám poskytlo dataset vysoké kvality — 15 000 hodin — vše bez ručního přepisu.

Tento přístup nám umožnil trénovat náš model od základů, zachycující bohatost mluvené arabštiny napříč reálnými situacemi, rychle a nákladově efektivně. Bez této metody by budování arabského systému ASR v tomto měřítku trvalo roky a miliony ručních úsilí.

Munsit překonal modely od OpenAI, Microsoftu a Meta napříč několika benchmaríky. Co toto dosažení říká o budoucnosti arabské inovace AI?

Budoucnost arabské AI je v našich rukou; a to je přesně to, co toto dosažení prokazuje. Už si nemůžeme dovolit spoléhat se na technologie, které nevlastníme, nebo záviset na třetích stranách, které neprioritizují náš region.

Munsit ukazuje, že můžeme postavit špičkovou AI, z regionu, pro region — pomocí místního talentu pro řešení místních problémů. Je to jasný signál, že příští vlna arabské inovace AI bude pocházet z vnitřku.

Jak vidíte budoucnost Munsitu v budoucích verzích a co jsou další fronty pro arabskou hlasovou AI v CNTXT?

Musíte si prostě počkat a vidět. Co mohu říci, je, že máme čerstvou, novou sadu arabsky prvním AI řešení na cestě — vše poháněné Munsitem a dalšími modely, které目前 stavíme v CNTXT AI. Tohle je teprve začátek.

Často mluvíte o důležitosti „suverénní AI“. Co pro vás toto slovo znamená a proč je to kritické pro Záliv a širší region MENA?

Pro mě suverénní AI znamená mít plnou kontrolu a vlastnictví nad daty, infrastrukturou a modely, které formují naši budoucnost. Je to kritické, protože musíme vlastnit svůj vlastní osud, a to začíná s daty.

Suverenita dat je všechno. Data jsou cenná, a musíme se ujistit, že zůstanou v našich rukou.

Nemůžeme si dovolit odevzdat naši budoucnost a sedět nečinně, zatímco jiní pro nás staví technologii. Budoucnost AI v tomto regionu bude pocházet z tohoto regionu. To je přesně to, čeho se snažíme dosáhnout.

Jak vidíte CNTXT AI formující ekosystém AI na Blízkém východě v příštích pěti letech?

Povolováním skutečné připravenosti AI. Vstupujeme do nich, chápeme, co společnosti a vlády potřebují, budujeme datové a AI strategie a pak jim pomáháme budovat, testovat, nasazovat a škálovat.

Wenn data jsou novým olejem, pak nestrukturovaná data jsou olej nerafinovaný — plný potenciálu, ale bezcenný, dokud není zpracován. To je proč jsme postavili CNTXT AI, abychom pomohli organizacím vyčistit, strukturovat a aktivovat svá data. Protože to je místo, kde skutečně začíná transformace AI.

Jako podnikatel a investor, co byste poradili jiným zakladatelům, kteří budují startupy AI v emergentních trzích?

Začněte hned. Pohybojte se rychle. Selžete rychle, učte se rychleji a pokračujte v iteraci.

Nejdůležitější je stavět pro skutečné problémy. Zůstaňte blízko země — poslouchejte uživatele, ne jen hype. V emergentních trzích jsou relevantnost a adaptabilita klíčové.

Děkuji za skvělý rozhovor, čtenáři, kteří chtějí se dozvědět více, by měli navštívit CNTXT AI.

Antoine je vizionářský líder a zakládající partner Unite.AI, poháněný neotřesitelnou vášní pro formování a propagaci budoucnosti AI a robotiky. Jako sériový podnikatel věří, že AI bude mít na společnost stejně disruptivní vliv jako elektřina, a často je chycen při tom, jak hovoří o potenciálu disruptivních technologií a AGI. Jako futurist, je zasvěcen prozkoumání toho, jak tyto inovace budou formovat náš svět. Kromě toho je zakladatelem Securities.io, platformy zaměřené na investice do špičkových technologií, které předefinovávají budoucnost a mění celé sektory.