Interviews
Mohammad Abu Sheikh, Oprichter & CEO van CNTXT AI – Interviewreeks

Mohammad Abu Sheikh verandert het AI-landschap in de MENA-regio, waardoor er een verschuiving plaatsvindt van passief consumeren naar soevereine innovatie. Als CEO van CNTXT AI en oprichter van een AI-fonds van 10 miljoen dollar, heeft hij drie succesvolle exits geleid en meer dan een miljard dollar aan financiering veiliggesteld. Zijn werk legt de basis voor een AI-ecosysteem dat geworteld is in taal, cultuur en datasoevereiniteit.
CNTXT AI is een digitale transformatiebedrijf dat cloudinfrastructuur, industriële software en robotica-oplossingen biedt om organisaties te helpen hun operaties te moderniseren en gegevensgestuurde inzichten te ontgrendelen in het Midden-Oosten en Noord-Afrika.
Wat inspireerde u om CNTXT AI te starten, en hoe is uw visie op soevereine AI in de Arabischsprekende wereld begonnen?
We zagen de overvloed aan onderbenutte gegevens in deze regio. Veel problemen bij het schalen van AI kwamen voort uit het gebrek aan gegevensbereidheid – wat uiteindelijk neerkwam op een gebrek aan AI-bereidheid. Daarom zijn we CNTXT AI begonnen.
Aanvankelijk losten we dezelfde problemen op die we tegenkwamen bij het opbouwen van LocAI… We zagen deze uitdagingen van dichtbij toen we met AI71, TII en G42 (IIAI) werkten. Toen we deze entiteiten hielpen om deze problemen op te lossen, werd de visie duidelijker en groeide het bedrijf gewoon.
U heeft een sleutelrol gespeeld bij de bouw van de grootste Arabische digitale bibliotheek voor AI-training. Wat waren enkele van de grootste uitdagingen bij het doen, en hoe bent u deze te boven gekomen?
Kwaliteit was een van de grootste uitdagingen. Een andere was de beperkte beschikbaarheid van hoge kwaliteit Arabische gegevens online: Arabisch is serieus ondervertegenwoordigd. Slechts een klein deel van de Arabische inhoud is gedigitaliseerd, en slechts 3-5% van alle online inhoud is in het Arabisch. Dat is bijna niets. We losten dit probleem op door gegevenslabelers, annotators en datawetenschappers in te zetten om de gegevens zelf te digitaliseren, te maken en te cureren.
CNTXT AI werkt op het snijvlak van cultuur en berekening. Hoe balanceert u baanbrekende AI-innovatie met het doel om cultureel relevante oplossingen te bouwen voor de MENA-regio?
We bouwen cultureel gefundeerde modellen vanaf de grond af. Van infrastructuur tot eindproduct, is cultuur vanaf het allereerste begin ingebed – het is niet iets dat we later toevoegen. We ontwerpen, innoveren en bouwen met specifieke culturen, dialecten en behoeften in gedachten vanaf de eerste dag. Arabisch is één taal, maar het omvat veel dialecten en culturele contexten in de regio, dus we bouwen lokale producten voor lokale landen. En we doen dat door te werken met lokale annotators, mensen op de grond, in hun eigen landen.
U heeft ook LocAI mede-opgericht en leidt het SMPL AI-fonds. Hoe complementeren deze ondernemingen de missie van CNTXT AI?
LocAI is de applicatielaag – het deel waar mensen daadwerkelijk mee interacteren. Het zit recht bovenop de gegevens en infrastructuur die zijn gebouwd door CNTXT AI. Dat is wat het succesvol maakte: het transformeert AI-fundamenten die worden geboden door CNTXT AI in echte oplossingen die mensen kunnen gebruiken.
SMPL AI daarentegen gaat over het geven aan de gemeenschap. Het richt zich op het investeren in start-ups in een vroeg stadium en het helpen bij het opbouwen van het regionale AI-ecosysteem. We delen de tools en lessen die we hebben geleerd van het opbouwen van AI zelf, zodat oprichters sneller kunnen groeien en veelvoorkomende valkuilen kunnen vermijden.
Munsit is de meest nauwkeurige Arabische spraakherkenningmodel ter wereld genoemd. Wat dreef de ontwikkeling van dit model, en waarom nu?
Wat de ontwikkeling van dit model dreef, was eenvoudig: de behoefte.
We bouwen altijd uit noodzaak. We keken naar de markt en zagen dat het landschap rijp was – overheidsinstanties en particuliere klanten vroegen allemaal om een oplossing zoals deze.
De bestaande modellen waren niet opgewassen tegen de taak. De meeste zijn gebouwd op Engelse technologie en vervolgens aangepast. Ze zijn niet ontworpen voor Arabisch vanaf de grond af, en zeker niet voor de specifieke problemen die we oplossen.
Dus besloten we onze eigen oplossing te bouwen. Het is Arabisch in de eerste plaats – door ontwerp.
Het onderzoek naar Munsit introduceert een zwak toezicht houdende leerbenadering. Kunt u uitleggen wat dat betekent en waarom het essentieel was voor het trainen van Arabische ASR op grote schaal?
Annotatie is duur. Dus moesten we verder gaan dan traditionele methoden die afhankelijk zijn van grote hoeveelheden handmatige transcriptie. Zwak toezicht houdende leerbenadering hielp ons om te schalen zonder dat we elke audiobestand handmatig moesten annoteren – wat vooral belangrijk is voor Arabisch, een taal met beperkte gegevens en veel verschillende dialecten.
In plaats van professioneel getranscribeerde audio te gebruiken, begonnen we met 30.000 uur ongelabelde Arabische spraak. We bouwden een annotatiepijplijn die de beste genereren, filteren en reinigen met behulp van geautomatiseerde controles. Dit gaf ons een hoogwaardig dataset van 15.000 uur – allemaal zonder handmatige transcriptie.
Deze benadering maakte het mogelijk om ons model vanaf scratch te trainen, waardoor we de rijkdom van gesproken Arabisch in echte levenssituaties konden vastleggen, snel en tegen een lage kosten.
Munsit overtrof modellen van OpenAI, Microsoft en Meta op meerdere benchmarks. Wat zegt deze prestatie over de toekomst van Arabische AI-innovatie?
De toekomst van Arabische AI ligt in onze handen; en dat is precies wat deze prestatie bewijst. We kunnen ons niet langer permitteren om te vertrouwen op technologieën die we niet bezitten of afhankelijk te zijn van derden die onze regio niet prioriteren.
Munsit toont aan dat we wereldklasse AI kunnen bouwen, vanuit de regio, voor de regio – met lokale talenten om lokale problemen op te lossen. Het is een duidelijk signaal dat de volgende golf van Arabische AI-innovatie uit de regio zelf zal komen.
Hoe ziet u Munsit evolueren in toekomstige versies, en wat zijn de volgende frontiers voor Arabische spraak AI bij CNTXT?
U zult gewoon moeten wachten en zien. Wat ik kan zeggen, is dat we een verse, nieuwe reeks Arabisch-eerst AI-oplossingen op komst hebben – allemaal aangedreven door Munsit en andere modellen die we momenteel bij CNTXT AI bouwen. Dit is pas het begin.
U spreekt vaak over het belang van “soevereine AI”. Wat betekent die term voor u, en waarom is het kritiek voor de Golf en de bredere MENA-regio?
Voor mij betekent soevereine AI het hebben van volledige eigendom en controle over de gegevens, infrastructuur en modellen die onze toekomst vormen. Het is kritiek omdat we onze eigen toekomst moeten bezitten, en dat begint met gegevens.
Gegevenssoevereiniteit is alles. Gegevens zijn kostbaar, en we moeten ervoor zorgen dat ze in onze handen blijven.
We kunnen ons niet permitteren om onze toekomst uit handen te geven en toe te kijken hoe anderen de technologie voor ons bouwen. De toekomst van AI in deze regio zal uit deze regio zelf komen. Dat is precies waar we aan werken.
Hoe ziet u CNTXT AI de AI-ecosysteem in het Midden-Oosten vormgeven in de komende vijf jaar?
Door echte AI-bereidheid mogelijk te maken. We gaan naar binnen, begrijpen wat bedrijven en overheden nodig hebben, bouwen de gegevens- en AI-strategieën, en helpen hen vervolgens bij het bouwen, testen, implementeren en schalen.
Als gegevens het nieuwe olie zijn, dan is ongestructureerde gegevens olie ongeraffineerd – vol potentieel, maar nutteloos totdat het verwerkt is. Dat is waarom we CNTXT AI hebben gebouwd om organisaties te helpen hun gegevens schoon te maken, te structureren en te activeren. Omdat dat is waar echte AI-transformatie begint.
Vanuit uw positie als zowel ondernemer als investeerder, wat zou u andere oprichters adviseren die AI-startups in opkomende markten bouwen?
Begin nu. Ga snel. Faal snel, leer sneller, en blijf itereren.
Vooral, bouw voor echte problemen. Blijf dicht bij de grond – luister naar gebruikers, niet alleen naar de hype. In opkomende markten zijn relevantie en adaptatiebaarheid sleutel.
Bedankt voor het geweldige interview, lezers die meer willen leren, moeten CNTXT AI bezoeken.












