Intervjuer
Mohammad Abu Sheikh, Grundare & VD för CNTXT AI – Intervjuer

Mohammad Abu Sheikh förvandlar AI-landskapet i MENA-regionen, driver en förändring från passiv konsumtion till suverän innovation. Som VD för CNTXT AI och grundare av en AI-fond på 10 miljoner dollar har han lett tre framgångsrika avyttringar och säkerställt över en miljard dollar i finansiering. Hans arbete lägger grunden för ett AI-ekosystem med rötter i språk, kultur och datasuveränitet.
CNTXT AI är ett digitalt transformationsföretag som tillhandahåller molninfrastruktur, industriell programvara och robotiklösningar för att hjälpa organisationer modernisera verksamheten och låsa upp datastyrd insikt över hela Mellanöstern och Nordafrika.
Vad inspirerade dig att starta CNTXT AI, och hur började din vision för suverän AI i den arabisktalande världen?
Vi såg överflödet av outnyttjad data i denna del av världen. Många problem med att skala AI kom från bristen på databeredskap — vilket till slut innebar en brist på AI-beredskap. Därför startade vi CNTXT AI.
Till en början löste vi samma problem som vi stött på medan vi byggde LocAI…Vi såg dessa utmaningar på nära håll när vi arbetade med AI71, TII och G42 (IIAI). När vi hjälpte dessa enheter att lösa dessa problem blev visionen tydligare och affären fortsatte att växa.
Du har spelat en nyckelroll i att bygga den största arabiska digitala biblioteket för AI-träning. Vilka var några av de största utmaningarna i att göra detta, och hur övervann du dem?
Kvalitet var en av de största utmaningarna. En annan var den begränsade tillgängligheten av högkvalitativa arabiska data online: Arabiska är allvarligt underrepresenterat. Endast en liten del av arabiskt innehåll har digitaliserats, och endast 3–5% av allt onlineinnehåll är på arabiska. Det är nästan ingenting. Vi övervann detta problem genom att distribuera dataetiketterare, annotatorer och dataforskare för att digitalisera, skapa och kurera data själva.
CNTXT AI verkar i skärningspunkten mellan kultur och beräkning. Hur balanserar du banbrytande AI-innovation med målet att bygga kulturellt relevanta lösningar för MENA-regionen?
Vi bygger kulturellt grundade modeller från grunden. Från infrastruktur till slutprodukt är kultur inbäddad från början — det är inte något vi lägger till senare. Vi designar, innovatörer och bygger med specifika kulturer, dialektala och behov i åtanke från dag ett. Arabiska är ett språk, men det bär många dialektala och kulturella sammanhang över hela regionen, så vi bygger lokala produkter för lokala länder. Och vi gör det genom att arbeta med lokala annotatorer, människor på plats, i deras egna länder.
Du har också medgrundat LocAI och leder SMPL AI-fonden. Hur kompletterar dessa företag CNTXT AI:s uppdrag?
LocAI är applikationslagret — den del som människor faktiskt interagerar med. Det sitter rakt ovanpå den data och infrastruktur som byggts av CNTXT AI. Det är det som gjorde det framgångsrikt: det transformerar AI-grunderna som tillhandahålls av CNTXT AI till riktiga lösningar som människor kan använda.
SMPL AI, å andra sidan, handlar om att ge tillbaka till samhället. Det fokuserar på att investera i tidiga startups och hjälpa till att bygga den regionala AI-ekosystemet. Vi delar de verktyg och lärdomar som vi har lärt oss från att bygga AI själva, så att grundare kan växa snabbare och undvika vanliga fallgropar.
Munsit har kallats den mest exakta arabiska taligenkänningsmodellen i världen. Vad drev utvecklingen av denna modell, och varför nu?
Vad som drev utvecklingen av denna modell var enkelt: behovet.
Vi bygger alltid utifrån nödvändighet. Vi tittade på marknaden och såg att landskapet var moget — regeringsbyråer och privata kunder bad alla om en lösning som denna.
De befintliga modellerna var inte upp till uppgiften. De flesta är byggda på engelsk teknik och sedan anpassade. De är inte utformade för arabiska från grunden, och definitivt inte för de specifika problem som vi löser.
Så vi bestämde oss för att bygga vår egen. Det är arabiska först — av design.
Forskningen bakom Munsit introducerar en svagt övervakad inlärningsmetod. Kan du förklara vad det innebär och varför det var avgörande för att träna arabisk ASR i stor skala?
Annotering är dyrt. Så vi var tvungna att gå bortom traditionella metoder som förlitar sig på stora mängder manuell transkription. Svagt övervakad inlärning hjälpte oss att skala utan att behöva märka varje ljudfil för hand — vilket är särskilt viktigt för arabiska, ett språk med begränsad data och många olika dialektala.
Istället för att använda professionellt transkriberat ljud började vi med 30 000 timmar av outmärkt arabiskt tal. Vi byggde en annoteringspipeline som genererar, filtrerar och rensar de bästa med hjälp av automatiserade kontroller. Detta gav oss en högkvalitativ dataset på 15 000 timmar — allt utan mänsklig transkription.
Denna metod gjorde det möjligt för oss att träna vår modell från scratch, fånga rikedomen av talat arabiska i verkliga livssituationer, snabbt och kostnadseffektivt. Utan denna metod skulle byggandet av ett arabiskt ASR-system i denna skala ha tagit år och miljoner i manuell ansträngning.
Munsit överträffade modeller från OpenAI, Microsoft och Meta över flera benchmark-tester. Vad säger detta om framtiden för arabisk AI-innovation?
Framtiden för arabisk AI ligger i våra händer; och det är exakt vad denna prestation bevisar. Vi kan inte längre förlita oss på tekniker som vi inte äger eller förlita oss på tredje parter som inte prioriterar vår region.
Munsit visar att vi kan bygga världsklass AI, från regionen, för regionen — med hjälp av lokal talang för att lösa lokala problem. Det är ett tydligt signal om att den kommande vågen av arabisk AI-innovation kommer från inom.
Hur ser du Munsit utvecklas i framtida versioner, och vad är de kommande frontlinjerna för arabisk röst-AI på CNTXT?
Du får bara vänta och se. Vad jag kan säga är att vi har en ny, fräsch svit av arabiskt AI-lösningar på väg — alla drivna av Munsit och andra modeller som vi för närvarande bygger på CNTXT AI. Detta är bara början.
Du talar ofta om vikten av “suverän AI”. Vad betyder den termen för dig, och varför är det avgörande för Gulfen och den bredare MENA-regionen?
För mig betyder suverän AI att ha full äganderätt och kontroll över de data, infrastruktur och modeller som formar vår framtid. Det är avgörande eftersom vi behöver äga vår egen öde, och det börjar med data.
Datasuveränitet är allt. Data är dyrbar, och vi måste se till att den stannar i våra händer.
Vi kan inte förlita oss på att andra bygger tekniken åt oss. Framtiden för AI i denna region kommer från denna region. Det är exakt vad vi arbetar mot.
Hur ser du CNTXT AI forma AI-ekosystemet i Mellanöstern under de kommande fem åren?
Genom att möjliggöra verklig AI-beredskap. Vi går in, förstår vad företag och regeringar behöver, bygger data- och AI-strategier och sedan hjälper dem att bygga, testa, distribuera och skala.
Om data är den nya oljan, då är ostrukturerad data olja outvunnen — full av potential men värdelös tills den bearbetas. Det är därför vi har byggt CNTXT AI för att hjälpa organisationer rensa, strukturera och aktivera sin data. För det är där den verkliga AI-transformationen börjar.
Från din utgångspunkt som både entreprenör och investerare, vad råd skulle du ge till andra grundare som bygger AI-startups i nya marknader?
Börja nu. Flytta snabbt. Misslyckas snabbt, lära snabbare och fortsätt iterera.
Viktigast av allt, bygg för riktiga problem. Stanna nära marken — lyssna på användare, inte bara hype. I nya marknader är relevans och anpassningsförmåga nyckeln.
Tack för den underbara intervjun, läsare som vill lära sig mer bör besöka CNTXT AI.












