Connect with us

Intervjuer

Mohammad Abu Sheikh, Grunnlegger & CEO av CNTXT AI – Intervju-serie

mm

Mohammad Abu Sheikh er i ferd med å transformere AI-landskapet i MENA-regionen, og driver en overgang fra passiv forbruk til suveren innovasjon. Som CEO i CNTXT AI og grunnlegger av en 10 millioners AI-fond, har han ledet tre vellykkede eksitter og sikret over en milliard dollar i finansiering. Hans arbeid legger grunnlaget for et AI-økosystem med røtter i språk, kultur og datasuverenitet.

CNTXT AI er et digitalt transformasjonsselskap som tilbyr skyinfrastruktur, industriell programvare og robotløsninger for å hjelpe organisasjoner modernisere drift og låse opp innsikter i Midtøsten og Nord-Afrika.

Hva inspirerte deg til å starte CNTXT AI, og hvordan begynte din visjon for suveren AI i den arabiske verden?

Vi så overfloden av underutnyttet data i denne delen av verden. Mange problemer med å skalerer AI kom fra mangelen på — som til slutt betydde en mangel på AI-klarhet. Derfor startet vi CNTXT AI.

Først var vi med på å løse de samme problemene vi møtte mens vi bygde LocAI…Vi så disse utfordringene først hånd mens vi arbeidet med AI71, TII og G42 (IIAI). Mens vi hjalp disse enhetene med å løse disse problemene, ble visjonen klarere og bedriften fortsatte å vokse.

Du har spilt en nøkkelrolle i å bygge den største arabiske digitale biblioteket for AI-trening. Hva var noen av de største utfordringene i å gjøre dette, og hvordan overvant du dem?

Kvalitet var en av de største utfordringene. En annen var den begrensede tilgjengeligheten av høykvalitets arabiske data på nettet: Arabisk er alvorlig underrepresentert. Bare en liten del av arabiske språkinnhold er blitt digitalisert, og bare 3–5% av all nettinnhold er på arabisk. Det er nesten ingenting. Vi overvant dette problemet ved å deployere, annotatorer og for å digitalisere, opprette og kuratere dataene selv.

CNTXT AI opererer i skjæringspunktet mellom kultur og beregning. Hvordan balanserer du banebrytende AI-innovasjon med målet om å bygge kulturelt relevante løsninger for MENA-regionen?

Vi bygger kulturelt grunnede modeller fra bunnen av. Fra infrastruktur til ferdig produkt, er kultur innbygget fra rất begynnelsen — det er ikke noe vi legger til senere. Vi designer, innovrer og bygger med spesifikke kulturer, dialekter og behov i mente fra dag én. Arabisk er ett språk, men det bærer mange dialekter og kulturelle sammenhenger i regionen, så vi bygger lokale produkter for lokale land. Og vi gjør det ved å samarbeide med lokale annotatorer, folk på bakken, i deres egne land.

Du har også medgrunnlagt LocAI og leder SMPL AI-fondet. Hvordan komplementerer disse bedriftene misjonen til CNTXT AI?

LocAI er applikasjonslaget — delen folk faktisk interagerer med. Det sitter rett på toppen av dataene og infrastrukturen bygget av CNTXT AI. Det er det som gjorde det suksessfullt: det transformerer AI-grunnlagene levert av CNTXT AI til virkelige løsninger folk kan bruke.

SMPL AI, på den andre siden, handler om å gi tilbake til samfunnet. Det fokuserer på å investere i tidlige startups og hjelpe med å bygge det regionale AI-økosystemet. Vi deler verktøyene og lærdommene vi har lært fra å bygge AI selv, så grunnleggere kan vokse raskere og unngå vanlige fallgruber.

Munsit har blitt kalt den mest nøyaktige arabiske talegjenkjenningmodellen i verden. Hva drev utviklingen av denne modellen, og hvorfor nå?

Hva drev utviklingen av denne modellen, var enkelt: behovet.

Vi bygger alltid ut fra nødvendighet. Vi så på markedet og så at landskapet var modent — regjeringer og private kunder ba alle om en løsning som denne.

De eksisterende modellene var ikke oppgaven. De fleste er bygget på engelsk teknologi og tilpasset. De er ikke designet for arabisk fra bunnen av, og definitivt ikke for de spesifikke problemene vi løser.

Så vi bestemte oss for å bygge vår egen. Det er arabisk først — ved design.

Forskningen bak Munsit introduserer en svakt overvåket læringstilnærming. Kan du forklare hva det betyr og hvorfor det var essensielt for å trene arabisk ASR i stor skala?

Merking er dyrt. Så vi måtte gå beyond tradisjonelle metoder som avhenger av store mengder manuell transkripsjon. Svakt overvåket læring hjalp oss å skalerer uten å måtte merke hver lydfil for hånd — som er spesielt viktig for arabisk, et språk med begrensede data og mange forskjellige dialekter.

I stedet for å bruke profesjonelt transkribert lyd, startet vi med 30 000 timer med umerkede arabiske taler. Vi bygde en merking-pipeline som genererer, filterer og rensker de beste med automatiske sjekker. Dette ga oss en høykvalitets datasett på 15 000 timer — all uten manuell transkripsjon.

Denne tilnærmingen gjorde det mulig å trene vår modell fra scratch, og fange rikdommen av talt arabisk i virkelige livssituasjoner, raskt og kostnadseffektivt. Uten denne metoden ville bygging av en arabisk ASR-system i denne skalaen ha tatt år og millioner i manuell innsats.

Munsit overgikk modeller fra OpenAI, Microsoft og Meta over flere benchmark. Hva sier dette om fremtiden for arabisk AI-innovasjon?

Fremtiden for arabisk AI er i våre hender; og det er nettopp hva denne prestasjonen beviser. Vi kan ikke lenger unna oss å avhenge av teknologier vi ikke eier eller avhenge av tredjeparter som ikke prioriterer vår region.

Munsit viser at vi kan bygge verdensklasse AI, fra regionen, for regionen — ved å bruke lokal talent til å løse lokale problemer. Det er et tydelig signal om at den neste bølgen av arabisk AI-innovasjon kommer fra innen.

Hvordan ser du på Munsit utvikler seg i fremtidige versjoner, og hva er de neste frontene for arabisk tale-AI ved CNTXT?

Du må bare vente og se. Hva jeg kan si er at vi har en fersk, nytt sett med arabisk-først AI-løsninger på vei — alle drevet av Munsit og andre modeller vi bygger i CNTXT AI. Dette er bare begynnelsen.

Du snakker ofte om viktigheten av “suveren AI”. Hva betyr denne betegnelsen for deg, og hvorfor er det kritisk for Gulfen og den bredere MENA-regionen?

For meg betyr suveren AI å ha full eierskap og kontroll over dataene, infrastrukturen og modellene som former vår fremtid. Det er kritisk fordi vi må eie vår egen skjebne, og det starter med data.
er alt. Data er verdifullt, og vi må sikre at det forblir i våre hender.

Vi kan ikke unna oss å overlate vår fremtid og sitte passive mens andre bygger teknologien for oss. Fremtiden for AI i denne regionen kommer fra denne regionen. Det er nettopp hva vi arbeider mot.

Hvordan ser du på CNTXT AI former AI-økosystemet i Midtøsten over de neste fem årene?

Ved å muliggjøre sanne AI-klarhet. Vi går inn, forstår hva selskaper og regjeringer trenger, bygger data- og AI-strategier, og hjelper dem bygge, teste, distribuere og skalerer.

Hvis data er det nye oljen, så er ustrukturert data olje uraffinert — fullt av potensial, men nytteløst før det er prosessert. Derfor har vi bygget CNTXT AI for å hjelpe organisasjoner rense, strukturere og aktivere dataene sine. For det er der den virkelige AI-transformasjonen begynner.

Fra din posisjon som både grunnlegger og investor, hva råd ville du gi til andre grunnleggere som bygger AI-startups i nye markeder?

Start nå. Beveg deg raskt. Feil raskt, lær raskere, og fortsett å iterere.

Mest viktig, bygg for virkelige problemer. Hold deg nær bakken — lytt til brukerne, ikke bare hype-en. I nye markeder er relevans og tilpasningsevne nøkkel.

Takk for det flotte intervjuet, lesere som ønsker å lære mer bør besøke CNTXT AI.

Antoine er en visjonær leder og grunnleggende partner i Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En seriegründer, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte tatt i å tale om potensialet for disruptiv teknologi og AGI.
Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnleggeren av Securities.io, en plattform som fokuserer på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.