Connect with us

Mohammad Abu Sheikh, grundlægger & CEO af CNTXT AI – Intervju-serie

Interviews

Mohammad Abu Sheikh, grundlægger & CEO af CNTXT AI – Intervju-serie

mm

Mohammad Abu Sheikh er med til at ændre AI-landskabet i MENA-regionen, hvor der sker en overgang fra passiv forbrug til suveræn innovation. Som CEO af CNTXT AI og grundlægger af en 10 millioner dollars AI-fond, har han ledt tre succesfulde exit-strategier og sikret over en milliard dollars i finansiering. Hans arbejde lægger grundlaget for et AI-økosystem, der er rodnet i sprog, kultur og datasuverænitet.

CNTXT AI er et digitalt transformationsfirma, der tilbyder cloud-infrastruktur, industriel software og robotløsninger til at hjælpe organisationer med at modernisere deres drift og låse indsighter op på tværs af Mellemøsten og Nordafrika.

Hvad inspirerede dig til at starte CNTXT AI, og hvordan begyndte din vision for suveræn AI i den arabisk-talende verden?

Vi så overfloden af underudnyttet data i denne del af verden. Mange problemer med at skala AI opstod fra manglen på – hvilket til sidst betød en manglende AI-klarhed. Derfor startede vi CNTXT AI.

Til at begynde med løste vi de samme problemer, vi havde, da vi byggede LocAI… Vi så disse udfordringer førstehånds, da vi arbejdede med AI71, TII og G42 (IIAI). Da vi hjalp disse enheder med at løse disse problemer, blev visionen klarere, og forretningen voksede bare.

Du har spillet en nøglerolle i opbygningen af den største arabisk digitale bibliotek til AI-træning. Hvad var nogle af de største udfordringer i dette, og hvordan overvandt du dem?

Kvalitet var en af de største udfordringer. En anden udfordring var den begrænsede tilgængelighed af højkvalitets-arabisk data online: Arabisk er alvorligt underrepræsenteret. Kun en lille del af arabisk-sproget indhold er blevet digitaliseret, og kun 3-5% af alt online-indhold er på arabisk. Det er næsten ingenting. Vi overvandt dette problem ved at udrusteærkere, annotatorer og datavidenskabsmænd til at digitalisere, oprette og kuraterer dataene selv.

CNTXT AI opererer på skæringen af kultur og beregning. Hvordan balancerer du banebrydende AI-innovation med målet om at bygge kulturelt relevante løsninger til MENA-regionen?

Vi bygger kulturelt funderede modeller fra bunden og op. Fra infrastruktur til endprodukt er kultur indlejret fra allerførste begyndelse – det er ikke noget, vi tilføjer senere. Vi designer, innovere og bygger med specifikke kulturer, dialekter og behov for øje fra dag én. Arabisk er ét sprog, men det bærer mange dialekter og kulturelle sammenhænge på tværs af regionen, så vi bygger lokale produkter til lokale lande. Og vi gør det ved at arbejde med lokale annotatorer, mennesker på jorden, i deres eget land.

Du har også medstiftet LocAI og leder SMPL AI-fonden. Hvordan supplerer disse virksomheder CNTXT AI’s mission?

LocAI er ansøgningslaget – den del, som folk faktisk interagerer med. Det sidder lige oven på den data og infrastruktur, der er bygget af CNTXT AI. Det er det, der gjorde det succesfuldt: Det transformerer AI-fundamentet leveret af CNTXT AI til virkelige løsninger, som folk kan bruge.

SMPL AI, på den anden side, handler om at give noget tilbage til samfundet. Det fokuserer på at investere i tidlige startups og hjælpe med at bygge det regionale AI-økosystem. Vi deler værktøjerne og læresætningerne, vi har lært fra at bygge AI selv, så stiftere kan vokse hurtigere og undgå almindelige fælder.

Munsit er blevet kaldt den mest nøjagtige arabisk talegenkendelsesmodel i verden. Hvad drev udviklingen af denne model, og hvorfor nu?

Det, der drev udviklingen af denne model, var simpelt: behovet.

Vi bygger altid ud fra nødvendighed. Vi kiggede på markedet og så, at landskabet var modent – regeringsinstitutioner og private kunder bad alle om en løsning som denne.

De eksisterende modeller var ikke opgaven. De fleste er bygget på engelsk teknologi og derefter tilpasset. De er ikke designet til arabisk fra bunden og op, og bestemt ikke til de specifikke problemer, vi løser.

Så vi besluttede os for at bygge vores egen. Det er arabisk først – ved design.

Forskningen bag Munsit introducerer en svagt overvåget læringstilgang. Kan du forklare, hvad det betyder, og hvorfor det var afgørende for at træne arabisk ASR i stor målestok?

Annotation er dyrt. Så vi måtte gå ud over traditionelle metoder, der afhænger af store mængder manuel transkription. Svagt overvåget læring hjalp os med at skala uden at skulle mærke hver enkelt lydfil med hånden – hvilket er særligt vigtigt for arabisk, et sprog med begrænsede data og mange forskellige dialekter.

I stedet for at bruge professionelt transkriberet lyd startede vi med 30.000 timer af umærket arabisk tale. Vi byggede en annotationspipeline, der genererer, filterer og rensker de bedste ved hjælp af automatiserede kontroller. Dette gav os en højkvalitetsdataset på 15.000 timer – alt uden menneskelig transkription.

Denne tilgang gjorde det muligt for os at træne vores model fra scratch, fanget rigdommen af talt arabisk på tværs af reelle livssituationer, hurtigt og omkostningseffektivt. Uden denne metode ville det have taget år og millioner i manuel indsats at bygge et arabisk ASR-system i denne skala.

Munsit overgik modeller fra OpenAI, Microsoft og Meta på tværs af multiple benchmarks. Hvad siger denne præstation om fremtiden for arabisk AI-innovation?

Fremtiden for arabisk AI er i vores hænder; og det er præcis, hvad denne præstation beviser. Vi kan ikke længere tillade os at afhænge af teknologier, vi ikke ejer, eller afhænge af tredjeparter, der ikke prioriterer vores region.

Munsit viser, at vi kan bygge verdensklasse-AI, fra regionen, til regionen – ved at bruge lokale talenter til at løse lokale problemer. Det er et klart signal om, at den næste bølge af arabisk AI-innovation vil komme fra indenfor.

Hvordan ser du Munsit udvikle sig i fremtidige versioner, og hvad er de næste frontiers for arabisk stemme-AI hos CNTXT?

Du skal bare vente og se. Det, jeg kan sige, er, at vi har en frisk, ny samling af arabisk-først AI-løsninger på vej – alle drevet af Munsit og andre modeller, vi bygger i CNTXT AI. Dette er kun begyndelsen.

Du taler ofte om vigtigheden af “suveræn AI”. Hvad betyder denne term for dig, og hvorfor er det kritisk for Golfen og den bredere MENA-region?

For mig betyder suveræn AI at have fuld ejerskab og kontrol over de data, infrastruktur og modeller, der former vores fremtid. Det er kritisk, fordi vi behøver at eje vores egen skæbne, og det starter med data.
ænitet er alt. Data er kostbart, og vi behøver at sikre, at det forbliver i vores hænder.

Vi kan ikke tillade os at overdrage vores fremtid og sidde inaktive, mens andre bygger teknologien til os. Fremtiden for AI i denne region vil komme fra denne region. Det er præcis, hvad vi arbejder hen imod.

Hvordan ser du CNTXT AI forme AI-økosystemet i Mellemøsten over de næste fem år?

Ved at enable sand AI-klarhed. Vi går ind, forstår, hvad virksomheder og regeringer behøver, bygger data- og AI-strategier og hjælper derefter med at bygge, teste, udrulle og skala.

Hvis data er det nye olie, så er ustruktureret data olie, der ikke er raffineret – fuld af potentiale, men nytteløs, indtil den er behandlet. Det er derfor, vi har bygget CNTXT AI til at hjælpe organisationer med at rense, strukturere og aktivere deres data. For det er der, hvor den virkelige AI-transformation begynder.

Fra din position som både iværksætter og investor, hvad ville du råde andre grundlæggere, der bygger AI-startups i opkommende markeder, til at gøre?

Start nu. Flyt hurtigt. Fejl hurtigt, lær hurtigere og hold ved med at iterere.

Vigtigst af alt: Byg på virkelige problemer. Hold tæt på jorden – lyt til brugere, ikke kun hypen. I opkommende markeder er relevans og tilpasningsevne nøglefaktorer.

Tak for det gode interview. Læsere, der ønsker at lære mere, skal besøge CNTXT AI.

Antoine er en visionær leder og medstifter af Unite.AI, drevet af en urokkelig passion for at forme og fremme fremtiden for AI og robotteknologi. En serieiværksætter, han tror, at AI vil være lige så omvæltende for samfundet som elektricitet, og bliver ofte fanget i at tale begejstret om potentialet for omvæltende teknologier og AGI.

Som en futurist, er han dedikeret til at udforske, hvordan disse innovationer vil forme vores verden. Derudover er han grundlægger af Securities.io, en platform, der fokuserer på at investere i skærende teknologier, der gendefinerer fremtiden og omformer hele sektorer.