Interviews
Mohammad Abu Sheikh, Gründer & CEO von CNTXT AI – Interview-Serie

Mohammad Abu Sheikh verändert die KI-Landschaft in der MENA-Region, indem er einen Wandel von passiver Nutzung zu souveräner Innovation vorantreibt. Als CEO von CNTXT AI und Gründer eines 10-Millionen-Dollar-KI-Fonds hat er drei erfolgreiche Exits durchgeführt und über eine Milliarde Dollar an Finanzierungsmitteln gesichert. Seine Arbeit legt den Grundstein für ein KI-Ökosystem, das in Sprache, Kultur und Datenhoheit verwurzelt ist.
CNTXT AI ist ein Unternehmen für digitale Transformation, das Cloud-Infrastruktur, Industriesoftware und Robotiklösungen anbietet, um Organisationen dabei zu helfen, ihre Betriebe zu modernisieren und datengetriebene Erkenntnisse in der gesamten MENA-Region freizuschalten.
Was hat Sie dazu inspiriert, CNTXT AI zu gründen, und wie begann Ihre Vision für souveräne KI in der arabischsprachigen Welt?
Wir sahen die Fülle an ungenutzten Daten in diesem Teil der Welt. Viele Probleme bei der Skalierung von KI resultierten aus dem Mangel an Datenbereitschaft – was letztendlich einen Mangel an KI-Bereitschaft bedeutete. Deshalb haben wir CNTXT AI gegründet.
Zunächst lösten wir dieselben Probleme, mit denen wir beim Aufbau von LocAI konfrontiert waren… Wir sahen diese Herausforderungen aus erster Hand, als wir mit AI71, TII und G42 (IIAI) zusammenarbeiteten. Als wir diesen Entitäten halfen, diese Probleme zu lösen, wurde die Vision klarer und das Geschäft wuchs einfach.
Sie haben eine Schlüsselrolle bei der Erstellung der größten arabischen Digitalbibliothek für die KI-Schulung gespielt. Was waren einige der größten Herausforderungen dabei, und wie haben Sie sie überwunden?
Die Qualität war eine der größten Herausforderungen. Eine weitere war die begrenzte Verfügbarkeit hochwertiger arabischer Daten im Internet: Arabisch ist ernsthaft unterrepräsentiert. Nur ein kleiner Teil des arabischsprachigen Inhalts wurde digitalisiert, und nur 3–5 % aller Online-Inhalte sind auf Arabisch. Das ist fast nichts. Wir überwanden dieses Problem, indem wir Datenlabeler, Annotatoren und Datenwissenschaftler einsetzten, um die Daten selbst zu digitalisieren, zu erstellen und zu kuratieren.
CNTXT AI operiert an der Schnittstelle zwischen Kultur und Rechnung. Wie balancieren Sie die Spitzenleistungen der KI-Innovation mit dem Ziel, kulturell relevante Lösungen für die MENA-Region zu entwickeln?
Wir bauen kulturell fundierte Modelle von Grund auf. Von der Infrastruktur bis zum Endprodukt ist die Kultur von Anfang an eingebettet – es ist nicht etwas, das wir später hinzufügen. Wir entwerfen, innovieren und bauen mit spezifischen Kulturen, Dialekten und Bedürfnissen im Voraus, von Tag eins an. Arabisch ist eine Sprache, aber sie trägt viele Dialekte und kulturelle Kontexte in der Region, also bauen wir lokale Produkte für lokale Länder. Und wir tun das, indem wir mit lokalen Annotatoren, Menschen vor Ort, in ihren eigenen Ländern zusammenarbeiten.
Sie haben auch LocAI mitgegründet und leiten den SMPL-KI-Fonds. Wie ergänzen diese Unternehmen die Mission von CNTXT AI?
LocAI ist die Anwendungsebene – der Teil, mit dem die Menschen tatsächlich interagieren. Es sitzt direkt auf den Daten und der Infrastruktur, die von CNTXT AI aufgebaut wurden. Das ist es, was es erfolgreich gemacht hat: Es transformiert die KI-Grundlagen, die von CNTXT AI bereitgestellt werden, in realweltliche Lösungen, die die Menschen nutzen können.
SMPL-KI hingegen geht darum, der Gemeinschaft etwas zurückzugeben. Es konzentriert sich auf Investitionen in Start-ups in der Frühphase und hilft dabei, das regionale KI-Ökosystem aufzubauen. Wir teilen die Werkzeuge und Lektionen, die wir aus dem Aufbau von KI selbst gelernt haben, damit Gründer schneller wachsen und gemeinsame Fallstricke vermeiden können.
Munsit wurde als das genaueste arabische Spracherkennungsmodell der Welt bezeichnet. Was trieb die Entwicklung dieses Modells an, und warum jetzt?
Was die Entwicklung dieses Modells antrieb, war einfach: die Notwendigkeit.
Wir bauen immer aus Notwendigkeit heraus. Wir sahen uns den Markt an und sahen, dass die Landschaft reif war – Regierungsbehörden und private Kunden fragten alle nach einer Lösung wie dieser.
Die vorhandenen Modelle waren einfach nicht auf der Höhe der Aufgabe. Die meisten sind auf Englisch-Technologie aufgebaut und dann adaptiert. Sie sind nicht für Arabisch von Grund auf konzipiert, und definitiv nicht für die spezifischen Probleme, die wir lösen.
Also beschlossen wir, unser eigenes Modell zu bauen. Es ist Arabisch zuerst – von Design aus.
Die Forschung hinter Munsit führt einen schwach überwachten Lernansatz ein. Können Sie erklären, was das bedeutet und warum es für die Schulung arabischer ASR im großen Maßstab unerlässlich war?
Die Annotation ist teuer. Also mussten wir über traditionelle Methoden hinausgehen, die auf großen Mengen manueller Transkription basieren. Schwach überwachtes Lernen half uns, ohne dass wir jedes Audio-File von Hand annotieren mussten – was besonders wichtig für Arabisch ist, eine Sprache mit begrenzten Daten und vielen verschiedenen Dialekten.
Anstatt professionell transkribierte Audio-Dateien zu verwenden, begannen wir mit 30.000 Stunden unbeschrifteter arabischer Sprache. Wir bauten eine Annotation-Pipeline, die die besten generiert, filtert und reinigt, indem automatisierte Überprüfungen verwendet werden. Das gab uns ein hochwertiges 15.000-Stunden-Datenset – alles ohne menschliche Transkription.
Dieser Ansatz ermöglichte es uns, unser Modell von Grund auf zu trainieren, die Vielfalt der gesprochenen Arabisch in realen Lebenssituationen schnell und kosteneffizient zu erfassen. Ohne diese Methode hätte der Aufbau eines arabischen ASR-Systems in diesem Maßstab Jahre und Millionen an manuellem Aufwand erfordert.
Munsit übertraf Modelle von OpenAI, Microsoft und Meta in mehreren Benchmarks. Was sagt diese Leistung über die Zukunft der arabischen KI-Innovation aus?
Die Zukunft der arabischen KI liegt in unseren Händen; und das ist genau das, was diese Leistung beweist. Wir können es uns nicht mehr leisten, auf Technologien zu vertrauen, die wir nicht besitzen, oder von Dritten abhängig zu sein, die unsere Region nicht priorisieren.
Munsit zeigt, dass wir weltklasse-KI bauen können, aus der Region, für die Region – mit lokalem Talent, um lokale Probleme zu lösen. Es ist ein klares Signal, dass die nächste Welle der arabischen KI-Innovation aus der Region selbst kommen wird.
Wie sehen Sie Munsit in zukünftigen Versionen evolvieren, und was sind die nächsten Grenzen für arabische Sprach-KI bei CNTXT?
Sie werden einfach warten und sehen müssen. Was ich sagen kann, ist, dass wir eine frische, neue Suite arabischer KI-Lösungen auf dem Weg haben – alle von Munsit und anderen Modellen angetrieben, die wir derzeit bei CNTXT AI aufbauen. Das ist nur der Anfang.
Sie sprechen oft über die Wichtigkeit von “souveräner KI”. Was bedeutet dieser Begriff für Sie, und warum ist er für den Golf und die breitere MENA-Region von entscheidender Bedeutung?
Für mich bedeutet souveräne KI, die vollständige Kontrolle über die Daten, Infrastruktur und Modelle zu haben, die unsere Zukunft prägen. Es ist entscheidend, weil wir unser eigenes Schicksal besitzen müssen, und das beginnt mit den Daten.
Datenhoheit ist alles. Daten sind wertvoll, und wir müssen sicherstellen, dass sie in unseren Händen bleiben.
Wir können es uns nicht leisten, unsere Zukunft aus der Hand zu geben und untätig zu bleiben, während andere die Technologie für uns aufbauen. Die Zukunft der KI in dieser Region wird aus dieser Region selbst kommen. Genau darauf arbeiten wir hin.
Wie sehen Sie CNTXT AI die KI-Landschaft im Nahen Osten in den nächsten fünf Jahren prägen?
Indem wir wahre KI-Bereitschaft ermöglichen. Wir gehen hinein, verstehen, was Unternehmen und Regierungen benötigen, bauen die Daten- und KI-Strategien auf und helfen ihnen dann, aufzubauen, zu testen, bereitzustellen und zu skalieren.
Wenn Daten das neue Öl sind, dann ist unstrukturierte Daten Öl unraffiniert – voller Potenzial, aber nutzlos, bis es verarbeitet wird. Deshalb haben wir CNTXT AI aufgebaut, um Organisationen dabei zu helfen, ihre Daten zu reinigen, zu strukturieren und zu aktivieren. Denn dort beginnt die wahre KI-Transformation.
Aus Ihrer Perspektive als Unternehmer und Investor, was würden Sie anderen Gründern raten, die KI-Start-ups in aufstrebenden Märkten aufbauen?
Fangen Sie jetzt an. Bewegen Sie sich schnell. Scheitern Sie schnell, lernen Sie noch schneller und iterieren Sie weiter.
Wichtigstes ist, für echte Probleme zu bauen. Bleiben Sie nah am Boden – hören Sie den Nutzern zu, nicht nur dem Hype. In aufstrebenden Märkten sind Relevanz und Anpassungsfähigkeit entscheidend.
Vielen Dank für das großartige Interview. Leser, die mehr erfahren möchten, sollten CNTXT AI besuchen.












