Suivez nous sur

Mohammad Abu Sheikh, fondateur et PDG de CNTXT AI – Série d'entretiens

Interviews

Mohammad Abu Sheikh, fondateur et PDG de CNTXT AI – Série d'entretiens

mm

Mohammed Abou Cheikh transforme le paysage de l'IA dans la rĂ©gion MENA, favorisant la transition d'une consommation passive vers une innovation souveraine. En tant que PDG de CNTXT AI et fondateur d'un fonds d'IA de 10 millions de dollars, il a menĂ© Ă  bien trois cessions et levĂ© plus d'un milliard de dollars de financement. Son travail pose les bases d'un Ă©cosystème d'IA ancrĂ© dans la langue, la culture et la souverainetĂ© des donnĂ©es.

CNTXT AI est une société de transformation numérique qui fournit une infrastructure cloud, des logiciels industriels et des solutions robotiques pour aider les organisations à moderniser leurs opérations et à débloquer des informations basées sur les données au Moyen-Orient et en Afrique du Nord.

Qu’est-ce qui vous a inspiré à créer CNTXT AI et comment est née votre vision d’une IA souveraine dans le monde arabophone ?

Nous avons constaté l'abondance de données sous-exploitées dans cette région du monde. De nombreux problèmes de mise à l'échelle de l'IA provenaient du manque de préparation des données, ce qui a finalement entraîné un manque de préparation de l'IA. C'est pourquoi nous avons lancé CNTXT AI.

Au départ, nous avons résolu les mêmes problèmes que lors du développement de LocAI… Nous avons constaté ces difficultés en travaillant avec AI71, TII et G42 (IIAI). En aidant ces entités à résoudre ces problèmes, notre vision s'est précisée et l'entreprise a poursuivi sa croissance.

Vous avez jouĂ© un rĂ´le clĂ© dans la crĂ©ation de la plus grande bibliothèque numĂ©rique arabe pour la formation en IA. Quels ont Ă©tĂ© les plus grands dĂ©fis Ă  relever et comment les avez-vous surmontĂ©s ?

La qualitĂ© Ă©tait l'un des plus grands dĂ©fis. Un autre Ă©tait la disponibilitĂ© limitĂ©e de donnĂ©es arabes de qualitĂ© en ligne : l'arabe est gravement sous-reprĂ©sentĂ©. Seule une petite partie du contenu en langue arabe a Ă©tĂ© numĂ©risĂ©e, et seulement 3 Ă  5 % de l'ensemble du contenu en ligne est en arabe. C'est presque rien. Nous avons surmontĂ© ce problème en dĂ©ployant des Ă©tiqueteurs de donnĂ©es, des annotateurs et des data scientists pour numĂ©riser, crĂ©er et organiser les donnĂ©es nous-mĂŞmes.

CNTXT AI opère Ă  l'intersection de la culture et de l'informatique. Comment concilier l'innovation de pointe en IA et l'objectif de crĂ©er des solutions culturellement pertinentes pour la rĂ©gion MENA ?

Nous construisons des modèles ancrĂ©s dans la culture dès le dĂ©part. De l'infrastructure au produit final, la culture est intĂ©grĂ©e dès le dĂ©part ; ce n'est pas un ajout ultĂ©rieur. Nous concevons, innovons et construisons en tenant compte des cultures, dialectes et besoins spĂ©cifiques dès le dĂ©part. L'arabe est une langue unique, mais elle englobe de nombreux dialectes et contextes culturels dans la rĂ©gion. Nous crĂ©ons donc des produits locaux pour les pays concernĂ©s. Et nous y parvenons en collaborant avec des annotateurs locaux, des personnes sur le terrain, dans leurs propres pays.

Vous avez Ă©galement cofondĂ© LocAI et dirigĂ© le fonds SMPL AI. Comment ces projets complètent-ils la mission de CNTXT AI ?

LocAI est la couche applicative, la partie avec laquelle les utilisateurs interagissent rĂ©ellement. Elle repose directement sur les donnĂ©es et l'infrastructure dĂ©veloppĂ©es par CNTXT AI. C'est ce qui a fait son succès : elle transforme les fondements de l'IA fournis par CNTXT AI en solutions concrètes et utilisables par tous.

SMPL AI, quant à elle, s'engage à contribuer à la communauté. Elle investit dans des startups en phase de démarrage et contribue au développement de l'écosystème régional de l'IA. Nous partageons les outils et les enseignements tirés de notre propre développement d'IA, afin que les fondateurs puissent se développer plus rapidement et éviter les pièges courants.

Munsit a Ă©tĂ© qualifiĂ© de modèle de reconnaissance vocale arabe le plus prĂ©cis au monde. Qu'est-ce qui a motivĂ© le dĂ©veloppement de ce modèle, et pourquoi maintenant ?

Ce qui a motivé le développement de ce modèle était simple : le besoin.

Nous construisons toujours par nĂ©cessitĂ©. Nous avons Ă©tudiĂ© le marchĂ© et constatĂ© que le terrain Ă©tait propice : les agences gouvernementales et les clients privĂ©s demandaient tous une solution de ce type.

Les modèles existants n'étaient tout simplement pas à la hauteur. La plupart d'entre eux étaient basés sur une technologie anglaise, puis adaptés. Ils n'étaient pas conçus dès le départ pour l'arabe, et certainement pas pour les problèmes spécifiques que nous résolvons.

Nous avons donc décidé de construire le nôtre. Il est d'abord arabe, par conception.

La recherche Ă  l'origine de Munsit introduit une approche d'apprentissage faiblement supervisĂ©. Pouvez-vous expliquer ce que cela signifie et pourquoi c'Ă©tait essentiel pour former la reconnaissance automatique de la parole en arabe Ă  grande Ă©chelle ?

L'annotation est coûteuse. Nous avons donc dû abandonner les méthodes traditionnelles qui reposent sur de nombreuses transcriptions manuelles. L'apprentissage faiblement supervisé nous a permis d'évoluer sans avoir à étiqueter chaque fichier audio à la main, ce qui est particulièrement important pour l'arabe, une langue dont les données sont limitées et qui compte de nombreux dialectes.

Au lieu d'utiliser des transcriptions audio professionnelles, nous avons utilisĂ© 30,000 15,000 heures de discours arabes non Ă©tiquetĂ©s. Nous avons dĂ©veloppĂ© un pipeline d'annotation qui gĂ©nère, filtre et nettoie les meilleurs Ă©lĂ©ments grâce Ă  des vĂ©rifications automatisĂ©es. Nous avons ainsi obtenu un ensemble de donnĂ©es de haute qualitĂ© de XNUMX XNUMX heures, le tout sans transcription humaine.

Cette approche a permis d'entraîner notre modèle de A à Z, capturant ainsi la richesse de l'arabe parlé dans des situations réelles, rapidement et à moindre coût. Sans cette méthode, la création d'un système de reconnaissance automatique de la parole en arabe à cette échelle aurait nécessité des années et des millions de travail manuel.

Munsit a surpassĂ© les modèles d'OpenAI, de Microsoft et de Meta sur de nombreux benchmarks. Que rĂ©vèle cette performance sur l'avenir de l'innovation en IA dans le monde arabe ?

L'avenir de l'IA arabe est entre nos mains ; et c'est prĂ©cisĂ©ment ce que prouve cette rĂ©ussite. Nous ne pouvons plus nous permettre de dĂ©pendre de technologies qui ne nous appartiennent pas ou de tiers qui ne donnent pas la prioritĂ© Ă  notre rĂ©gion.

Munsit dĂ©montre que nous pouvons crĂ©er une IA de classe mondiale, Ă  partir de la rĂ©gion et pour la rĂ©gion, en utilisant les talents locaux pour rĂ©soudre les problèmes locaux. C'est un signal clair : la prochaine vague d'innovation en IA arabe viendra de l'intĂ©rieur.

Comment voyez-vous l'évolution de Munsit dans les versions futures et quelles sont les prochaines frontières de l'IA vocale arabe chez CNTXT ?

Il faudra attendre pour voir. Ce que je peux dire, c'est que nous avons une nouvelle suite de solutions d'IA entièrement dédiées à l'arabe en développement, toutes basées sur Munsit et d'autres modèles que nous développons actuellement chez CNTXT AI. Ce n'est qu'un début.

Vous Ă©voquez souvent l'importance d'une « IA souveraine Â». Que signifie ce terme pour vous et pourquoi est-il crucial pour le Golfe et la rĂ©gion MENA ?

Pour moi, l'IA souveraine signifie avoir la pleine propriété et le contrôle des données, des infrastructures et des modèles qui façonnent notre avenir. C'est essentiel, car nous devons être maîtres de notre destin, et cela commence par les données.

La souveraineté des données est primordiale. Elles sont précieuses et nous devons veiller à ce qu'elles restent entre nos mains.

Nous ne pouvons pas nous permettre de laisser notre avenir à l'abandon et de rester les bras croisés pendant que d'autres construisent la technologie pour nous. L'avenir de l'IA dans cette région viendra d'elle. C'est précisément ce à quoi nous travaillons.

Comment voyez-vous CNTXT AI façonner l’écosystème de l’IA au Moyen-Orient au cours des cinq prochaines années ?

En favorisant une véritable préparation à l'IA. Nous intervenons, comprenons les besoins des entreprises et des gouvernements, élaborons les stratégies de données et d'IA, puis les aidons à concevoir, tester, déployer et faire évoluer leurs activités.

Si les données sont le nouveau pétrole, alors les données non structurées sont du pétrole brut — plein de potentiel mais inutile tant qu’elles ne sont pas traitées. C'est pourquoi nous avons créé CNTXT AI pour aider les organisations à nettoyer, structurer et activer leurs données. Car c'est là que commence la véritable transformation de l'IA.

De votre point de vue d’entrepreneur et d’investisseur, quels conseils donneriez-vous aux autres fondateurs qui créent des startups d’IA sur les marchés émergents ?

Commencez maintenant. Agissez vite. Échouez vite, apprenez plus vite et continuez à itérer.

Surtout, construisez pour des problèmes concrets. Restez proche du terrain : Ă©coutez les utilisateurs, pas seulement le buzz. Sur les marchĂ©s Ă©mergents, la pertinence et l'adaptabilitĂ© sont essentielles.

Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter CNTXT AI.

Antoine est un leader visionnaire et partenaire fondateur d'Unite.AI, animé par une passion inébranlable pour façonner et promouvoir l'avenir de l'IA et de la robotique. Entrepreneur en série, il croit que l'IA sera aussi perturbatrice pour la société que l'électricité, et on le surprend souvent en train de s'extasier sur le potentiel des technologies disruptives et de l'AGI.

En futuriste, il se consacre à l'exploration de la manière dont ces innovations façonneront notre monde. En outre, il est le fondateur de Titres.io, une plateforme axée sur l’investissement dans les technologies de pointe qui redéfinissent l’avenir et remodèlent des secteurs entiers.