Entrevistas
Mohammad Abu Sheikh, Fundador & CEO da CNTXT AI – Série de Entrevistas

Mohammad Abu Sheikh está transformando o cenário de IA na região do MENA, impulsionando uma mudança de consumo passivo para inovação soberana. Como CEO da CNTXT AI e fundador de um fundo de IA de US$ 10 milhões, ele liderou três saídas bem-sucedidas e garantiram mais de um bilhão de dólares em financiamento. Seu trabalho está criando as bases para um ecossistema de IA enraizado em linguagem, cultura e soberania de dados.
CNTXT AI é uma empresa de transformação digital que fornece infraestrutura de nuvem, software industrial e soluções de robótica para ajudar as organizações a modernizar as operações e desbloquear insights baseados em dados em todo o Oriente Médio e África do Norte.
O que o inspirou a criar a CNTXT AI, e como sua visão para IA soberana no mundo de língua árabe começou?
Nós vimos a abundância de dados subutilizados nesta parte do mundo. Muitos problemas na escalabilidade da IA vieram da falta de preparação de dados — o que eventualmente significava uma falta de preparação para IA. Foi por isso que começamos a CNTXT AI.
Inicialmente, estávamos resolvendo os mesmos problemas que enfrentamos enquanto construíamos o LocAI… Nós vimos esses desafios em primeira mão trabalhando com AI71, TII e G42 (IIAI). À medida que ajudávamos essas entidades a resolver esses problemas, a visão ficou mais clara e o negócio simplesmente continuou crescendo.
Você desempenhou um papel fundamental na criação da maior biblioteca digital árabe para treinamento de IA. Quais foram alguns dos maiores desafios ao fazer isso, e como você os superou?
A qualidade foi um dos maiores desafios. Outro foi a limitada disponibilidade de dados de alta qualidade em árabe online: o árabe está seriamente subrepresentado. Apenas uma pequena porcentagem do conteúdo em língua árabe foi digitalizado, e apenas 3–5% de todo o conteúdo online está em árabe. Isso é quase nada. Superamos esse problema implantando rotuladores de dados, anotadores e cientistas de dados para digitalizar, criar e curar os dados nós mesmos.
A CNTXT AI opera na interseção da cultura e do cálculo. Como você equilibra a inovação de IA de ponta com o objetivo de construir soluções culturalmente relevantes para a região do MENA?
Nós construímos modelos fundamentados na cultura desde o início. Desde a infraestrutura até o produto final, a cultura está incorporada desde o início — não é algo que adicionamos mais tarde. Nós projetamos, inovamos e construímos com culturas, dialetos e necessidades específicas em mente desde o dia um. O árabe é uma língua, mas carrega muitos dialetos e contextos culturais em toda a região, então construímos produtos locais para países locais. E fazemos isso trabalhando com anotadores locais, pessoas no local, em seus próprios países.
Você também co-fundou a LocAI e lidera o Fundo de IA SMPL. Como essas ventures complementam a missão da CNTXT AI?
A LocAI é a camada de aplicação — a parte com a qual as pessoas realmente interagem. Ela está diretamente sobre os dados e infraestrutura construídos pela CNTXT AI. Foi isso que a tornou bem-sucedida: ela transforma as fundações de IA fornecidas pela CNTXT AI em soluções do mundo real que as pessoas podem usar.
A SMPL AI, por outro lado, é sobre devolver à comunidade. Ela se concentra em investir em startups de estágio inicial e ajudar a construir o ecossistema regional de IA. Nós compartilhamos as ferramentas e lições que aprendemos ao construir a IA nós mesmos, para que os fundadores possam crescer mais rápido e evitar armadilhas comuns.
A Munsit foi chamada de o modelo de reconhecimento de fala árabe mais preciso do mundo. O que impulsionou o desenvolvimento desse modelo, e por quê agora?
O que impulsionou o desenvolvimento desse modelo foi simples: a necessidade.
Nós sempre construímos por necessidade. Nós olhamos para o mercado e vimos que o cenário estava maduro — agências governamentais e clientes privados estavam todos pedindo por uma solução como essa.
Os modelos existentes simplesmente não estavam à altura da tarefa. A maioria é construída com tecnologia em inglês e adaptada posteriormente. Eles não são projetados para árabe desde o início, e definitivamente não para os problemas específicos que estamos resolvendo.
Então, decidimos construir o nosso próprio. É árabe em primeiro lugar — por design.
A pesquisa por trás da Munsit introduz uma abordagem de aprendizado supervisionado fraco. Você pode explicar o que isso significa e por que foi essencial para treinar ASR árabe em escala?
A anotação é cara. Então, tivemos que ir além dos métodos tradicionais que dependem de grandes quantidades de transcrição manual. O aprendizado supervisionado fraco nos ajudou a escalar sem ter que rotular cada arquivo de áudio à mão — o que é especialmente importante para o árabe, uma língua com dados limitados e muitos dialetos diferentes.
Em vez de usar áudio transcrito profissionalmente, começamos com 30.000 horas de fala árabe não rotulada. Nós construímos um pipeline de anotação que gera, filtra e limpa os melhores usando verificações automatizadas. Isso nos deu um conjunto de dados de alta qualidade de 15.000 horas — tudo sem transcrição humana.
Essa abordagem tornou possível treinar nosso modelo do zero, capturando a riqueza da fala árabe em situações da vida real, rapidamente e de forma rentável. Sem esse método, construir um sistema de ASR árabe nessa escala teria levado anos e milhões em esforço manual.
A Munsit superou os modelos da OpenAI, Microsoft e Meta em várias benchmarks. O que esse feito diz sobre o futuro da inovação de IA árabe?
O futuro da IA árabe está em nossas mãos; e é exatamente o que esse feito prova. Nós não podemos mais nos dar ao luxo de depender de tecnologias que não possuímos ou depender de terceiros que não priorizam nossa região.
A Munsit mostra que podemos construir IA de classe mundial, a partir da região, para a região — usando talento local para resolver problemas locais. É um sinal claro de que a próxima onda de inovação de IA árabe virá de dentro.
Como você vê a Munsit evoluindo em futuras versões, e quais são as próximas fronteiras para a IA de voz árabe na CNTXT?
Você só terá que esperar e ver. O que posso dizer é que temos um novo conjunto de soluções de IA árabe em primeiro lugar no caminho — todas impulsionadas pela Munsit e outros modelos que estamos construindo atualmente na CNTXT AI. Isso é apenas o começo.
Você frequentemente fala sobre a importância da “IA soberana”. O que esse termo significa para você, e por que é crítico para o Golfo e a região mais ampla do MENA?
Para mim, IA soberana significa ter posse e controle total sobre os dados, infraestrutura e modelos que moldam nosso futuro. É crítico porque precisamos possuir nosso próprio destino, e isso começa com os dados.
A soberania de dados é tudo. Os dados são preciosos, e precisamos garantir que eles permaneçam em nossas mãos.
Nós não podemos nos dar ao luxo de entregar nosso futuro e ficar inativos enquanto outros constroem a tecnologia para nós. O futuro da IA nessa região virá dessa região. É exatamente para isso que estamos trabalhando.
Como você vê a CNTXT AI moldando o ecossistema de IA no Oriente Médio nos próximos cinco anos?
Habilitando a verdadeira preparação para IA. Nós entramos, entendemos o que as empresas e governos precisam, construímos as estratégias de dados e IA, e então ajudamos a construir, testar, implantar e escalar.
Se os dados são o novo petróleo, então os dados não estruturados são petróleo não refinado — cheio de potencial, mas inútil até processado. É por isso que construímos a CNTXT AI para ajudar as organizações a limpar, estruturar e ativar seus dados. Porque é aí que começa a transformação real da IA.
Do seu ponto de vista como empreendedor e investidor, que conselho você daria a outros fundadores que estão construindo startups de IA em mercados emergentes?
Comece agora. Mova-se rapidamente. Falhe rápido, aprenda mais rápido, e continue iterando.
O mais importante, construa para problemas reais. Fique perto do chão — ouça os usuários, não apenas o hype. Em mercados emergentes, relevância e adaptabilidade são fundamentais.
Obrigado pela grande entrevista, leitores que desejam aprender mais devem visitar CNTXT AI.












