Connect with us

Mohammad Abu Sheikh, Fundador & CEO da CNTXT AI – Série de Entrevistas

Entrevistas

Mohammad Abu Sheikh, Fundador & CEO da CNTXT AI – Série de Entrevistas

mm

Mohammad Abu Sheikh está transformando o cenário de IA na região do MENA, impulsionando uma mudança de consumo passivo para inovação soberana. Como CEO da CNTXT AI e fundador de um fundo de IA de US$ 10 milhões, ele liderou três saídas bem-sucedidas e garantiram mais de um bilhão de dólares em financiamento. Seu trabalho está criando as bases para um ecossistema de IA enraizado em linguagem, cultura e soberania de dados.

CNTXT AI é uma empresa de transformação digital que fornece infraestrutura de nuvem, software industrial e soluções de robótica para ajudar as organizações a modernizar as operações e desbloquear insights baseados em dados em todo o Oriente Médio e África do Norte.

O que o inspirou a criar a CNTXT AI, e como sua visão para IA soberana no mundo de língua árabe começou?

Nós vimos a abundância de dados subutilizados nesta parte do mundo. Muitos problemas na escalabilidade da IA vieram da falta de preparação de dados — o que eventualmente significava uma falta de preparação para IA. Foi por isso que começamos a CNTXT AI.

Inicialmente, estávamos resolvendo os mesmos problemas que enfrentamos enquanto construíamos o LocAI… Nós vimos esses desafios em primeira mão trabalhando com AI71, TII e G42 (IIAI). À medida que ajudávamos essas entidades a resolver esses problemas, a visão ficou mais clara e o negócio simplesmente continuou crescendo.

Você desempenhou um papel fundamental na criação da maior biblioteca digital árabe para treinamento de IA. Quais foram alguns dos maiores desafios ao fazer isso, e como você os superou?

A qualidade foi um dos maiores desafios. Outro foi a limitada disponibilidade de dados de alta qualidade em árabe online: o árabe está seriamente subrepresentado. Apenas uma pequena porcentagem do conteúdo em língua árabe foi digitalizado, e apenas 3–5% de todo o conteúdo online está em árabe. Isso é quase nada. Superamos esse problema implantando rotuladores de dados, anotadores e cientistas de dados para digitalizar, criar e curar os dados nós mesmos.

A CNTXT AI opera na interseção da cultura e do cálculo. Como você equilibra a inovação de IA de ponta com o objetivo de construir soluções culturalmente relevantes para a região do MENA?

Nós construímos modelos fundamentados na cultura desde o início. Desde a infraestrutura até o produto final, a cultura está incorporada desde o início — não é algo que adicionamos mais tarde. Nós projetamos, inovamos e construímos com culturas, dialetos e necessidades específicas em mente desde o dia um. O árabe é uma língua, mas carrega muitos dialetos e contextos culturais em toda a região, então construímos produtos locais para países locais. E fazemos isso trabalhando com anotadores locais, pessoas no local, em seus próprios países.

Você também co-fundou a LocAI e lidera o Fundo de IA SMPL. Como essas ventures complementam a missão da CNTXT AI?

A LocAI é a camada de aplicação — a parte com a qual as pessoas realmente interagem. Ela está diretamente sobre os dados e infraestrutura construídos pela CNTXT AI. Foi isso que a tornou bem-sucedida: ela transforma as fundações de IA fornecidas pela CNTXT AI em soluções do mundo real que as pessoas podem usar.

A SMPL AI, por outro lado, é sobre devolver à comunidade. Ela se concentra em investir em startups de estágio inicial e ajudar a construir o ecossistema regional de IA. Nós compartilhamos as ferramentas e lições que aprendemos ao construir a IA nós mesmos, para que os fundadores possam crescer mais rápido e evitar armadilhas comuns.

A Munsit foi chamada de o modelo de reconhecimento de fala árabe mais preciso do mundo. O que impulsionou o desenvolvimento desse modelo, e por quê agora?

O que impulsionou o desenvolvimento desse modelo foi simples: a necessidade.

Nós sempre construímos por necessidade. Nós olhamos para o mercado e vimos que o cenário estava maduro — agências governamentais e clientes privados estavam todos pedindo por uma solução como essa.

Os modelos existentes simplesmente não estavam à altura da tarefa. A maioria é construída com tecnologia em inglês e adaptada posteriormente. Eles não são projetados para árabe desde o início, e definitivamente não para os problemas específicos que estamos resolvendo.

Então, decidimos construir o nosso próprio. É árabe em primeiro lugar — por design.

A pesquisa por trás da Munsit introduz uma abordagem de aprendizado supervisionado fraco. Você pode explicar o que isso significa e por que foi essencial para treinar ASR árabe em escala?

A anotação é cara. Então, tivemos que ir além dos métodos tradicionais que dependem de grandes quantidades de transcrição manual. O aprendizado supervisionado fraco nos ajudou a escalar sem ter que rotular cada arquivo de áudio à mão — o que é especialmente importante para o árabe, uma língua com dados limitados e muitos dialetos diferentes.

Em vez de usar áudio transcrito profissionalmente, começamos com 30.000 horas de fala árabe não rotulada. Nós construímos um pipeline de anotação que gera, filtra e limpa os melhores usando verificações automatizadas. Isso nos deu um conjunto de dados de alta qualidade de 15.000 horas — tudo sem transcrição humana.

Essa abordagem tornou possível treinar nosso modelo do zero, capturando a riqueza da fala árabe em situações da vida real, rapidamente e de forma rentável. Sem esse método, construir um sistema de ASR árabe nessa escala teria levado anos e milhões em esforço manual.

A Munsit superou os modelos da OpenAI, Microsoft e Meta em várias benchmarks. O que esse feito diz sobre o futuro da inovação de IA árabe?

O futuro da IA árabe está em nossas mãos; e é exatamente o que esse feito prova. Nós não podemos mais nos dar ao luxo de depender de tecnologias que não possuímos ou depender de terceiros que não priorizam nossa região.

A Munsit mostra que podemos construir IA de classe mundial, a partir da região, para a região — usando talento local para resolver problemas locais. É um sinal claro de que a próxima onda de inovação de IA árabe virá de dentro.

Como você vê a Munsit evoluindo em futuras versões, e quais são as próximas fronteiras para a IA de voz árabe na CNTXT?

Você só terá que esperar e ver. O que posso dizer é que temos um novo conjunto de soluções de IA árabe em primeiro lugar no caminho — todas impulsionadas pela Munsit e outros modelos que estamos construindo atualmente na CNTXT AI. Isso é apenas o começo.

Você frequentemente fala sobre a importância da “IA soberana”. O que esse termo significa para você, e por que é crítico para o Golfo e a região mais ampla do MENA?

Para mim, IA soberana significa ter posse e controle total sobre os dados, infraestrutura e modelos que moldam nosso futuro. É crítico porque precisamos possuir nosso próprio destino, e isso começa com os dados.

A soberania de dados é tudo. Os dados são preciosos, e precisamos garantir que eles permaneçam em nossas mãos.

Nós não podemos nos dar ao luxo de entregar nosso futuro e ficar inativos enquanto outros constroem a tecnologia para nós. O futuro da IA nessa região virá dessa região. É exatamente para isso que estamos trabalhando.

Como você vê a CNTXT AI moldando o ecossistema de IA no Oriente Médio nos próximos cinco anos?

Habilitando a verdadeira preparação para IA. Nós entramos, entendemos o que as empresas e governos precisam, construímos as estratégias de dados e IA, e então ajudamos a construir, testar, implantar e escalar.

Se os dados são o novo petróleo, então os dados não estruturados são petróleo não refinado — cheio de potencial, mas inútil até processado. É por isso que construímos a CNTXT AI para ajudar as organizações a limpar, estruturar e ativar seus dados. Porque é aí que começa a transformação real da IA.

Do seu ponto de vista como empreendedor e investidor, que conselho você daria a outros fundadores que estão construindo startups de IA em mercados emergentes?

Comece agora. Mova-se rapidamente. Falhe rápido, aprenda mais rápido, e continue iterando.

O mais importante, construa para problemas reais. Fique perto do chão — ouça os usuários, não apenas o hype. Em mercados emergentes, relevância e adaptabilidade são fundamentais.

Obrigado pela grande entrevista, leitores que desejam aprender mais devem visitar CNTXT AI.

Antoine é um líder visionário e sócio-fundador da Unite.AI, impulsionado por uma paixão inabalável em moldar e promover o futuro da IA e da robótica. Um empreendedor serial, ele acredita que a IA será tão disruptiva para a sociedade quanto a eletricidade, e é frequentemente pego falando sobre o potencial das tecnologias disruptivas e da AGI. Como um futurista, ele está dedicado a explorar como essas inovações moldarão nosso mundo. Além disso, ele é o fundador da Securities.io, uma plataforma focada em investir em tecnologias de ponta que estão redefinindo o futuro e remodelando setores inteiros.