Connect with us

Mohammad Abu Sheikh, Fundador y CEO de CNTXT AI – Serie de Entrevistas

Entrevistas

Mohammad Abu Sheikh, Fundador y CEO de CNTXT AI – Serie de Entrevistas

mm

Mohammad Abu Sheikh está transformando el panorama de la IA en la región de MENA, impulsando un cambio de un consumo pasivo a una innovación soberana. Como CEO de CNTXT AI y fundador de un fondo de IA de $10 millones, ha liderado tres salidas exitosas y ha asegurado más de mil millones de dólares en financiación. Su trabajo está sentando las bases para un ecosistema de IA arraigado en el lenguaje, la cultura y la soberanía de los datos.

CNTXT AI es una empresa de transformación digital que proporciona infraestructura en la nube, software industrial y soluciones de robótica para ayudar a las organizaciones a modernizar sus operaciones y desbloquear información basada en datos en todo el Medio Oriente y África del Norte.

¿Qué te inspiró a crear CNTXT AI, y cómo comenzó tu visión para la IA soberana en el mundo de habla árabe?

Vimos la abundancia de datos subutilizados en esta parte del mundo. Muchos problemas en la escalabilidad de la IA provinieron de la falta de preparación de los datos, lo que eventualmente significó una falta de preparación para la IA. Es por eso que creamos CNTXT AI.

Inicialmente, estábamos resolviendo los mismos problemas que enfrentamos mientras construíamos LocAI… Vimos estos desafíos de primera mano trabajando con AI71, TII y G42 (IIAI). A medida que ayudábamos a estas entidades a resolver esos problemas, la visión se volvió más clara y el negocio simplemente siguió creciendo.

Has jugado un papel clave en la creación de la biblioteca digital árabe más grande para el entrenamiento de la IA. ¿Cuáles fueron algunos de los mayores desafíos al hacerlo, y cómo los superaste?

La calidad fue uno de los mayores desafíos. Otro fue la limitada disponibilidad de datos de alta calidad en árabe en línea: el árabe está seriamente subrepresentado. Solo una pequeña parte del contenido en árabe ha sido digitalizada, y solo el 3-5% de todo el contenido en línea está en árabe. Eso es casi nada. Superamos ese problema desplegando etiquetadores de datos, anotadores y científicos de datos para digitalizar, crear y curar los datos nosotros mismos.

CNTXT AI opera en la intersección de la cultura y la computación. ¿Cómo equilibras la innovación de la IA de vanguardia con el objetivo de construir soluciones culturalmente relevantes para la región de MENA?

Construímos modelos culturalmente arraigados desde cero. Desde la infraestructura hasta el producto final, la cultura está incorporada desde el principio — no es algo que agreguemos más tarde. Diseñamos, innovamos y construimos con culturas, dialectos y necesidades específicas en mente desde el primer día. El árabe es un idioma, pero lleva muchos dialectos y contextos culturales en toda la región, así que construimos productos locales para países locales. Y lo hacemos trabajando con anotadores locales, personas en el terreno, en sus propios países.

También has cofundado LocAI y lideras el fondo de inversión SMPL AI. ¿Cómo complementan estas empresas la misión de CNTXT AI?

LocAI es la capa de aplicación — la parte con la que la gente realmente interactúa. Se encuentra justo encima de los datos y la infraestructura construidos por CNTXT AI. Eso es lo que la hizo exitosa: transforma los fundamentos de la IA proporcionados por CNTXT AI en soluciones del mundo real que la gente puede usar.

SMPL AI, por otro lado, se trata de devolver a la comunidad. Se centra en invertir en startups en etapas tempranas y ayudar a construir el ecosistema regional de la IA. Compartimos las herramientas y lecciones que hemos aprendido al construir la IA nosotros mismos, para que los fundadores puedan crecer más rápido y evitar obstáculos comunes.

Munsit ha sido llamado el modelo de reconocimiento de habla árabe más preciso del mundo. ¿Qué impulsó el desarrollo de este modelo, y por qué ahora?

Lo que impulsó el desarrollo de este modelo fue simple: la necesidad.

Siempre construimos por necesidad. Miramos el mercado y vimos que el panorama estaba maduro — las agencias gubernamentales y los clientes privados todos estaban pidiendo una solución como esta.

Los modelos existentes simplemente no estaban a la altura de la tarea. La mayoría están construidos sobre tecnología en inglés y luego adaptados. No están diseñados para el árabe desde cero, y definitivamente no para los problemas específicos que estamos resolviendo.

Así que decidimos construir el nuestro. Está diseñado para el árabe desde cero.

La investigación detrás de Munsit introduce un enfoque de aprendizaje supervisado débil. ¿Puedes explicar qué significa eso y por qué fue esencial para entrenar el ASR árabe a gran escala?

La anotación es costosa. Así que tuvimos que ir más allá de los métodos tradicionales que dependen de grandes cantidades de transcripción manual. El aprendizaje supervisado débil nos ayudó a escalar sin tener que etiquetar cada archivo de audio a mano — lo que es especialmente importante para el árabe, un idioma con datos limitados y muchos dialectos diferentes.

En lugar de usar audio transcritado profesionalmente, comenzamos con 30,000 horas de habla árabe no etiquetada. Construimos una tubería de anotación que genera, filtra y limpia las mejores opciones utilizando controles automatizados. Esto nos dio un conjunto de datos de alta calidad de 15,000 horas — todo sin transcripción humana.

Este enfoque hizo posible entrenar nuestro modelo desde cero, capturando la riqueza del árabe hablado en situaciones de la vida real, de manera rápida y rentable. Sin este método, construir un sistema de ASR árabe a esta escala habría tomado años y millones en esfuerzo manual.

Munsit superó a los modelos de OpenAI, Microsoft y Meta en varias pruebas. ¿Qué dice este logro sobre el futuro de la innovación de la IA árabe?

El futuro de la IA árabe está en nuestras manos; y eso es exactamente lo que este logro demuestra. Ya no podemos permitirnos depender de tecnologías que no poseemos o depender de terceros que no priorizan nuestra región.

Munsit muestra que podemos construir una IA de clase mundial, desde la región, para la región — utilizando talento local para resolver problemas locales. Es una señal clara de que la próxima ola de innovación de la IA árabe vendrá de dentro.

¿Cómo ves que Munsit evolucione en versiones futuras, y cuáles son las próximas fronteras para la IA de voz árabe en CNTXT?

Solo tendrás que esperar y ver. Lo que puedo decir es que tenemos una nueva suite de soluciones de IA árabe en camino — todas impulsadas por Munsit y otros modelos que actualmente estamos construyendo en CNTXT AI. Esto es solo el comienzo.

A menudo hablas sobre la importancia de la “IA soberana”. ¿Qué significa este término para ti, y por qué es crítico para el Golfo y la región más amplia de MENA?

Para mí, la IA soberana significa tener el control total y la propiedad sobre los datos, la infraestructura y los modelos que dan forma a nuestro futuro. Es crítico porque necesitamos poseer nuestro propio destino, y eso comienza con los datos.

La soberanía de los datos es todo. Los datos son preciados, y debemos asegurarnos de que permanezcan en nuestras manos.

No podemos permitirnos entregar nuestro futuro y sentarnos inactivos mientras otros construyen la tecnología para nosotros. El futuro de la IA en esta región vendrá de esta región. Eso es exactamente hacia lo que estamos trabajando.

¿Cómo ves que CNTXT AI dé forma al ecosistema de la IA en Medio Oriente en los próximos cinco años?

Al permitir una verdadera preparación para la IA. Entramos, entendemos lo que las empresas y los gobiernos necesitan, construimos las estrategias de datos y la IA, y luego los ayudamos a construir, probar, implementar y escalar.

Si los datos son el nuevo petróleo, entonces los datos no estructurados son petróleo sin refinar — llenos de potencial pero inútiles hasta que se procesan. Es por eso que hemos construido CNTXT AI para ayudar a las organizaciones a limpiar, estructurar y activar sus datos. Porque ahí es donde comienza la verdadera transformación de la IA.

Desde tu perspectiva como emprendedor y inversionista, ¿qué consejo le darías a otros fundadores que están construyendo startups de IA en mercados emergentes?

Comienza ahora. Muévete rápido. Falla rápido, aprende más rápido y sigue iterando.

Lo más importante, construye para problemas reales. Mantente cerca del suelo — escucha a los usuarios, no solo el hype. En los mercados emergentes, la relevancia y la adaptabilidad son clave.

Gracias por la gran entrevista, los lectores que deseen aprender más pueden visitar CNTXT AI.

Antoine es un líder visionario y socio fundador de Unite.AI, impulsado por una pasión inquebrantable por dar forma y promover el futuro de la IA y la robótica. Un empresario serial, cree que la IA será tan disruptiva para la sociedad como la electricidad, y a menudo se le escucha hablando con entusiasmo sobre el potencial de las tecnologías disruptivas y la AGI. Como un futurista, está dedicado a explorar cómo estas innovaciones darán forma a nuestro mundo. Además, es el fundador de Securities.io, una plataforma enfocada en invertir en tecnologías de vanguardia que están redefiniendo el futuro y remodelando sectores enteros.