Seguici sui social

interviste

Mohammad Abu Sheikh, fondatore e CEO di CNTXT AI – Serie di interviste

mm

Mohammad Abu Sheikh sta trasformando il panorama dell'IA nella regione MENA, guidando il passaggio dal consumo passivo all'innovazione sovrana. Come CEO di CNTXT AI e fondatore di un fondo di IA da 10 milioni di dollari, ha guidato con successo tre exit e ottenuto finanziamenti per oltre un miliardo di dollari. Il suo lavoro sta gettando le basi per un ecosistema di IA radicato nel linguaggio, nella cultura e nella sovranità dei dati.

CNTXT AI è un'azienda di trasformazione digitale che fornisce infrastrutture cloud, software industriali e soluzioni robotiche per aiutare le organizzazioni a modernizzare le operazioni e a sbloccare informazioni basate sui dati in Medio Oriente e Nord Africa.

Cosa ti ha ispirato a fondare CNTXT AI e come è nata la tua visione di un'intelligenza artificiale sovrana nel mondo arabo?

Abbiamo constatato l'abbondanza di dati sottoutilizzati in questa parte del mondo. Molti problemi nell'implementazione su larga scala dell'IA derivavano dalla mancanza di preparazione dei dati, che alla fine si è tradotta in una mancanza di preparazione dell'IA. Ecco perché abbiamo avviato CNTXT AI.

Inizialmente, stavamo risolvendo gli stessi problemi che avevamo incontrato durante la creazione di LocAI... Abbiamo visto queste sfide in prima persona lavorando con AI71, TII e G42 (IIAI). Aiutando queste realtà a risolvere questi problemi, la visione si è fatta più chiara e l'attività ha continuato a crescere.

Hai svolto un ruolo chiave nella creazione della più grande biblioteca digitale araba per la formazione sull'intelligenza artificiale. Quali sono state le sfide più grandi e come le hai superate?

La qualità è stata una delle sfide più grandi. Un'altra era la limitata disponibilità di dati arabi di alta qualità online: l'arabo è gravemente sottorappresentato. Solo una piccola parte dei contenuti in lingua araba è stata digitalizzata e solo il 3-5% di tutti i contenuti online è in arabo. È praticamente nulla. Abbiamo superato questo problema impiegando etichettatori di dati, annotatori e data scientist per digitalizzare, creare e curare i dati in prima persona.

L'intelligenza artificiale di CNTXT opera all'intersezione tra cultura e informatica. Come si concilia l'innovazione all'avanguardia dell'intelligenza artificiale con l'obiettivo di creare soluzioni culturalmente rilevanti per la regione MENA?

Costruiamo modelli culturalmente radicati fin dalle fondamenta. Dall'infrastruttura al prodotto finale, la cultura è radicata fin dall'inizio, non è qualcosa che aggiungiamo in un secondo momento. Progettiamo, innoviamo e realizziamo tenendo conto di culture, dialetti ed esigenze specifiche fin dal primo giorno. L'arabo è una lingua, ma porta con sé molti dialetti e contesti culturali in tutta la regione, quindi creiamo prodotti locali per i paesi locali. E lo facciamo collaborando con annotatori locali, persone sul campo, nei loro paesi.

Hai anche co-fondato LocAI e guidato lo SMPL AI Fund. In che modo queste iniziative integrano la missione di CNTXT AI?

LocAI è il livello applicativo, ovvero la parte con cui le persone interagiscono effettivamente. Si basa sui dati e sull'infrastruttura creati da CNTXT AI. Questo è ciò che ne ha decretato il successo: trasforma le basi dell'intelligenza artificiale fornite da CNTXT AI in soluzioni concrete che le persone possono utilizzare.

SMPL AI, d'altra parte, si concentra sul dare qualcosa in cambio alla comunità. Si concentra sull'investimento in startup in fase iniziale e sul contributo alla costruzione dell'ecosistema regionale dell'intelligenza artificiale. Condividiamo gli strumenti e le lezioni che abbiamo imparato sviluppando noi stessi l'intelligenza artificiale, in modo che i fondatori possano crescere più velocemente ed evitare le insidie ​​più comuni.

Munsit è stato definito il modello di riconoscimento vocale arabo più accurato al mondo. Cosa ha spinto allo sviluppo di questo modello e perché proprio ora?

Ciò che ha spinto allo sviluppo di questo modello è stato semplice: la necessità.

Costruiamo sempre per necessità. Abbiamo analizzato il mercato e abbiamo visto che il panorama era maturo: enti governativi e clienti privati ​​chiedevano tutti una soluzione come questa.

I modelli esistenti non erano all'altezza del compito. La maggior parte si basa sulla tecnologia inglese e poi è stata adattata. Non sono stati progettati da zero per l'arabo, e sicuramente non per i problemi specifici che stiamo risolvendo.

Così abbiamo deciso di costruirne uno nostro. È arabo innanzitutto, per definizione.

La ricerca alla base di Munsit introduce un approccio di apprendimento debolmente supervisionato. Puoi spiegare cosa significa e perché è stato essenziale per l'addestramento dell'ASR in arabo su larga scala?

L'annotazione è costosa. Quindi abbiamo dovuto andare oltre i metodi tradizionali che dipendono da grandi quantità di trascrizione manuale. L'apprendimento con supervisione debole ci ha aiutato a scalare senza dover etichettare manualmente ogni file audio, il che è particolarmente importante per l'arabo, una lingua con dati limitati e molti dialetti diversi.

Invece di utilizzare audio trascritto professionalmente, siamo partiti da 30,000 ore di parlato arabo non etichettato. Abbiamo creato una pipeline di annotazione che genera, filtra e pulisce le migliori utilizzando controlli automatici. Questo ci ha fornito un dataset di 15,000 ore di alta qualità, il tutto senza trascrizione umana.

Questo approccio ha permesso di addestrare il nostro modello da zero, catturando la ricchezza dell'arabo parlato in situazioni di vita reale, in modo rapido ed economico. Senza questo metodo, la creazione di un sistema ASR arabo di questa portata avrebbe richiesto anni e milioni di sforzi manuali.

Munsit ha superato i modelli di OpenAI, Microsoft e Meta in diversi benchmark. Cosa ci dice questo risultato sul futuro dell'innovazione dell'intelligenza artificiale in arabo?

Il futuro dell'intelligenza artificiale araba è nelle nostre mani; ed è esattamente ciò che dimostra questo risultato. Non possiamo più permetterci di affidarci a tecnologie che non possediamo o di dipendere da terze parti che non danno priorità alla nostra regione.

Munsit dimostra che possiamo costruire un'intelligenza artificiale di livello mondiale, a partire dalla regione e per la regione, utilizzando i talenti locali per risolvere i problemi locali. È un chiaro segnale che la prossima ondata di innovazione nell'intelligenza artificiale in Arabia Saudita verrà dall'interno.

Come pensi che evolverà Munsit nelle versioni future e quali sono le prossime frontiere dell'intelligenza artificiale vocale araba presso CNTXT?

Non vi resta che aspettare e vedere. Quello che posso dire è che abbiamo in arrivo una nuova suite di soluzioni di intelligenza artificiale incentrate sulla lingua araba, tutte basate su Munsit e altri modelli che stiamo sviluppando presso CNTXT AI. Questo è solo l'inizio.

Lei parla spesso dell'importanza dell'"IA sovrana". Cosa significa per lei questo termine e perché è fondamentale per la regione del Golfo e, più in generale, per la regione MENA?

Per me, l'intelligenza artificiale sovrana significa avere piena proprietà e controllo sui dati, sulle infrastrutture e sui modelli che plasmano il nostro futuro. È fondamentale perché dobbiamo essere padroni del nostro destino, e questo inizia dai dati.

La sovranità dei dati è fondamentale. I dati sono preziosi e dobbiamo assicurarci che rimangano nelle nostre mani.

Non possiamo permetterci di cedere il nostro futuro e di restare inerti mentre altri costruiscono la tecnologia per noi. Il futuro dell'intelligenza artificiale in questa regione verrà da questa regione. È esattamente ciò per cui stiamo lavorando.

Come pensi che CNTXT AI influenzerà l'ecosistema dell'intelligenza artificiale in Medio Oriente nei prossimi cinque anni?

Abilitando una vera preparazione all'IA. Entriamo in azione, comprendiamo le esigenze di aziende e governi, sviluppiamo i dati e le strategie di IA e poi li aiutiamo a costruire, testare, implementare e scalare.

Se i dati sono il nuovo petrolio, allora i dati non strutturati sono petrolio non raffinato, pieno di potenziale ma inutile finché non viene elaborato. Ecco perché abbiamo creato CNTXT AI per aiutare le organizzazioni a pulire, strutturare e attivare i propri dati. Perché è da lì che inizia la vera trasformazione dell'IA.

Dal tuo punto di vista di imprenditore e investitore, quale consiglio daresti ad altri fondatori che vogliono creare startup di intelligenza artificiale nei mercati emergenti?

Inizia ora. Muoviti rapidamente. Fallisci in fretta, impara più velocemente e continua a ripetere.

Soprattutto, costruisci per problemi reali. Rimani con i piedi per terra: ascolta gli utenti, non solo le aspettative. Nei mercati emergenti, pertinenza e adattabilità sono fondamentali.

Grazie per l'ottima intervista, i lettori che desiderano saperne di più dovrebbero visitare CNTXT AI.

Antoine è un leader visionario e socio fondatore di Unite.AI, spinto da una passione incrollabile per la definizione e la promozione del futuro dell'intelligenza artificiale e della robotica. Imprenditore seriale, ritiene che l'intelligenza artificiale sarà dirompente per la società quanto l'elettricità, e spesso viene colto a delirare sul potenziale delle tecnologie dirompenti e dell'AGI.

Come futurista, si dedica a esplorare come queste innovazioni plasmeranno il nostro mondo. Inoltre, è il fondatore di Titoli.io, una piattaforma focalizzata sugli investimenti in tecnologie all'avanguardia che stanno ridefinendo il futuro e rimodellando interi settori.