Connect with us

Mohammad Abu Sheikh, Fondator & CEO al CNTXT AI – Seria de interviuri

Interviuri

Mohammad Abu Sheikh, Fondator & CEO al CNTXT AI – Seria de interviuri

mm

Mohammad Abu Sheikh este în proces de transformare a peisajului AI în regiunea MENA, determinând o schimbare de la consumul pasiv la inovarea suverană. Ca CEO al CNTXT AI și fondator al unui fond de inteligență artificială în valoare de 10 milioane de dolari, el a condus trei ieșiri de succes și a obținut peste un miliard de dolari în finanțare. Lucrarea sa pune bazele unui ecosistem de inteligență artificială înrădăcinat în limbă, cultură și suveranitatea datelor.

CNTXT AI este o companie de transformare digitală care oferă infrastructură de cloud, software industrial și soluții de robotică pentru a ajuta organizațiile să modernizeze operațiunile și să deblocheze insight-uri bazate pe date în întreaga regiune a Orientului Mijlociu și Africii de Nord.

Ce v-a inspirat să înființați CNTXT AI și cum a început viziunea dvs. pentru inteligența artificială suverană în lumea arabă?

Am văzut abundența de date subutilizate în această parte a lumii. Multe dintre problemele de scalare a inteligenței artificiale proveneau din lipsa de pregătire a datelor — ceea ce a însemnat, în cele din urmă, o lipsă de pregătire pentru inteligența artificială. De aceea am început CNTXT AI.

Inițial, am rezolvat aceleași probleme cu care ne-am confruntat atunci când am construit LocAI… Am văzut aceste provocări din primă mână, lucrând cu AI71, TII și G42 (IIAI). Pe măsură ce i-am ajutat pe acești entități să rezolve aceste probleme, viziunea a devenit mai clară și afacerea a continuat să crească.

Ați jucat un rol cheie în construirea celei mai mari biblioteci digitale arabe pentru antrenarea inteligenței artificiale. Care au fost unele dintre cele mai mari provocări în realizarea acestui lucru și cum le-ați depășit?

Calitatea a fost una dintre cele mai mari provocări. O altă provocare a fost disponibilitatea limitată a datelor de înaltă calitate în limba arabă: limba arabă este serios subreprezentată. Doar o mică parte a conținutului în limba arabă a fost digitalizat, și doar 3–5% din conținutul online este în arabă. Acest lucru este aproape nimic. Am depășit această problemă prin implementarea etichetatorilor de date, annotatorilor și oamenilor de știință pentru a digitaliza, crea și cura datele în mod propriu.

CNTXT AI operează la intersecția dintre cultură și calcul. Cum echilibrați inovația de inteligență artificială de ultimă generație cu obiectivul de a construi soluții relevante din punct de vedere cultural pentru regiunea MENA?

Construirea modelelor cu baza în cultură de la zero. De la infrastructură la produsul final, cultura este încorporată din start — nu este ceva pe care îl adăugăm mai târziu. Proiectăm, inovăm și construim, având în vedere culturi, dialecte și nevoi specifice, de la început. Limba arabă este o singură limbă, dar cuprinde multe dialecte și contexte culturale în întreaga regiune, așa că construim produse locale pentru țări locale. Și facem acest lucru prin colaborarea cu annotatori locali, oameni pe teren, în țările lor.

Ați co-fondat, de asemenea, LocAI și conduceți fondul SMPL AI. Cum se completează aceste întreprinderi cu misiunea CNTXT AI?

LocAI este stratul de aplicație — partea cu care oamenii interacționează în realitate. Se situează direct deasupra datelor și infrastructurii construite de CNTXT AI. Acesta este motivul pentru care a fost de succes: transformă fundațiile de inteligență artificială oferite de CNTXT AI în soluții din lumea reală pe care oamenii le pot utiliza.

SMPL AI, pe de altă parte, se concentrează pe a da înapoi comunității. Se axează pe investiții în startup-uri de stadiu incipient și pe ajutarea la construirea ecosistemului regional de inteligență artificială. Împărtășim instrumentele și lecțiile pe care le-am învățat din construirea noastră de inteligență artificială, astfel încât fondatorii să poată crește mai repede și să evite capcanele comune.

Munsit a fost numit cel mai precis model de recunoaștere a vorbirii arabe din lume. Ce a determinat dezvoltarea acestui model și de ce acum?

Ceea ce a determinat dezvoltarea acestui model a fost nevoia.

Întotdeauna construim din nevoie. Am examinat piața și am văzut că peisajul era copt — agențiile guvernamentale și clienții privați cereau toți o soluție de acest fel.

Modelele existente nu erau la înălțime. Majoritatea au fost create pe baza tehnologiei engleze și apoi adaptate. Nu au fost proiectate pentru limba arabă de la zero și, cu siguranță, nu pentru problemele pe care le rezolvăm.

Așa că am decis să construim propriul nostru model. Este arabă de la început — prin design.

Cercetarea din spatele lui Munsit introduce o abordare de învățare slab supravegheată. Puteți explica ce înseamnă acest lucru și de ce a fost esențial pentru antrenarea recunoașterii vorbirii arabe la scară largă?

Etichetarea este scumpă. Așa că am trebuit să mergem dincolo de metodele tradiționale care depind de cantități mari de transcriere manuală. Învățarea slab supravegheată ne-a ajutat să scalăm fără a trebui să etichetăm fiecare fișier audio manual — ceea ce este mai ales important pentru limba arabă, o limbă cu date limitate și multe dialecte diferite.

În loc să utilizăm fișiere audio transcrise profesional, am început cu 30.000 de ore de vorbire arabă neetichetate. Am construit o conductă de etichetare care generează, filtrează și curăță cele mai bune utilizând verificări automate. Acest lucru ne-a oferit un set de date de înaltă calitate de 15.000 de ore — totul fără transcriere umană.

Acestă abordare a făcut posibilă antrenarea modelului nostru de la zero, capturând bogăția vorbirii arabe în situații reale din viață, rapid și eficient din punct de vedere al costurilor. Fără această metodă, construirea unui sistem de recunoaștere a vorbirii arabe la această scară ar fi durat ani și milioane de dolari în efort manual.

Munsit a depășit modelele de la OpenAI, Microsoft și Meta în mai multe benchmark-uri. Ce spune acest realizare despre viitorul inovației arabe de inteligență artificială?

Viitorul inteligenței artificiale arabe este în mâinile noastre; și acesta este exact ceea ce demonstrează acest realizare. Nu ne mai putem permite să ne bazăm pe tehnologii pe care nu le deținem sau să depindem de terți care nu prioritizează regiunea noastră.

Munsit demonstrează că putem construi inteligență artificială de clasă mondială, din regiune, pentru regiune — utilizând talentul local pentru a rezolva probleme locale. Este un semnal clar că următura de inovație a inteligenței artificiale arabe va veni din interior.

Cum vedeți evoluția lui Munsit în versiunile viitoare și care sunt următoarele frontiere pentru inteligența artificială vocală arabă la CNTXT?

Trebuie să așteptați și să vedeți. Ceea ce pot spune este că avem un nou set de soluții de inteligență artificială cu caracter arab, pe cale să fie lansate — toate alimentate de Munsit și de alte modele pe care le construim în prezent la CNTXT AI. Acesta este doar începutul.

Adesea vorbiți despre importanța “inteligenței artificiale suverane”. Ce înseamnă acest termen pentru dvs. și de ce este critic pentru Golf și regiunea MENA mai largă?

Pentru mine, inteligența artificială suverană înseamnă a avea deplină proprietate și control asupra datelor, infrastructurii și modelelor care ne conturează viitorul. Este critică pentru că avem nevoie să ne deținem propriul nostru destin, și acest lucru începe cu datele.

Suveranitatea datelor este totul. Datele sunt prețioase, și trebuie să ne asigurăm că rămân în mâinile noastre.

Nu ne putem permite să cedăm viitorul nostru și să stăm inactivi în timp ce alții construiesc tehnologia pentru noi. Viitorul inteligenței artificiale în această regiune va veni din această regiune. Acesta este exact ceea ce lucrăm pentru a-l realiza.

Cum vedeți CNTXT AI modelând ecosistemul de inteligență artificială din Orientul Mijlociu în următorii cinci ani?

Prin facilitarea adevăratei pregătiri pentru inteligența artificială. Intrăm, înțelegem ce au nevoie companiile și guvernele, construim strategiile de date și inteligență artificială, și apoi îi ajutăm să construiască, să testeze, să implementeze și să scaleze.

Dacă datele sunt noul petrol, atunci datele nestructurate sunt petrol nefinisat — plin de potențial, dar inutilizabil până când sunt prelucrate. De aceea am construit CNTXT AI pentru a ajuta organizațiile să curățe, să structureze și să activeze datele lor. Pentru că acolo începe adevărata transformare a inteligenței artificiale.

Din perspectiva dvs. ca antreprenor și investitor, ce sfat ați da altor fondatori care construiesc startup-uri de inteligență artificială pe piețe emergente?

Începeți acum. Mișcați-vă rapid. Eșuați repede, învățați și mai repede, și continuați să iterați.

Cel mai important, construiți pentru probleme reale. Rămâneți aproape de realitate — ascultați utilizatorii, nu doar hype-ul. În piețele emergente, relevanța și adaptabilitatea sunt cheia.

Mulțumim pentru acest interviu minunat, cititorilor care doresc să afle mai multe despre CNTXT AI.

Antoine este un lider vizionar și partener fondator al Unite.AI, condus de o pasiune neclintita pentru a da forma și a promova viitorul inteligenței artificiale și al roboticii. Un antreprenor serial, el crede că inteligența artificială va fi la fel de disruptivă pentru societate ca și electricitatea, și este adesea prins vorbind cu entuziasm despre potențialul tehnologiilor disruptive și al inteligenței artificiale generale.

Ca futurist, el este dedicat explorării modului în care aceste inovații vor modela lumea noastră. În plus, el este fondatorul Securities.io, o platformă axată pe investiții în tehnologii de ultimă generație care redefinesc viitorul și reshapă întregi sectoare.