Liity verkostomme!

Mohammad Abu Sheikh, CNTXT AI:n perustaja ja toimitusjohtaja – Haastattelusarja

Haastattelut

Mohammad Abu Sheikh, CNTXT AI:n perustaja ja toimitusjohtaja – Haastattelusarja

mm

Mohammad Abu Sheikh mullistaa tekoälymaisemaa Lähi-idässä ja Pohjois-Afrikassa ajaen siirtymistä passiivisesta kulutuksesta itsenäiseen innovointiin. CNTXT AI:n toimitusjohtajana ja 10 miljoonan dollarin tekoälyrahaston perustajana hän on johtanut kolmea onnistunutta exittiä ja varmistanut yli miljardin dollarin rahoituksen. Hänen työnsä luo perustan tekoälyekosysteemille, joka on juurtunut kieleen, kulttuuriin ja datasuvereniteettiin.

CNTXT-tekoäly on digitaalisen transformaation yritys, joka tarjoaa pilvi-infrastruktuuria, teollisuusohjelmistoja ja robotiikkaratkaisuja auttaakseen organisaatioita modernisoimaan toimintaansa ja hyödyntämään datalähtöisiä oivalluksia Lähi-idässä ja Pohjois-Afrikassa.

Mikä inspiroi sinua perustamaan CNTXT AI:n, ja miten visiosi itsenäisestä tekoälystä arabiankielisessä maailmassa sai alkunsa?

Näimme, kuinka paljon tässä päin maailmaa oli alihyödynnettyä dataa. Monet tekoälyn skaalaamisen ongelmat johtuivat datan valmiuden puutteesta – mikä lopulta tarkoitti tekoälyn valmiuden puutetta. Siksi aloitimme CNTXT AI:n.

Aluksi ratkaisimme samoja ongelmia, joita kohtasimme rakentaessamme LocAI:ta… Näimme nämä haasteet omin silmin työskennellessämme AI71:n, TII:n ja G42:n (IIAI) kanssa. Kun autoimme näitä toimijoita ratkaisemaan nämä ongelmat, visio kirkastui ja liiketoiminta vain kasvoi.

Olet ollut avainasemassa rakentamassa suurinta arabiankielistä digitaalista kirjastoa tekoälykoulutusta varten. Mitkä olivat suurimmat haasteet siinä ja miten selvisit niistä?

Laatu oli yksi suurimmista haasteista. Toinen oli korkealaatuisen arabiankielisen datan rajallinen saatavuus verkossa: arabia on pahasti aliedustettuna. Vain pieni osa arabiankielisestä sisällöstä on digitoitu, ja vain 3–5 % kaikesta verkkosisällöstä on arabiaksi. Se on lähes ei mitään. Ratkaisimme tämän ongelman ottamalla käyttöön datan merkitsejiä, annotoijia ja datatieteilijöitä digitalisoimaan, luomaan ja kuratoimaan dataa itse.

CNTXT AI toimii kulttuurin ja laskennan risteyskohdassa. Miten tasapainotat huippuluokan tekoälyinnovaation ja tavoitteen rakentaa kulttuurisesti relevantteja ratkaisuja Lähi-idän ja Pohjois-Afrikan alueelle?

Rakennamme kulttuurisesti perusteltuja malleja alusta alkaen. Infrastruktuurista lopputuotteeseen, kulttuuri on osa alusta asti – se ei ole jotain, mitä lisäämme myöhemmin. Suunnittelemme, innovoimme ja rakennamme pitäen mielessä tiettyjä kulttuureja, murteita ja tarpeita ensimmäisestä päivästä lähtien. Arabia on yksi kieli, mutta se sisältää monia murteita ja kulttuurikonteksteja koko alueella, joten rakennamme paikallisia tuotteita paikallisille maille. Ja teemme sen työskentelemällä paikallisten kommentaattoreiden, kentällä olevien ihmisten, kanssa heidän omissa maissaan.

Olet myös perustanut LocAI:n ja johdat SMPL AI Fundia. Miten nämä hankkeet täydentävät CNTXT AI:n missiota?

LocAI on sovelluskerros – se osa, jonka kanssa ihmiset ovat vuorovaikutuksessa. Se sijaitsee suoraan CNTXT AI:n rakentaman datan ja infrastruktuurin päällä. Juuri tämä teki siitä menestyksekkään: se muuntaa CNTXT AI:n tarjoamat tekoälyperustat ihmisten käyttämiksi reaalimaailman ratkaisuiksi.

SMPL AI puolestaan ​​keskittyy yhteisön tukemiseen. Se keskittyy sijoittamaan alkuvaiheen startup-yrityksiin ja auttamaan alueellisen tekoälyekosysteemin rakentamisessa. Jaamme työkaluja ja oppeja, joita olemme oppineet itse tekoälyn rakentamisesta, jotta perustajat voivat kasvaa nopeammin ja välttää yleisiä sudenkuoppia.

Munsitia on kutsuttu maailman tarkimmaksi arabiankieliseksi puheentunnistusmalliksi. Mikä vauhditti tämän mallin kehitystä ja miksi juuri nyt?

Tämän mallin kehittämisen taustalla oli yksinkertainen syy: tarve.

Rakennamme aina pakon sanelemana. Tarkastelimme markkinoita ja näimme, että tilanne oli kypsä – niin valtion virastot kuin yksityiset asiakkaatkin pyysivät tällaista ratkaisua.

Olemassa olevat mallit eivät yksinkertaisesti olleet tehtävän tasalla. Useimmat on rakennettu englanninkielisen teknologian pohjalta ja sitten mukautettu. Niitä ei ole suunniteltu arabiaksi alusta alkaen, eivätkä ne todellakaan ole tarkoitettu juuri niihin ongelmiin, joita ratkaisemme.

Niinpä päätimme rakentaa oman. Se on arabiaksi ensin – suunnittelun pohjalta.

Munsitin taustalla oleva tutkimus esittelee heikosti ohjatun oppimisen lähestymistavan. Voitko selittää, mitä se tarkoittaa ja miksi se oli olennaista arabiankielisen ASR:n laajamittaisessa kouluttamisessa?

Annotaatiot ovat kalliita. Siksi meidän oli siirryttävä perinteisistä menetelmistä, jotka perustuvat suuriin määriin manuaalista transkriptiota. Heikosti ohjattu oppiminen auttoi meitä skaalaamaan toimintaamme ilman, että jokaista äänitiedostoa tarvitsi nimetä käsin – mikä on erityisen tärkeää arabian kielellä, jolla on rajallisesti dataa ja monia eri murteita.

Ammattimaisesti litteroitujen äänitteiden sijaan aloitimme 30,000 15,000 tunnista nimeämätöntä arabiankielistä puhetta. Rakensimme annotaatioputken, joka luo, suodattaa ja puhdistaa parhaat annotaatiot automaattisten tarkistusten avulla. Tämä antoi meille korkealaatuisen XNUMX XNUMX tunnin tietojoukon – kaikki tämä ilman ihmisen tekemää litterointia.

Tämä lähestymistapa mahdollisti mallimme kouluttamisen tyhjästä, jolloin arabian kielen puhutun kielen rikkaus saatiin taltioitua todellisissa tilanteissa nopeasti ja kustannustehokkaasti. Ilman tätä menetelmää arabiankielisen ASR-järjestelmän rakentaminen tässä mittakaavassa olisi vienyt vuosia ja maksanut miljoonia manuaalisia ponnisteluja.

Munsit suoriutui useissa vertailuissa paremmin kuin OpenAI:n, Microsoftin ja Metan mallit. Mitä tämä saavutus kertoo arabialaisen tekoälyinnovaation tulevaisuudesta?

Arabialaisen tekoälyn tulevaisuus on omissa käsissämme, ja juuri sen tämä saavutus todistaa. Emme voi enää luottaa teknologioihin, joita emme omista, tai kolmansiin osapuoliin, jotka eivät priorisoi aluettamme.

Munsit osoittaa, että voimme rakentaa maailmanluokan tekoälyä alueelta käsin alueelle – hyödyntäen paikallisia kykyjä paikallisten ongelmien ratkaisemiseen. Se on selvä merkki siitä, että seuraava arabialaisen tekoälyn innovaatioaalto tulee sisältäpäin.

Miten näet Munsitin kehittyvän tulevissa versioissa, ja mitkä ovat arabiankielisen ääni-tekoälyn seuraavat rajaseudut CNTXT:llä?

Sinun täytyy vain odottaa ja katsoa. ​​Voin sanoa, että meillä on tulossa tuore, uusi arabialaistyylinen tekoälyratkaisujen sarja – kaikki Munsitin ja muiden CNTXT AI:lla parhaillaan rakentamiemme mallien pohjalta. Tämä on vasta alkua.

Puhut usein "suvereenin tekoälyn" tärkeydestä. Mitä tuo termi sinulle merkitsee, ja miksi se on kriittinen Persianlahdelle ja laajemmin Lähi-idän ja Pohjois-Afrikan alueelle?

Minulle suvereeni tekoäly tarkoittaa täyttä omistajuutta ja hallintaa dataan, infrastruktuuriin ja malleihin, jotka muokkaavat tulevaisuuttamme. Se on kriittistä, koska meidän on otettava vastuu omasta kohtalostamme, ja se alkaa datasta.

Tietosuvereniteetti on kaikki kaikessa. Data on arvokasta, ja meidän on varmistettava, että se pysyy käsissämme.

Meillä ei ole varaa luopua tulevaisuudestamme ja jäädä toimettomaksi, kun muut rakentavat teknologiaa puolestamme. Tämän alueen tekoälyn tulevaisuus tulee tästä alueesta. Juuri sitä kohti me työskentelemme.

Miten näet CNTXT-tekoälyn muokkaavan Lähi-idän tekoälyekosysteemiä seuraavien viiden vuoden aikana?

Mahdollistamalla todellisen tekoälyvalmiuden. Menemme paikan päälle, ymmärrämme yritysten ja hallitusten tarpeet, rakennamme data- ja tekoälystrategioita ja autamme niitä sitten rakentamaan, testaamaan, ottamaan käyttöön ja skaalaamaan.

Jos data on uusi öljy, niin strukturoimaton data on jalostamatonta öljyä – täynnä potentiaalia, mutta hyödytöntä ennen käsittelyä. Siksi olemme rakentaneet CNTXT-tekoälyn auttamaan organisaatioita datan puhdistamisessa, jäsentämisessä ja aktivoinnissa. Koska siitä todellinen tekoälyn muutos alkaa.

Mitä neuvoja antaisit sekä yrittäjän että sijoittajan näkökulmasta muille tekoälyyn perustuvien startup-yritysten perustajille kehittyvillä markkinoilla?

Aloita nyt. Toimi nopeasti. Epäonnistu nopeasti, opi nopeammin ja toista asioita.

Tärkeintä on rakentaa oikeita ongelmia varten. Pysy lähellä maanpintaa – kuuntele käyttäjiä, älä vain hypeä. Kehittyvillä markkinoilla merkityksellisyys ja sopeutumiskyky ovat avainasemassa.

Kiitos upeasta haastattelusta, lukijoiden, jotka haluavat tietää lisää, kannattaa käydä CNTXT-tekoäly.

Antoine on Unite.AI:n visionäärinen johtaja ja perustajakumppani, jota ohjaa horjumaton intohimo tekoälyn ja robotiikan tulevaisuuden muotoiluun ja edistämiseen. Sarjayrittäjänä hän uskoo, että tekoäly on yhtä tuhoisa yhteiskunnalle kuin sähkö, ja hänet jää usein raivoamaan häiritsevien teknologioiden ja AGI:n mahdollisuuksista.

Kuten futurist, hän on omistautunut tutkimaan, kuinka nämä innovaatiot muokkaavat maailmaamme. Lisäksi hän on perustaja Securities.io, foorumi, joka keskittyy investoimaan huipputeknologiaan, joka määrittelee uudelleen tulevaisuuden ja muokkaa kokonaisia ​​toimialoja.