Kontakt z nami

Wywiady

Mohammad Abu Sheikh, założyciel i dyrektor generalny CNTXT AI – seria wywiadów

mm

Mohammed Abu Sheikh zmienia krajobraz AI w regionie MENA, napędzając przejście od pasywnej konsumpcji do suwerennej innowacji. Jako dyrektor generalny CNTXT AI i założyciel funduszu AI o wartości 10 milionów dolarów, poprowadził trzy udane wyjścia i zabezpieczył ponad miliard dolarów finansowania. Jego praca kładzie podwaliny pod ekosystem AI zakorzeniony w języku, kulturze i suwerenności danych.

CNTXT-AI jest firmą zajmującą się transformacją cyfrową, która dostarcza infrastrukturę chmurową, oprogramowanie przemysłowe i rozwiązania z zakresu robotyki, aby pomóc organizacjom unowocześnić działalność i uzyskać informacje oparte na danych w regionie Bliskiego Wschodu i Afryki Północnej.

Co zainspirowało Cię do założenia CNTXT AI i jak narodziła się Twoja wizja suwerennej sztucznej inteligencji w krajach arabskojęzycznych?

Widzieliśmy mnóstwo niewykorzystanych danych w tej części świata. Wiele problemów ze skalowaniem AI wynikało z braku gotowości danych — co ostatecznie oznaczało brak gotowości AI. Dlatego zaczęliśmy CNTXT AI.

Początkowo rozwiązywaliśmy te same problemy, z którymi mieliśmy do czynienia podczas tworzenia LocAI… Widzieliśmy te wyzwania na własne oczy, pracując z AI71, TII i G42 (IIAI). W miarę jak pomagaliśmy tym podmiotom rozwiązywać te problemy, wizja stawała się coraz jaśniejsza, a biznes po prostu rósł.

Odegrałeś kluczową rolę w budowaniu największej arabskiej biblioteki cyfrowej do szkolenia AI. Jakie były największe wyzwania w tym zakresie i jak je pokonałeś?

Jednym z największych wyzwań była jakość. Innym była ograniczona dostępność wysokiej jakości danych arabskich online: język arabski jest poważnie niedoreprezentowany. Zdigitalizowano tylko niewielką część treści w języku arabskim, a zaledwie 3–5% całej treści online jest w języku arabskim. To prawie nic. Pokonaliśmy ten problem, wdrażając osoby zajmujące się etykietowaniem danych, adnotacją i naukowcami zajmującymi się danymi, aby sami digitalizowali, tworzyli i selekcjonowali dane.

CNTXT AI działa na styku kultury i obliczeń. Jak zrównoważyć najnowocześniejszą innowację AI z celem budowania kulturowo istotnych rozwiązań dla regionu MENA?

Budujemy modele oparte na kulturze od podstaw. Od infrastruktury do produktu końcowego, kultura jest osadzona od samego początku — nie jest czymś, co dodajemy później. Projektujemy, wprowadzamy innowacje i budujemy, mając na uwadze konkretne kultury, dialekty i potrzeby od pierwszego dnia. Arabski to jeden język, ale przenosi wiele dialektów i kontekstów kulturowych w całym regionie, więc budujemy lokalne produkty dla lokalnych krajów. I robimy to, współpracując z lokalnymi adnotatorami, ludźmi na miejscu, w ich własnych krajach.

Jesteś również współzałożycielem LocAI i kierujesz SMPL AI Fund. W jaki sposób te przedsięwzięcia uzupełniają misję CNTXT AI?

LocAI to warstwa aplikacji — część, z którą ludzie faktycznie wchodzą w interakcję. Znajduje się tuż nad danymi i infrastrukturą zbudowaną przez CNTXT AI. To właśnie sprawiło, że odniosła sukces: przekształca podstawy AI dostarczane przez CNTXT AI w rzeczywiste rozwiązania, z których ludzie mogą korzystać.

Z drugiej strony SMPL AI dotyczy odwdzięczania się społeczności. Skupia się na inwestowaniu w startupy na wczesnym etapie i pomaganiu w budowaniu regionalnego ekosystemu AI. Dzielimy się narzędziami i lekcjami, których nauczyliśmy się, budując AI, aby założyciele mogli rozwijać się szybciej i unikać typowych pułapek.

Munsit został nazwany najdokładniejszym modelem rozpoznawania mowy arabskiej na świecie. Co napędzało rozwój tego modelu i dlaczego teraz?

Przyczyną opracowania tego modelu była prosta potrzeba.

Zawsze budujemy z konieczności. Przyjrzeliśmy się rynkowi i zobaczyliśmy, że krajobraz jest dojrzały — agencje rządowe i klienci prywatni wszyscy prosili o takie rozwiązanie.

Istniejące modele po prostu nie były w stanie sprostać zadaniu. Większość z nich jest budowana na angielskiej technologii, a następnie dostosowywana. Nie są zaprojektowane dla języka arabskiego od podstaw i zdecydowanie nie dla konkretnych problemów, które rozwiązujemy.

Więc postanowiliśmy zbudować własny. Jest on przede wszystkim arabski — z założenia.

Badania nad Munsit wprowadzają podejście uczenia się słabo nadzorowanego. Czy możesz wyjaśnić, co to oznacza i dlaczego było to niezbędne do szkolenia arabskiego ASR na dużą skalę?

Adnotacja jest droga. Musieliśmy więc wyjść poza tradycyjne metody, które polegają na dużej ilości ręcznej transkrypcji. Słabo nadzorowane uczenie pomogło nam skalować bez konieczności ręcznego etykietowania każdego pliku audio — co jest szczególnie ważne w przypadku języka arabskiego, języka o ograniczonej liczbie danych i wielu różnych dialektach.

Zamiast używać profesjonalnie transkrybowanego dźwięku, zaczęliśmy od 30,000 15,000 godzin nieoznakowanej mowy arabskiej. Zbudowaliśmy kanał adnotacji, który generuje, filtruje i oczyszcza najlepsze z nich za pomocą automatycznych kontroli. Dało nam to wysokiej jakości XNUMX XNUMX-godzinny zbiór danych — wszystko bez ludzkiej transkrypcji.

Dzięki temu podejściu mogliśmy wytrenować nasz model od podstaw, szybko i ekonomicznie uchwycić bogactwo mówionego języka arabskiego w sytuacjach z życia codziennego. Bez tej metody zbudowanie arabskiego systemu ASR na taką skalę zajęłoby lata i miliony ręcznego wysiłku.

Munsit przewyższył modele z OpenAI, Microsoft i Meta w wielu testach porównawczych. Co to osiągnięcie mówi o przyszłości arabskiej innowacji AI?

Przyszłość arabskiej AI jest w naszych rękach; i to właśnie udowadnia to osiągnięcie. Nie możemy sobie pozwolić na poleganie na technologiach, których nie posiadamy, ani na osobach trzecich, które nie traktują priorytetowo naszego regionu.

Munsit pokazuje, że możemy budować AI światowej klasy, z regionu, dla regionu — wykorzystując lokalne talenty do rozwiązywania lokalnych problemów. To jasny sygnał, że następna fala arabskiej innowacji AI nadejdzie z wewnątrz.

Jak według Ciebie Munsit będzie się rozwijał w przyszłych wersjach i jakie są kolejne obszary rozwoju sztucznej inteligencji głosowej w języku arabskim w CNTXT?

Po prostu musisz poczekać i zobaczyć. Mogę powiedzieć, że mamy świeży, nowy zestaw rozwiązań AI w języku arabskim — wszystkie oparte na Munsit i innych modelach, które obecnie budujemy w CNTXT AI. To dopiero początek.

Często mówisz o znaczeniu „suwerennej sztucznej inteligencji”. Co to określenie dla Ciebie oznacza i dlaczego jest ono kluczowe dla regionu Zatoki Perskiej i szerszego regionu MENA?

Dla mnie suwerenna AI oznacza posiadanie pełnej własności i kontroli nad danymi, infrastrukturą i modelami, które kształtują naszą przyszłość. Jest to krytyczne, ponieważ musimy sami decydować o swoim losie, a to zaczyna się od danych.

Suwerenność danych jest wszystkim. Dane są cenne i musimy upewnić się, że pozostaną w naszych rękach.

Nie możemy sobie pozwolić na oddanie naszej przyszłości i siedzenie bezczynnie, podczas gdy inni budują dla nas technologię. Przyszłość AI w tym regionie będzie pochodzić z tego regionu. Właśnie do tego dążymy.

Jak według Ciebie CNTXT AI wpłynie na ekosystem sztucznej inteligencji na Bliskim Wschodzie w ciągu najbliższych pięciu lat?

Umożliwiając prawdziwą gotowość na AI. Wchodzimy, rozumiemy, czego potrzebują firmy i rządy, budujemy strategie danych i AI, a następnie pomagamy im budować, testować, wdrażać i skalować.

Jeśli dane są nową ropą, to nieustrukturyzowane dane są nieoczyszczoną ropą — pełną potencjału, lecz bezużyteczną, dopóki nie zostanie przetworzona. Dlatego stworzyliśmy CNTXT AI, aby pomóc organizacjom oczyścić, ustrukturyzować i aktywować swoje dane. Ponieważ to właśnie tam zaczyna się prawdziwa transformacja AI.

Z Twojej perspektywy, jako przedsiębiorcy i inwestora, jakich rad udzieliłbyś innym założycielom tworzącym startupy zajmujące się sztuczną inteligencją na rynkach wschodzących?

Zacznij teraz. Działaj szybko. Szybko ponoś porażki, ucz się szybciej i kontynuuj iterację.

Najważniejsze jest budowanie na prawdziwych problemach. Trzymaj się blisko ziemi — słuchaj użytkowników, a nie tylko szumu informacyjnego. Na rynkach wschodzących kluczowe są trafność i adaptacyjność.

Dziękuję za wspaniały wywiad. Czytelnicy chcący dowiedzieć się więcej powinni odwiedzić nas CNTXT-AI.

Antoine jest wizjonerskim liderem i partnerem założycielskim Unite.AI, napędzanym niezachwianą pasją do kształtowania i promowania przyszłości AI i robotyki. Jako seryjny przedsiębiorca wierzy, że AI będzie tak samo przełomowa dla społeczeństwa jak elektryczność i często zachwyca się potencjałem przełomowych technologii i AGI.

Jako futurysta, poświęca się badaniu, w jaki sposób te innowacje ukształtują nasz świat. Ponadto jest założycielem Securities.io, platforma skupiająca się na inwestowaniu w najnowocześniejsze technologie, które zmieniają przyszłość i przekształcają całe sektory.