Connect with us

Мохаммад Абу Шейх, Основатель и Генеральный Директор CNTXT AI – Интервью

Интервью

Мохаммад Абу Шейх, Основатель и Генеральный Директор CNTXT AI – Интервью

mm

Мохаммад Абу Шейх преобразует ландшафт ИИ в регионе MENA, стимулируя переход от пассивного потребления к суверенному инновациям. Как генеральный директор CNTXT AI и основатель фонда ИИ на сумму 10 миллионов долларов, он возглавил три успешных выхода и обеспечил финансирование на сумму более миллиарда долларов. Его работа закладывает основу для экосистемы ИИ, основанной на языке, культуре и суверенитете данных.

CNTXT AI – это компания цифровой трансформации, которая предоставляет облачную инфраструктуру, промышленное программное обеспечение и решения в области робототехники, чтобы помочь организациям модернизировать операции и открывать данные, основанные на данных, на Ближнем Востоке и в Северной Африке.

Что вдохновило вас на создание CNTXT AI, и как ваше видение суверенного ИИ в арабоязычном мире началось?

Мы увидели изобилие неиспользуемых данных в этой части мира. Многие проблемы масштабирования ИИ возникли из-за отсутствия готовности данных — что в конечном итоге означало отсутствие готовности ИИ. Вот почему мы начали CNTXT AI.

Сначала мы решали те же проблемы, с которыми столкнулись при построении LocAI… Мы увидели эти проблемы лично, работая с AI71, TII и G42 (IIAI). Когда мы помогли этим организациям решить эти проблемы, видение стало яснее, и бизнес просто продолжал расти.

Вы сыграли ключевую роль в создании крупнейшей арабской цифровой библиотеки для обучения ИИ. Какими были некоторые из самых больших проблем в этом, и как вы их преодолели?

Качество было одной из самых больших проблем. Другой проблемой была ограниченная доступность высококачественных арабских данных в Интернете: арабский язык серьезно недопредставлен. Только небольшая часть арабоязычного контента была оцифрована, и только 3–5% всего онлайн-контента на арабском языке. Это почти ничего. Мы преодолели эту проблему, развернув маркировщиков данных, аннотаторов и ученых-данных, чтобы оцифровать, создать и курировать данные самостоятельно.

CNTXT AI работает на пересечении культуры и вычислений. Как вы балансируете инновации в области ИИ с целью создания культурно релевантных решений для региона MENA?

Мы строим культурно обоснованные модели с нуля. От инфраструктуры до окончательного продукта культура внедряется с самого начала — это не то, что мы добавляем позже. Мы проектируем, инновируем и строим с учетом конкретных культур, диалектов и потребностей с самого начала. Арабский язык — один язык, но он несет в себе множество диалектов и культурных контекстов на протяжении всего региона, поэтому мы строим местные продукты для местных стран. И мы делаем это, работая с местными аннотаторами, людьми на земле, в их собственных странах.

Вы также стали сооснователем LocAI и возглавляете фонд SMPL AI. Как эти предприятия дополняют миссию CNTXT AI?

LocAI — это слой применения — та часть, с которой люди фактически взаимодействуют. Он находится прямо над данными и инфраструктурой, построенной CNTXT AI. Это то, что сделало его успешным: он преобразует основы ИИ, предоставленные CNTXT AI, в реальные решения, которые люди могут использовать.

SMPL AI, с другой стороны, — это о том, чтобы вернуть сообществу. Он фокусируется на инвестициях в ранние стартапы и помощи в построении региональной экосистемы ИИ. Мы делимся инструментами и уроками, которые мы выучили из построения ИИ сами, чтобы основатели могли расти быстрее и избегать общих ловушек.

Munsit был назван наиболее точной арабской моделью распознавания речи в мире. Что стимулировало разработку этой модели, и почему сейчас?

То, что стимулировало разработку этой модели, было простым: необходимость.

Мы всегда строим из необходимости. Мы посмотрели на рынок и увидели, что ландшафт был готов — государственные агентства и частные клиенты все просили решение, подобное этому.

Существующие модели просто не были на высоте задачи. Большинство из них построены на английской технологии и затем адаптированы. Они не предназначены для арабского языка с нуля, и определенно не для конкретных проблем, которые мы решаем.

Итак, мы решили построить свою собственную модель. Она арабская с самого начала — по дизайну.

Исследование, лежащее в основе Munsit, представляет собой подход к слабому обучению. Можете ли вы объяснить, что это значит, и почему это было важно для обучения арабской ASR в масштабе?

Аннотация дорогая. Поэтому мы должны были выйти за рамки традиционных методов, которые полагаются на большие объемы ручной транскрипции. Слабое обучение помогло нам масштабироваться без необходимости маркировать каждый аудиофайл вручную — что особенно важно для арабского языка, языка с ограниченными данными и множеством разных диалектов.

Вместо использования профессионально транскрибированного аудио мы начали с 30 000 часов неотмеченной арабской речи. Мы построили конвейер аннотации, который генерирует, фильтрует и очищает лучшие аудиофайлы с помощью автоматических проверок. Это дало нам высококачественную базу данных на 15 000 часов — все без ручной транскрипции.

Этот подход сделал возможным обучение нашей модели с нуля, захватывая богатство разговорного арабского языка в реальных ситуациях, быстро и экономически эффективно. Без этого метода построение арабской системы распознавания речи в этом масштабе заняло бы годы и миллионы долларов ручных усилий.

Munsit превзошел модели от OpenAI, Microsoft и Meta по нескольким показателям. Что это достижение говорит о будущем инноваций в области арабского ИИ?

Будущее арабского ИИ в наших руках; и это именно то, что это достижение доказывает. Мы больше не можем позволить себе полагаться на технологии, которые мы не владеем, или зависеть от третьих сторон, которые не отдают приоритет нашему региону.

Munsit показывает, что мы можем построить ИИ мирового класса, из региона, для региона — используя местный талант для решения местных проблем. Это rõальный сигнал о том, что следующая волна инноваций в области арабского ИИ придет изнутри.

Как вы видите эволюцию Munsit в будущих версиях, и какие следующие рубежи для арабского голосового ИИ в CNTXT?

Вы просто должны подождать и увидеть. То, что я могу сказать, — это то, что у нас есть свежий, новый набор арабских решений ИИ, которые будут представлены — все они будут работать на Munsit и других моделях, которые мы сейчас строим в CNTXT AI. Это только начало.

Вы часто говорите об важности «суверенного ИИ». Что это термин значит для вас, и почему это критически важно для Персидского залива и более широкого региона MENA?

Для меня суверенный ИИ означает полную собственность и контроль над данными, инфраструктурой и моделями, которые формируют нашу будущность. Это критически важно, потому что нам нужно владеть своей судьбой, и это начинается с данных.

Суверенитет данных — это все. Данные драгоценны, и нам нужно убедиться, что они остаются в наших руках.

Мы не можем позволить себе передать нашу будущность и сидеть в бездействии, пока другие строят технологии для нас. Будущее ИИ в этом регионе придет из этого региона. Это именно то, над чем мы работаем.

Как вы видите CNTXT AI, формирующий экосистему ИИ на Ближнем Востоке в течение следующих пяти лет?

Создавая настоящую готовность ИИ. Мы заходим, понимаем, что нужно компаниям и правительствам, строим стратегии данных и ИИ, и затем помогаем им строить, тестировать, развертывать и масштабировать.

Если данные — это новая нефть, то неструктурированные данные — это нефть, не прошедшая рафинирование — полная потенциала, но бесполезная, пока не обработана. Это почему мы построили CNTXT AI, чтобы помочь организациям очистить, структурировать и активировать свои данные. Потому что это то место, где начинается настоящая трансформация ИИ.

С вашей точки зрения как предпринимателя и инвестора, какой совет вы дадите другим основателям, строящим стартапы ИИ на развивающихся рынках?

Начните сейчас. Двигайтесь быстро. Неудачи быстро, учите быстрее, и продолжайте итерации.

Самое главное, строите для реальных проблем. Оставайтесь близко к земле — слушайте пользователей, а не просто шум. На развивающихся рынках релевантность и адаптивность являются ключевыми.

Спасибо за отличное интервью, читателям, которые хотят узнать больше, следует посетить CNTXT AI.

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.

Раскрытие информации о рекламе: Unite.AI придерживается строгих редакционных стандартов, чтобы предоставлять читателям точную информацию и новости. Мы можем получать вознаграждение, если вы переходите по ссылкам на продукты, которые мы рассмотрели.