Интервью
Мохаммад Абу Шейх, основатель и генеральный директор CNTXT AI – серия интервью

Мохаммад Абу Шейх трансформирует ландшафт ИИ в регионе MENA, стимулируя переход от пассивного потребления к суверенным инновациям. Как генеральный директор CNTXT AI и основатель фонда ИИ стоимостью 10 миллионов долларов, он провел три успешных выхода и обеспечил более миллиарда долларов финансирования. Его работа закладывает основу для экосистемы ИИ, основанной на языке, культуре и суверенитете данных.
Мы увидели обилие недоиспользованных данных в этой части мира. Многие проблемы в масштабировании ИИ возникли из-за отсутствия готовности данных — что в конечном итоге означало отсутствие готовности ИИ. Вот почему мы запустили CNTXT AI.
Изначально мы решали те же проблемы, с которыми столкнулись при создании LocAI… Мы своими глазами увидели эти проблемы, работая с AI71, TII и G42 (IIAI). По мере того, как мы помогали этим организациям решать эти проблемы, видение становилось яснее, и бизнес продолжал расти.
Вы сыграли ключевую роль в создании крупнейшей арабской цифровой библиотеки для обучения ИИ. Какие были самые большие трудности при этом и как вы их преодолели?
Качество было одной из самых больших проблем. Другой проблемой была ограниченная доступность высококачественных арабских данных в Интернете: арабский язык серьезно недопредставлен. Только небольшая часть контента на арабском языке была оцифрована, и всего 3–5% всего онлайн-контента на арабском языке. Это почти ничего. Мы преодолели эту проблему, задействовав маркировщиков данных, аннотаторов и специалистов по данным для самостоятельной оцифровки, создания и курирования данных.
CNTXT AI работает на стыке культуры и вычислений. Как вы сбалансируете передовые инновации в области ИИ с целью создания культурно значимых решений для региона MENA?
Мы строим культурно обоснованные модели с нуля. От инфраструктуры до конечного продукта культура заложена с самого начала — это не то, что мы добавляем позже. Мы проектируем, внедряем инновации и строим с учетом конкретных культур, диалектов и потребностей с первого дня. Арабский язык — один язык, но он несет в себе множество диалектов и культурных контекстов по всему региону, поэтому мы создаем локальные продукты для местных стран. И мы делаем это, работая с местными аннотаторами, людьми на местах, в их собственных странах.
Вы также стали соучредителем LocAI и руководите фондом SMPL AI Fund. Как эти предприятия дополняют миссию CNTXT AI?
LocAI — это прикладной уровень — часть, с которой люди фактически взаимодействуют. Он находится прямо над данными и инфраструктурой, созданными CNTXT AI. Вот что сделало его успешным: он преобразует основы ИИ, предоставляемые CNTXT AI, в реальные решения, которые люди могут использовать.
С другой стороны, SMPL AI — это возвращение долга сообществу. Он фокусируется на инвестировании в стартапы на ранних стадиях и помощи в построении региональной экосистемы ИИ. Мы делимся инструментами и уроками, которые мы извлекли из самостоятельного создания ИИ, чтобы основатели могли расти быстрее и избегать распространенных ошибок.
Munsit назвали самой точной моделью распознавания арабской речи в мире. Что побудило к разработке этой модели и почему именно сейчас?
Причина разработки этой модели была проста: потребность.
Мы всегда строим по необходимости. Мы посмотрели на рынок и увидели, что ландшафт созрел — государственные учреждения и частные клиенты — все просили о таком решении.
Существующие модели просто не справлялись с этой задачей. Большинство из них построены на английской технологии, а затем адаптированы. Они не предназначены для арабского языка с нуля и, определенно, не для тех конкретных проблем, которые мы решаем.
Поэтому мы решили построить свой собственный. Он изначально арабский — по замыслу.
Исследование, лежащее в основе Munsit, представляет собой слабо контролируемый подход к обучению. Можете ли вы объяснить, что это значит и почему это было необходимо для обучения арабскому ASR в масштабе?
Аннотирование — это дорого. Поэтому нам пришлось выйти за рамки традиционных методов, которые зависят от большого объема ручной транскрипции. Слабо контролируемое обучение помогло нам масштабироваться без необходимости вручную маркировать каждый аудиофайл — что особенно важно для арабского языка с ограниченными данными и множеством различных диалектов.
Вместо использования профессионально транскрибированного аудио мы начали с 30,000 15,000 часов немаркированной арабской речи. Мы построили конвейер аннотаций, который генерирует, фильтрует и очищает лучшие из них с помощью автоматизированных проверок. Это дало нам высококачественный набор данных объемом XNUMX XNUMX часов — и все это без человеческой транскрипции.
Такой подход позволил обучить нашу модель с нуля, быстро и экономически эффективно охватывая богатство разговорного арабского языка в реальных ситуациях. Без этого метода создание арабской системы ASR в таком масштабе заняло бы годы и миллионы ручных усилий.
Munsit превзошел модели OpenAI, Microsoft и Meta по нескольким показателям. Что это достижение говорит о будущем арабских инноваций в области ИИ?
Будущее арабского ИИ в наших руках; и это именно то, что доказывает это достижение. Мы больше не можем позволить себе полагаться на технологии, которыми не владеем, или зависеть от третьих сторон, которые не считают наш регион приоритетным.
Мунсит показывает, что мы можем создать ИИ мирового класса, из региона, для региона — используя местные таланты для решения местных проблем. Это четкий сигнал о том, что следующая волна арабских инноваций в области ИИ придет изнутри.
Как вы видите развитие Munsit в будущих версиях и каковы следующие рубежи арабского голосового ИИ на CNTXT?
Вам просто придется подождать и посмотреть. Могу сказать, что у нас на подходе свежий, новый набор решений AI для арабского языка — все на базе Munsit и других моделей, которые мы сейчас создаем в CNTXT AI. Это только начало.
Вы часто говорите о важности «суверенного ИИ». Что этот термин означает для вас и почему он имеет решающее значение для стран Персидского залива и более широкого региона Ближнего Востока и Северной Африки?
Для меня суверенный ИИ означает полное владение и контроль над данными, инфраструктурой и моделями, которые формируют наше будущее. Это критически важно, потому что нам нужно владеть своей собственной судьбой, и это начинается с данных.
Суверенитет данных — это все. Данные бесценны, и нам нужно убедиться, что они остаются в наших руках.
Мы не можем позволить себе отдать наше будущее и сидеть сложа руки, пока другие создают для нас технологию. Будущее ИИ в этом регионе придет из этого региона. Это именно то, над чем мы работаем.
Как, по вашему мнению, CNTXT AI будет формировать экосистему ИИ на Ближнем Востоке в течение следующих пяти лет?
Обеспечивая настоящую готовность к ИИ. Мы идем, понимаем, что нужно компаниям и правительствам, создаем данные и стратегии ИИ, а затем помогаем им создавать, тестировать, развертывать и масштабировать.
Если данные — это новая нефть, то неструктурированные данные — это неочищенная нефть: они полны потенциала, но бесполезны, пока не будут обработаны. Вот почему мы создали CNTXT AI, чтобы помочь организациям очищать, структурировать и активировать свои данные. Потому что именно здесь начинается настоящая трансформация AI.
С точки зрения предпринимателя и инвестора, какой совет вы бы дали другим основателям, создающим стартапы в сфере ИИ на развивающихся рынках?
Начните сейчас. Двигайтесь быстро. Быстро ошибайтесь, быстрее учитесь и продолжайте итерации.
Самое главное — стройте для реальных проблем. Оставайтесь на земле — слушайте пользователей, а не только шумиху. На развивающихся рынках ключевыми являются релевантность и адаптивность.
Спасибо за отличное интервью, читатели, которые хотят узнать больше, должны посетить CNTXT ИИ.