Connect with us

Mohammad Abu Sheikh, Засновник та Генеральний директор CNTXT AI – Серія інтерв’ю

Інтерв’ю

Mohammad Abu Sheikh, Засновник та Генеральний директор CNTXT AI – Серія інтерв’ю

mm

Mohammad Abu Sheikh перетворює ландшафт штучного інтелекту на Близькому Сході та в Північній Африці, сприяючи переходу від пасивного споживання до суверенного інноваційного розвитку. Як генеральний директор CNTXT AI і засновник фонду штучного інтелекту вартістю 10 мільйонів доларів, він здійснив три успішні виходи та забезпечив фінансування на суму понад мільярд доларів. Його робота закладає основу для екосистеми штучного інтелекту, заснованої на мові, культурі та суверенітеті даних.

CNTXT AI є цифровою трансформаційною компанією, яка надає хмарну інфраструктуру, промислове програмне забезпечення та рішення з робототехніки, щоб допомогти організаціям модернізувати операції та розблокувати дані-орієнтовані інсайти на Близькому Сході та в Північній Африці.

Що спонукало вас заснувати CNTXT AI, і як розпочався ваш погляд на суверенний штучний інтелект у арабськомовному світі?

Ми побачили надлишок не використовуваних даних у цій частині світу. Багато проблем зі масштабуванням штучного інтелекту виникли через відсутність готовності даних — що в кінцевому підсумку означало відсутність готовності штучного інтелекту. Саме тому ми створили CNTXT AI.

Спочатку ми розв’язували ті самі проблеми, з якими ми зіштовхнулися під час побудови LocAI… Ми бачили ці виклики на власному досвіді, працюючи з AI71, TII та G42 (IIAI). Коли ми допомагали цим організаціям розв’язувати ці проблеми, бачення стало чіткішим, а бізнес просто продовжував розвиватися.

Ви відігравали ключову роль у створенні найбільшої арабської цифрової бібліотеки для навчання штучного інтелекту. Якими були деякі з найбільших викликів при цьому, і як ви їх подолали?

Якість була однією з найбільших проблем. Іншою була обмежена доступність високоякісних арабських даних в Інтернеті: арабська мова серйозно підrepresented. Лише мала частина арабськомовного контенту була оцифрована, а всього 3–5% усіх онлайн-контентів складають арабська мова. Це майже нічого. Ми подолали цю проблему, розгорнувши маркери даних, аннотаторів та вчених-даних, щоб оцифрувати, створити та куратори даних самостійно.

CNTXT AI діє на перетині культури та обчислень. Як ви балансуєте інновації штучного інтелекту з метою побудови культурно релевантних рішень для регіону Близького Сходу та Північної Африки?

Ми будуємо культурно засновані моделі з самого початку. Від інфраструктури до кінцевого продукту культура закладена з самого початку — це не те, що ми додаємо пізніше. Ми проектуємо, інновуємо та будуємо з урахуванням конкретних культур, діалектів та потреб з самого початку. Арабська мова — це одна мова, але вона несе багато діалектів та культурних контекстів по всьому регіону, тому ми будуємо місцеві продукти для місцевих країн. І ми робимо це, працюючи з місцевими аннотаторами, людьми на місцях, у їхніх власних країнах.

Ви також стали співзасновником LocAI та очолюєте фонд SMPL AI. Як ці підприємства доповнюють місію CNTXT AI?

LocAI — це прикладний шар — частина, з якою люди фактично взаємодіють. Він знаходиться прямо над даними та інфраструктурою, побудованою CNTXT AI. Саме це зробило його успішним: він перетворює основи штучного інтелекту, надані CNTXT AI, у реальні рішення, які люди можуть використовувати.

SMPL AI, з іншого боку, полягає в тому, щоб повернути спільноті. Він зосереджується на інвестуванні в стартапи на ранній стадії та допомозі у побудові регіональної екосистеми штучного інтелекту. Ми ділимося інструментами та уроками, які ми вивчили під час побудови штучного інтелекту самостійно, щоб засновники могли зростати швидше та уникати загальних помилок.

Munsit називають найбільш точною арабською мовою розпізнавання мови у світі. Що спонукало розвиток цієї моделі, і чому зараз?

Те, що спонукало розвиток цієї моделі, було простим: потреба.

Ми завжди будуємо з необхідності. Ми подивилися на ринок і побачили, що ландшафт був готовий — урядові агентства та приватні клієнти всі просили рішення цього типу.

Існуючі моделі просто не були на висоті завдання. Більшість з них побудовані на англійській технології, а потім адаптовані. Вони не створені для арабської мови з самого початку, і точно не для тих проблем, які ми розв’язуємо.

Тому ми вирішили побудувати свою власну. Це арабська мова перш за все — за проектуванням.

Дослідження, пов’язане з Munsit, вводить підхід слабкого нагляду за навчанням. Чи можете ви пояснити, що це означає, і чому це було важливо для навчання арабської мови розпізнавання мови у великому масштабі?

Анотація коштує дорого. Тому нам довелося вийти за межі традиційних методів, які залежать від великої кількості ручної транскрипції. Слабкий нагляд за навчанням допоміг нам масштабуватися без необхідності ручної транскрипції кожного аудіофайлу — що особливо важливо для арабської мови, мови з обмеженими даними та багатьма діалектами.

Замість використання професійної транскрипції аудіо ми почали з 30 000 годин незначених арабських мов. Ми побудували конвейер анотації, який генерує, фільтрує та очищує найкращі з них за допомогою автоматичних перевірок. Це дало нам високоякісний набір даних на 15 000 годин — все без ручної транскрипції.

Цей підхід зробив можливим навчання нашої моделі з нуля, захоплення багатства розмовної арабської мови в реальних ситуаціях, швидко та ефективно. Без цього методу побудова системи розпізнавання арабської мови у цьому масштабі зайняла б роки та мільйони ручної праці.

Munsit перевершив моделі від OpenAI, Microsoft та Meta по декількох показниках. Що це досягнення говорить про майбутнє інновацій штучного інтелекту арабської мови?

Майбутнє арабської мови штучного інтелекту знаходиться в наших руках; і саме це це досягнення доводить. Ми вже не можемо дозволити собі покладатися на технології, які ми не володіємо, або залежати від третіх сторін, які не пріоритезують наш регіон.

Munsit показує, що ми можемо побудувати світовий рівень штучного інтелекту, з регіону, для регіону — використовуючи місцевий талант для розв’язання місцевих проблем. Це явний сигнал про те, що наступна хвиля інновацій арабської мови штучного інтелекту прийде зсередини.

Як ви бачите розвиток Munsit у майбутніх версіях, і які наступні рубежі для арабської мови штучного інтелекту голосу в CNTXT?

Вам просто доведеться почекати та побачити. Що я можу сказати, так це те, що у нас є свіжий, новий набір арабських рішень штучного інтелекту, які зараз розробляються в CNTXT AI. Це тільки початок.

Ви часто говорите про важливість “суверенного штучного інтелекту”. Що це означає для вас, і чому це критично для регіону Перської затоки та ширшого регіону Близького Сходу та Північної Африки?

Для мене суверенний штучний інтелект означає повну власність та контроль над даними, інфраструктурою та моделями, які формують нашу майбутнє. Це критично, оскільки нам потрібно володіти своєю власною долею, і це починається з даних.

Суверенітет даних — це все. Дані дорогоцінні, і нам потрібно забезпечити, щоб вони залишилися в наших руках.

Ми не можемо дозволити собі передати своє майбутнє та сидіти пасивно, поки інші будують технології для нас. Майбутнє штучного інтелекту в цьому регіоні прийде з цього регіону. Саме до цього ми працюємо.

Як ви бачите розвиток екосистеми штучного інтелекту на Близькому Сході за наступні п’ять років?

За допомогою справжньої готовності штучного інтелекту. Ми йдемо туди, розуміємо, чого потребують компанії та уряди, будуємо стратегії даних та штучного інтелекту, а потім допомагаємо їм будувати, тестувати, розгортати та масштабувати.

Якщо дані — це нова нафта, то неструктуровані дані — це нафта, не рафінована — повна потенціалу, але безкорисна, поки не оброблена. Саме тому ми побудували CNTXT AI, щоб допомогти організаціям очистити, структуризувати та активувати свої дані. Бо саме там починається справжня трансформація штучного інтелекту.

З вашої точки зору як підприємця та інвестора, яку пораду ви дали б іншим засновникам, які будують стартапи штучного інтелекту на ринках, що розвиваються?

Почніть зараз. Рухайтеся швидко. Помиляєтеся швидко, вчитеся швидше, і продовжуйте ітерувати.

Найважливіше — будуйте реальні проблеми. Залишайтеся близько до землі — слухайте користувачів, а не просто гіп. На ринках, що розвиваються, актуальність та адаптивність є ключем.

Дякую за велике інтерв’ю, читачам, які бажають дізнатися більше, слід відвідати CNTXT AI.

Антуан є видним лідером і засновником Unite.AI, який рухає невпинною пристрастю до формування та просування майбутнього штучного інтелекту та робототехніки. Як серійний підприємець, він вважає, що штучний інтелект буде таким же революційним для суспільства, як і електрика, і часто захоплюється потенціалом деструктивних технологій та AGI.

Як футуролог, він присвячений дослідженню того, як ці інновації сформують наш світ. Крім того, він є засновником Securities.io, платформи, орієнтованої на інвестування в передові технології, які переінакшують майбутнє та змінюють цілі сектори.