кочан Мохамад Омар, съосновател и главен изпълнителен директор на LXT - Серия от интервюта - Unite.AI
Свържете се с нас

Интервюта

Мохамад Омар, съосновател и главен изпълнителен директор на LXT – Серия интервюта

mm
Обновено on

Мохамад Омар е съосновател и главен изпълнителен директор на LXT, нововъзникващ лидер в данните за обучение на AI за захранване на интелигентни технологии за глобални организации, включително най-големите технологични компании в света. В партньорство с международна мрежа от сътрудници, LXT събира и анотира данни в множество модалности със скоростта, мащаба и гъвкавостта, изисквани от предприятието. Основана през 2010 г., LXT е със седалище в Торонто, Канада, с присъствие в Съединените щати, Австралия, Индия, Турция, Обединеното кралство и Египет.

Бихте ли споделили историята на генезиса зад LXT?

LXT беше основана в отговор на острата нужда от данни, пред която беше изправен моят работодател отпреди дванадесет години. По това време компанията се нуждаеше от арабски данни, но не разполагаше с подходящите доставчици, от които да ги получи. Като поемащ риск и предприемач по природа, реших да се оттегля от ролята си, да създам нова компания и да се обърна обратно, за да предложа услугите си на бившия си работодател. Веднага ни бяха дадени някои от техните най-предизвикателни проекти, които успешно изпълнихме, и нещата просто се развиха оттам. Сега, повече от 12 години по-късно, ние изградихме силна връзка с тази компания, превръщайки се в доставчик на висококачествени езикови данни.

Кои са някои от най-големите предизвикателства зад внедряването на AI в мащаб?

Това е страхотен въпрос и ние всъщност го включихме в нашия последен изследователски доклад, Пътят към зрелостта на ИИ. Основното предизвикателство, което респондентите цитираха, беше интегрирането на техните съществуващи или наследени системи в AI решения. Това има смисъл предвид факта, че проучихме по-големи компании, които най-вероятно биха имали набор от технологични системи в своите организации, които трябва да бъдат рационализирани в стратегия за дигитална трансформация. Други предизвикателства, които респондентите оцениха високо, бяха липсата на квалифициран талант, липсата на обучение или ресурси и получаването на качествени данни. Не бях изненадан от тези отговори, тъй като те често се цитират, а също и, разбира се, защото предизвикателството на данните е причината за съществуването на нашата организация.

Когато става въпрос за предизвикателства с данни, LXT може както да извлича данни, така и да ги етикетира, така че алгоритмите за машинно обучение да могат да ги осмислят. Ние сме оборудвани да правим това в мащаб и с гъвкавост, което означава, че доставяме висококачествени данни много бързо. Клиентите често идват при нас, когато се подготвят за пускане на пазара и искат да се уверят, че техният продукт е добре приет от клиентите, 

Работейки с нас за получаване и етикетиране на данни, компаниите могат да се справят с недостига на ресурси и таланти, като позволят на екипите си да се съсредоточат върху изграждането на иновативни решения.

LXT предлага покритие за над 750 езика, но има предизвикателства при превода и локализацията, които надхвърлят структурата на самия език. Бихте ли обсъдили как LXT се изправя пред тези предизвикателства?

Със сигурност има предизвикателства при превода и локализацията – особено след като се разклоните отвъд най-разпространените езици, които обикновено имат официален статут и нивото на стандартизация, което върви заедно с това. Много от езиците, на които работим, нямат официална ортография, така че управлението на последователността в екипа се превръща в предизвикателство. Ние се справяме с тези и други предизвикателства – например откриване на измамно поведение – като разполагаме със строги процеси за осигуряване на качеството. Отново беше много очевидно в доклада за изследване на зрелостта на ИИ, че за повечето организации, работещи с данни от ИИ, качеството е на върха на списъка с приоритети. И повечето анкетирани организации изразиха готовност да платят повече, за да получат това. 

За компании, които се нуждаят от източници на данни и анотация на данни, колко рано в процеса на разработване на приложения трябва да започнат да получават тези данни?

Препоръчваме на организациите да създадат стратегия за данни веднага след като идентифицират своя случай на използване на AI. Изчакването, докато приложението бъде в процес на разработка, може да доведе до много ненужни преработки, тъй като AI може да научи грешни неща и трябва да бъде преквалифициран чрез качествени данни, което може да отнеме време, за да бъде източник и интегриран в процеса на разработка.

Какво е основното правило за познаване на честотата, на която данните трябва да се актуализират?

Това наистина зависи от вида на приложението, което разработвате, и колко често данните, които го поддържат, се променят значително. Това означава, че данните са представяне на реалния живот и с течение на времето данните трябва да бъдат актуализирани, за да предоставят точно отражение на случващото се в света. Наричаме това явление дрейф на модела, като има два вида, всеки от които изисква повторно обучение на алгоритми.

  • Дрейф на концепцията възниква, когато се промени значителна разлика между данните за обучение и изхода на AI, което може да се случи внезапно или по-постепенно. Например, търговец на дребно може да използва исторически данни за клиенти, за да обучи AI приложение. Но когато настъпи масивна промяна в потребителската реалност, алгоритъмът ще трябва да бъде преквалифициран, за да отрази това.

 

  • Дрейфът на данните възниква, когато данните, използвани за обучение на приложение, вече не отразяват действителните данни, срещани при влизането му в производство. Това може да бъде причинено от набор от фактори, включително демографски промени, сезонност или ситуация на приложение в нов географски регион.

LXT наскоро представи доклад, озаглавен „Пътят към зрелостта на ИИ 2023 г”. Кои бяха някои от изводите в този доклад, които ви изненадаха?

Вероятно не трябваше да е изненада, но нещото, което наистина се открояваше, беше разнообразието от приложения. Може би сте очаквали две или три области на дейност да доминират, но когато попитахме къде респондентите планират да съсредоточат усилията си за ИИ и къде планират да внедрят своя ИИ, първоначално изглеждаше като хаос – липсата на каквато и да е тенденция. Но при пресяване на данните и разглеждане на качествените отговори стана ясно, че липсата на тенденция is тенденцията. Поне през очите на нашите респонденти, ако имате проблем, тогава има реална възможност някой да работи върху AI решение за него.

Генеративният AI превзема света като буря, какво е вашето мнение за това докъде могат да отведат индустрията моделите за генериране на език?

Моят личен поглед върху това е, че централното за истинската сила на Генеративния изкуствен интелект – избирам да използвам думите тук, вместо съкращението за акцент – е разбирането на естествения език. „Интелигентността“ на ИИ се научава чрез езика; способността за адресиране и в крайна сметка решаване на сложни проблеми се медиира чрез итеративни и кумулативни взаимодействия на естествен език. Имайки това предвид, вярвам, че моделите за генериране на език ще бъдат в крачка с други елементи на ИИ през цялото време.

Каква е вашата визия за бъдещето на AI и за бъдещето на LXT?

По природа съм оптимист и това ще оцвети отговора ми тук, но моята визия за бъдещето на ИИ е да го видя да подобрява качеството на живот за всички; за да направи нашия свят по-безопасно място, по-добро място за бъдещите поколения. На микро ниво, моята визия за LXT е да видя как организацията продължава да надгражда силните си страни, да расте и да се превърне в предпочитан работодател и сила за доброто за глобалната общност, която прави нашия бизнес възможен. На макро ниво, моята визия за LXT е да допринесе по значителен, смислен начин за изпълнението на моята оптимистично изкривена визия за бъдещето на AI.

Благодаря ви за страхотното интервю, читателите, които искат да научат повече, трябва да го посетят LXT.

Основател на unite.AI и член на Технологичен съвет на Forbes, Антоан е а футурист който е страстен за бъдещето на AI и роботиката.

Той е и основател на Ценни книжа.io, уебсайт, който се фокусира върху инвестирането в революционни технологии.