Հարցազրույցներ

Մոհամմադ Օմար, LXT – Հարցազրույցների շարքի համահիմնադիր և գործադիր տնօրեն

Թարմացվել է on Հունիսի 6, 2023

Մոհամմադ Օմարը համահիմնադիր և գործադիր տնօրեն է LXT, ինտելեկտուալ ինտելեկտի ուսուցման տվյալների զարգացող առաջատարը՝ խելացի տեխնոլոգիաները գլոբալ կազմակերպությունների համար, ներառյալ աշխարհի խոշորագույն տեխնոլոգիական ընկերությունները: Համագործակցելով ներդրողների միջազգային ցանցի հետ՝ LXT-ը հավաքում և նշում է տվյալներ բազմաթիվ եղանակներով՝ ձեռնարկության կողմից պահանջվող արագությամբ, մասշտաբով և շարժունությամբ: Հիմնադրվել է 2010 թվականին, LXT-ի գլխամասային գրասենյակը գտնվում է Տորոնտոյում, Կանադա, ներկայություն ունենալով ԱՄՆ-ում, Ավստրալիայում, Հնդկաստանում, Թուրքիայում, Մեծ Բրիտանիայում և Եգիպտոսում:

Կարո՞ղ եք կիսվել LXT-ի հիմքում ընկած ծագման պատմությունով:

LXT-ը հիմնադրվել է ի պատասխան այն տվյալների սուր անհրաժեշտության, որին բախվում էր իմ գործատուն տասներկու տարի առաջ: Այդ ժամանակ ընկերությանն արաբական տվյալներ էին պետք, սակայն չուներ համապատասխան մատակարարներ, որոնցից դրանք կարող էին ստանալ: Լինելով ռիսկի դիմող և ձեռներեց իր էությամբ՝ ես որոշեցի հրաժարվել իմ պաշտոնից, հիմնել նոր ընկերություն և ետ վերադառնալ՝ մեր ծառայություններն առաջարկելու իմ նախկին գործատուին: Անմիջապես մեզ տրվեցին նրանց ամենադժվար նախագծերից մի քանիսը, որոնք մենք հաջողությամբ իրականացրեցինք, և ամեն ինչ պարզապես աճեց այնտեղից: Այժմ, ավելի քան 12 տարի անց, մենք ամուր հարաբերություններ ենք հաստատել այս ընկերության հետ՝ դառնալով բարձրորակ լեզվական տվյալների հիմնական մատակարար:

Որո՞նք են AI-ի մասշտաբով տեղակայման ամենամեծ մարտահրավերներից մի քանիսը:

Դա հիանալի հարց է, և մենք իրականում ներառել ենք դա մեր վերջին հետազոտական զեկույցում, Ճանապարհ դեպի AI հասունություն. Հիմնական մարտահրավերը, որը նշել են հարցվողները, իրենց գոյություն ունեցող կամ ժառանգական համակարգերի ինտեգրումն էր AI լուծումների մեջ: Սա իմաստ ունի հաշվի առնելով այն փաստը, որ մենք հարցում ենք կատարել ավելի մեծ ընկերություններին, որոնք, ամենայն հավանականությամբ, կունենան տեխնոլոգիական համակարգերի զանգված իրենց կազմակերպություններում, որոնք պետք է ռացիոնալացվեն թվային փոխակերպման ռազմավարության մեջ: Մյուս մարտահրավերները, որոնք հարցվածները բարձր են գնահատել, եղել են հմուտ տաղանդի բացակայությունը, վերապատրաստման կամ ռեսուրսների բացակայությունը և որակյալ տվյալների աղբյուրը: Ես չզարմացա այս պատասխաններից, քանի որ դրանք սովորաբար նշվում են, և, իհարկե, նաև այն պատճառով, որ տվյալների մարտահրավերը մեր կազմակերպության գոյության պատճառն է:

Երբ խոսքը վերաբերում է տվյալների մարտահրավերներին, LXT-ը կարող է և՛ տվյալների աղբյուր, և՛ պիտակավորել դրանք, որպեսզի մեքենայական ուսուցման ալգորիթմները կարողանան իմաստավորել դրանք: Մենք պատրաստ ենք դա անելու մասշտաբով և արագաշարժությամբ, ինչը նշանակում է, որ մենք շատ արագ ենք մատուցում բարձրորակ տվյալներ: Հաճախորդները հաճախ են գալիս մեզ մոտ, երբ պատրաստվում են մեկնարկին և ցանկանում են համոզվել, որ իրենց արտադրանքը լավ է ընդունվում հաճախորդների կողմից,

Մեզ հետ աշխատելով տվյալների աղբյուրագրման և պիտակավորման համար՝ ընկերությունները կարող են լուծել իրենց ռեսուրսների և տաղանդների պակասը՝ թույլ տալով իրենց թիմերին կենտրոնանալ նորարար լուծումներ ստեղծելու վրա:

LXT-ն առաջարկում է ծածկույթ ավելի քան 750 լեզուների համար, սակայն կան թարգմանության և տեղայնացման մարտահրավերներ, որոնք դուրս են գալիս հենց լեզվի կառուցվածքից: Կարո՞ղ եք քննարկել, թե ինչպես է LXT-ն դիմակայում այս մարտահրավերներին:

Անկասկած, կան թարգմանության և տեղայնացման մարտահրավերներ, հատկապես այն ժամանակ, երբ դուք դուրս եք գալիս ամենաշատ խոսվող լեզուներից, որոնք հակված են պաշտոնական կարգավիճակ ունենալու և ստանդարտացման մակարդակին, որը համընկնում է դրան: Լեզուներից շատերը, որոնցով մենք աշխատում ենք, չունեն պաշտոնական ուղղագրություն, ուստի թիմում հետևողականությունը կառավարելը դառնում է մարտահրավեր: Մենք լուծում ենք այս և այլ մարտահրավերները, օրինակ՝ խարդախության հայտնաբերումը, որակի ապահովման համար խիստ գործընթացներ իրականացնելու միջոցով: Կրկին շատ ակնհայտ էր AI-ի հասունության հետազոտության զեկույցում, որ AI տվյալների հետ աշխատող կազմակերպությունների մեծ մասի համար որակը առաջնահերթությունների ցանկի վերևում էր: Եվ հարցված կազմակերպությունների մեծ մասը պատրաստակամություն է հայտնել ավելի շատ վճարել դա ստանալու համար:

Ընկերությունների համար, ովքեր պահանջում են տվյալների աղբյուր և տվյալների ծանոթագրություն, հավելվածների մշակման ճանապարհորդության ժամանակ որքա՞ն պետք է սկսեն ստանալ այս տվյալները:

Մենք խորհուրդ ենք տալիս կազմակերպություններին ստեղծել տվյալների ռազմավարություն հենց որ նրանք բացահայտեն իրենց AI օգտագործման դեպքը: Սպասելը, մինչև հավելվածը մշակվի, կարող է հանգեցնել շատ անհարկի վերամշակման, քանի որ AI-ն կարող է սխալ բաներ սովորել և պետք է վերապատրաստվի որակյալ տվյալների միջոցով, ինչը կարող է ժամանակ պահանջել աղբյուրի և զարգացման գործընթացում ինտեգրվելու համար:

Ո՞րն է հիմնական կանոնը տվյալների թարմացման հաճախականության մասին իմանալու համար:

Դա իսկապես կախված է այն հավելվածի տեսակից, որը դուք մշակում եք և որքան հաճախ են այն աջակցող տվյալները զգալիորեն փոխվում: Սա նշանակում է, որ տվյալները իրական կյանքի ներկայացում են, և ժամանակի ընթացքում տվյալները պետք է թարմացվեն՝ աշխարհում տեղի ունեցողի ճշգրիտ արտացոլումը ապահովելու համար: Այս երևույթը մենք անվանում ենք մոդելային դրեյֆ, որի երկու տեսակ կա, որոնցից յուրաքանչյուրը պահանջում է ալգորիթմների վերապատրաստում:

Հայեցակարգի շեղումը տեղի է ունենում, երբ վերապատրաստման տվյալների և AI ելքի միջև զգալի տարբերությունը փոխվում է, ինչը կարող է տեղի ունենալ հանկարծակի կամ ավելի աստիճանաբար: Օրինակ, մանրածախ առևտուրը կարող է օգտագործել հաճախորդների պատմական տվյալները՝ արհեստական ինտելեկտի հավելվածը վարժեցնելու համար: Բայց երբ սպառողական իրականության մեջ տեղի է ունենում զանգվածային տեղաշարժ, ալգորիթմը պետք է վերապատրաստվի՝ դա արտացոլելու համար:

Տվյալների տեղաշարժը տեղի է ունենում, երբ հավելվածի պատրաստման համար օգտագործվող տվյալներն այլևս չեն արտացոլում իրական տվյալները, որոնք հանդիպում են, երբ այն մտնում է արտադրություն: Դա կարող է պայմանավորված լինել մի շարք գործոններով, ներառյալ ժողովրդագրական տեղաշարժերը, սեզոնայնությունը կամ նոր աշխարհագրական տարածաշրջանում հայտի իրավիճակը:

LXT-ը վերջերս հրապարակեց զեկույցը վերնագրված «Ճանապարհ դեպի AI Maturity 2023»: Որո՞նք էին այս զեկույցի որոշ կարևոր կետեր, որոնք ձեզ զարմացրեցին:

Հավանաբար, դա չպետք է անակնկալ լիներ, բայց այն, ինչ իսկապես աչքի էր ընկնում, հավելվածների բազմազանությունն էր: Դուք կարող էիք ակնկալել, որ գործունեության երկու կամ երեք տիրույթներ կգերիշխեն, բայց երբ մենք հարցրինք, թե հարցվողները որտեղ են պլանավորում կենտրոնացնել իրենց AI-ի ջանքերը, և որտեղ են նրանք նախատեսում տեղակայել իրենց AI-ն, ի սկզբանե դա կարծես քաոս էր՝ ընդհանրապես որևէ միտումի բացակայություն: Սակայն տվյալները մաղելով և որակական պատասխանները դիտելով՝ պարզ դարձավ, որ միտումի բացակայությունը. is միտումը. Գոնե մեր հարցվողների աչքերով, եթե դուք խնդիր ունեք, ապա իրական հավանականություն կա, որ ինչ-որ մեկը աշխատում է դրա AI-ի լուծման վրա:

Generative AI-ն փոթորկի տակ է առնում աշխարհը, ի՞նչ կարծիքի եք այն մասին, թե որքան հեռու կարող են տանել արդյունաբերությունը լեզվական գեներատիվ մոդելները:

Այս մասին իմ անձնական կարծիքն այն է, որ գեներատիվ արհեստական ինտելեկտի իրական ուժի առանցքը – ես ընտրում եմ այստեղ բառերն օգտագործել, քան շեշտադրման հապավումը – բնական լեզվի ըմբռնումն է: AI-ի «խելացիությունը» սովորվում է լեզվի միջոցով. բարդ խնդիրներ լուծելու և ի վերջո լուծելու կարողությունը միջնորդավորված է կրկնվող և կուտակային բնական լեզվական փոխազդեցությունների միջոցով: Սա նկատի ունենալով, ես կարծում եմ, որ լեզվի գեներացնող մոդելները մինչև վերջ կհամապատասխանեն AI-ի այլ տարրերին:

Ո՞րն է ձեր տեսլականը AI-ի ապագայի և LXT-ի ապագայի համար:

Ես էությամբ լավատես եմ, և դա կնշանակի իմ արձագանքն այստեղ, բայց արհեստական ինտելեկտի ապագայի իմ տեսլականն այն է, որ այն բարելավի կյանքի որակը բոլորի համար. որպեսզի այն դարձնի մեր աշխարհն ավելի ապահով վայր, ավելի լավ վայր ապագա սերունդների համար: Միկրո մակարդակում LXT-ի իմ տեսլականն է՝ տեսնել, որ կազմակերպությունը շարունակում է հիմնվել իր ուժեղ կողմերի վրա, զարգանալ և դառնալ ընտրովի գործատու և լավ ուժ համաշխարհային հանրության համար, որը հնարավոր է դարձնում մեր բիզնեսը: Մակրո մակարդակում LXT-ի իմ տեսլականն է նշանակալից, բովանդակալից կերպով նպաստել արհեստական ինտելեկտի ապագայի վերաբերյալ իմ լավատեսորեն շեղված տեսլականի իրականացմանը:

Շնորհակալություն հիանալի հարցազրույցի համար, այն ընթերցողները, ովքեր ցանկանում են ավելին իմանալ, պետք է այցելեն LXT.