Արհեստական բանականություն
AI համակարգերը կարող են նախընտրել մարդկային լեզուն թվային տվյալների փոխարեն
Նոր հետազոտություն Columbia Engineering-ից ստացված եզրակացությունն այն է, որ արհեստական ինտելեկտի (AI) համակարգերը գերադասում են մարդկային լեզուն՝ թվային տվյալների փոխարեն, ինչպիսիք են 1-երը և 0-երը: Նոր հետազոտությունը մեխանիկական ճարտարագիտության պրոֆեսոր Հոդ Լիփսոնի և ասպիրանտ Բոյուան Չենի կողմից է, և այն ցույց է տվել, որ AI համակարգերը կարող են հասնել ավելի բարձր կատարողականության, եթե ծրագրավորվեն մարդկային լեզվով ձայնային ֆայլերով:
Կողք կողքի համեմատության ընթացքում հետազոտողները պարզեցին, որ ձայնային ֆայլերով վարժեցված նեյրոնային ցանցը հասել է ավելի բարձր արդյունավետության մակարդակի օբյեկտների նույնականացման հարցում՝ համեմատած պարզ երկուական մուտքերով ծրագրավորված մյուս ցանցի հետ:
Լիփսոնը Ջեյմս և Սալի Սքապաների նորարարության պրոֆեսոր է և Կոլումբիայի տվյալների գիտության ինստիտուտի անդամ:
«Որպեսզի հասկանանք, թե ինչու է այս բացահայտումը նշանակալից, օգտակար է հասկանալ, թե ինչպես են սովորաբար ծրագրավորում նեյրոնային ցանցերը, և ինչու է մարդու ձայնի ձայնի օգտագործումը արմատական փորձարկում», - ասաց նա:
Երկուական թվերի օգտագործումը կոմպակտ և ճշգրիտ է, մինչդեռ մարդկային լեզուն ավելի բարդ է և ոչ երկուական, երբ գրավված է թվային ֆայլում: Ծրագրավորողները սովորաբար չեն շեղվում թվերից նեյրոնային ցանց մշակելիս, քանի որ այն շատ արդյունավետ է:
Թիմը ձեռնամուխ եղավ այս հետազոտությանը այն բանից հետո, երբ մտածեց, որ նեյրոնային ցանցերը չեն հասնում իրենց ողջ ներուժին, և նրանք հավատում էին, որ դրանք կարող են ավելի արագ և ավելի լավ լինել, եթե վարժվեն մարդկային ձայնով և կոնկրետ բառերով:
Ցանցերի ուսուցում
Մեքենայական ուսուցման նոր տեխնիկան փորձարկելիս AI հետազոտողները հաճախ վարժեցնում են նեյրոնային ցանցը՝ լուսանկարների հավաքածուում հատուկ առարկաներ և կենդանիներ ճանաչելու համար:
Թիմը, որի կազմում էին Չենը, Լիփսոնը, Յու Լին և Սյուզան Ռագուպատին, վերահսկվող փորձ կատարեցին՝ ստուգելու իրենց վարկածը, և նրանք ստեղծեցին երկու նոր նեյրոնային ցանցեր: Նրանք ձեռնամուխ եղան նրանց սովորեցնել ճանաչել 10 տարբեր տեսակի առարկաներ 50,000 լուսանկարներից, որոնք կոչվում են «ուսուցողական պատկերներ»:
AI համակարգերից մեկը վերապատրաստվել է ավելի ավանդական եղանակով՝ թվային արժեքներով, մինչդեռ փորձարարական նեյրոնային ցանցը վերապատրաստվել է շատ այլ կերպ: Այն սնվում էր տվյալների աղյուսակով՝ կենդանու կամ առարկայի լուսանկար պարունակող տողերով, իսկ երկրորդ սյունակում մարդու ձայնային աուդիո ֆայլ էր, որը հնչյունավորում էր կենդանու կամ առարկայի բառը: Փորձարարական ցանցում 1 կամ 0 չկար:
AI երկու համակարգերն էլ վերապատրաստվել են ընդհանուր առմամբ 15 ժամ: Արդյունքները ցույց տվեցին, որ սկզբնական ցանցը պատասխանում էր տասը 1-ի և 0-ի շարքով, մինչդեռ փորձարարական նեյրոնային ցանցն արտադրում էր ձայն, որը հստակ փորձում էր «ասել», թե որն է պատկերի առարկան: Թեև սկզբնական ձայնը հասկանալի չէր, այն ի վերջո հասավ այն կետին, որ հիմնականում ճիշտ էր:
Երկու ցանցերը հավասարապես լավ գործեցին՝ ժամանակի 92%-ում ճիշտ նույնացնելով կենդանուն կամ առարկան: Հետազոտողները այնուհետև որոշեցին երկրորդ անգամ անցկացնել փորձը, սակայն այս անգամ ավելի քիչ լուսանկարներ օգտագործեցին այդ ընթացքում:
Ավանդական ցանցը վատ է աշխատել պահեստային տվյալների պատճառով, ինչպես և սպասվում էր, իջնելով մոտ 35% ճշգրտությամբ: Այնուամենայնիվ, փորձարարական ցանցը երկու անգամ ավելի լավ արեց՝ 70% ճշգրտությամբ, չնայած ավելի քիչ տվյալներ ուներ:
Զարմանալի արդյունքներ
Հաջորդ անգամ դուրս գալը թիմն օգտագործել է ավելի բարդ պատկերներ, օրինակ՝ շան կոռումպացված պատկեր: Նույնիսկ ավելի կոշտ պատկերների դեպքում ձայնով պատրաստված նեյրոնային ցանցը ճիշտ էր մոտ 50%-ով, մինչդեռ ավանդական ցանցը ճշգրիտ էր միայն 20%-ով:
Բոյուան Չենը հետազոտության առաջատար հետազոտողն է:
«Մեր բացահայտումները ուղղակիորեն հակասում են այն բանին, թե քանի փորձագետ է վերապատրաստվել համակարգիչների և թվերի մասին մտածելու համար. սովորական ենթադրություն է, որ երկուական մուտքերն ավելի արդյունավետ միջոց են տեղեկատվություն մեքենային փոխանցելու համար, քան նմանատիպ տեղեկատվության «հարստության» ձայնային հոսքերը», - բացատրեց Չենը: «Իրականում, երբ մենք այս հետազոտությունը ներկայացրինք արհեստական ինտելեկտի մեծ կոնֆերանսի, անանուն գրախոսներից մեկը մերժեց մեր հոդվածը պարզապես այն պատճառով, որ նրանք կարծում էին, որ մեր արդյունքները պարզապես «չափազանց զարմանալի և ոչ ինտուիտիվ էին»:
«Եթե դուք մտածում եք այն մասին, որ մարդկային լեզուն տասնյակ հազարավոր տարիներ անցել է օպտիմալացման գործընթացի միջով, ապա լիովին խելամիտ է, որ մեր ասված բառերը լավ հավասարակշռություն են գտել աղմուկի և ազդանշանի միջև», - ասաց Լիփսոնը: «Հետևաբար, երբ դիտարկվում է Շենոն Էնտրոպիայի ոսպնյակի միջոցով, տրամաբանական է, որ մարդկային լեզվով վարժեցված նեյրոնային ցանցը գերազանցում է պարզ 1-երով և 0-երով վարժեցված նեյրոնային ցանցին»:
Ուսումնասիրությունը կներկայացվի 3 թվականի մայիսի 2021-ին «Ուսուցման ներկայացումների միջազգային կոնֆերանսում»:
«Մենք պետք է մտածենք արհեստական ինտելեկտի համակարգերի վերապատրաստման նոր և ավելի լավ ուղիներ օգտագործելու մասին՝ ավելի մեծ տվյալների հավաքածուներ հավաքելու փոխարեն», - ասաց Չենը: «Եթե մենք վերանայենք, թե ինչպես ենք մենք վերապատրաստման տվյալները ներկայացնում մեքենային, մենք կարող ենք ավելի լավ աշխատանք կատարել որպես ուսուցիչներ»:
«Մարդկային էվոլյուցիայի ամենամեծ առեղծվածներից մեկն այն է, թե ինչպես են մեր նախնիները լեզուն ձեռք բերել, և ինչպես են երեխաները սովորում այդքան առանց ջանքերի խոսել», - ավելացնում է Լիփսոնը: «Եթե մարդկային փոքրիկները լավագույնս սովորում են կրկնվող խոսակցական ցուցումներով, ապա միգուցե AI համակարգերը նույնպես կարող են»: