Արհեստական բանականություն

AI համակարգերը կարող են նախընտրել մարդկային լեզուն թվային տվյալների փոխարեն

Թարմացվել է on Դեկտեմբերի 9, 2022

Նոր հետազոտություն Columbia Engineering-ից ստացված եզրակացությունն այն է, որ արհեստական ինտելեկտի (AI) համակարգերը գերադասում են մարդկային լեզուն՝ թվային տվյալների փոխարեն, ինչպիսիք են 1-երը և 0-երը: Նոր հետազոտությունը մեխանիկական ճարտարագիտության պրոֆեսոր Հոդ Լիփսոնի և ասպիրանտ Բոյուան Չենի կողմից է, և այն ցույց է տվել, որ AI համակարգերը կարող են հասնել ավելի բարձր կատարողականության, եթե ծրագրավորվեն մարդկային լեզվով ձայնային ֆայլերով:

Կողք կողքի համեմատության ընթացքում հետազոտողները պարզեցին, որ ձայնային ֆայլերով վարժեցված նեյրոնային ցանցը հասել է ավելի բարձր արդյունավետության մակարդակի օբյեկտների նույնականացման հարցում՝ համեմատած պարզ երկուական մուտքերով ծրագրավորված մյուս ցանցի հետ:

Լիփսոնը Ջեյմս և Սալի Սքապաների նորարարության պրոֆեսոր է և Կոլումբիայի տվյալների գիտության ինստիտուտի անդամ:

«Որպեսզի հասկանանք, թե ինչու է այս բացահայտումը նշանակալից, օգտակար է հասկանալ, թե ինչպես են սովորաբար ծրագրավորում նեյրոնային ցանցերը, և ինչու է մարդու ձայնի ձայնի օգտագործումը արմատական փորձարկում», - ասաց նա:

Երկուական թվերի օգտագործումը կոմպակտ և ճշգրիտ է, մինչդեռ մարդկային լեզուն ավելի բարդ է և ոչ երկուական, երբ գրավված է թվային ֆայլում: Ծրագրավորողները սովորաբար չեն շեղվում թվերից նեյրոնային ցանց մշակելիս, քանի որ այն շատ արդյունավետ է:

Թիմը ձեռնամուխ եղավ այս հետազոտությանը այն բանից հետո, երբ մտածեց, որ նեյրոնային ցանցերը չեն հասնում իրենց ողջ ներուժին, և նրանք հավատում էին, որ դրանք կարող են ավելի արագ և ավելի լավ լինել, եթե վարժվեն մարդկային ձայնով և կոնկրետ բառերով:

Ցանցերի ուսուցում

Մեքենայական ուսուցման նոր տեխնիկան փորձարկելիս AI հետազոտողները հաճախ վարժեցնում են նեյրոնային ցանցը՝ լուսանկարների հավաքածուում հատուկ առարկաներ և կենդանիներ ճանաչելու համար:

Թիմը, որի կազմում էին Չենը, Լիփսոնը, Յու Լին և Սյուզան Ռագուպատին, վերահսկվող փորձ կատարեցին՝ ստուգելու իրենց վարկածը, և նրանք ստեղծեցին երկու նոր նեյրոնային ցանցեր: Նրանք ձեռնամուխ եղան նրանց սովորեցնել ճանաչել 10 տարբեր տեսակի առարկաներ 50,000 լուսանկարներից, որոնք կոչվում են «ուսուցողական պատկերներ»:

AI համակարգերից մեկը վերապատրաստվել է ավելի ավանդական եղանակով՝ թվային արժեքներով, մինչդեռ փորձարարական նեյրոնային ցանցը վերապատրաստվել է շատ այլ կերպ: Այն սնվում էր տվյալների աղյուսակով՝ կենդանու կամ առարկայի լուսանկար պարունակող տողերով, իսկ երկրորդ սյունակում մարդու ձայնային աուդիո ֆայլ էր, որը հնչյունավորում էր կենդանու կամ առարկայի բառը: Փորձարարական ցանցում 1 կամ 0 չկար:

AI երկու համակարգերն էլ վերապատրաստվել են ընդհանուր առմամբ 15 ժամ: Արդյունքները ցույց տվեցին, որ սկզբնական ցանցը պատասխանում էր տասը 1-ի և 0-ի շարքով, մինչդեռ փորձարարական նեյրոնային ցանցն արտադրում էր ձայն, որը հստակ փորձում էր «ասել», թե որն է պատկերի առարկան: Թեև սկզբնական ձայնը հասկանալի չէր, այն ի վերջո հասավ այն կետին, որ հիմնականում ճիշտ էր:

Երկու ցանցերը հավասարապես լավ գործեցին՝ ժամանակի 92%-ում ճիշտ նույնացնելով կենդանուն կամ առարկան: Հետազոտողները այնուհետև որոշեցին երկրորդ անգամ անցկացնել փորձը, սակայն այս անգամ ավելի քիչ լուսանկարներ օգտագործեցին այդ ընթացքում:

Ավանդական ցանցը վատ է աշխատել պահեստային տվյալների պատճառով, ինչպես և սպասվում էր, իջնելով մոտ 35% ճշգրտությամբ: Այնուամենայնիվ, փորձարարական ցանցը երկու անգամ ավելի լավ արեց՝ 70% ճշգրտությամբ, չնայած ավելի քիչ տվյալներ ուներ:

Զարմանալի արդյունքներ

Հաջորդ անգամ դուրս գալը թիմն օգտագործել է ավելի բարդ պատկերներ, օրինակ՝ շան կոռումպացված պատկեր: Նույնիսկ ավելի կոշտ պատկերների դեպքում ձայնով պատրաստված նեյրոնային ցանցը ճիշտ էր մոտ 50%-ով, մինչդեռ ավանդական ցանցը ճշգրիտ էր միայն 20%-ով:

Բոյուան Չենը հետազոտության առաջատար հետազոտողն է:

«Մեր բացահայտումները ուղղակիորեն հակասում են այն բանին, թե քանի փորձագետ է վերապատրաստվել համակարգիչների և թվերի մասին մտածելու համար. սովորական ենթադրություն է, որ երկուական մուտքերն ավելի արդյունավետ միջոց են տեղեկատվություն մեքենային փոխանցելու համար, քան նմանատիպ տեղեկատվության «հարստության» ձայնային հոսքերը», - բացատրեց Չենը: «Իրականում, երբ մենք այս հետազոտությունը ներկայացրինք արհեստական ինտելեկտի մեծ կոնֆերանսի, անանուն գրախոսներից մեկը մերժեց մեր հոդվածը պարզապես այն պատճառով, որ նրանք կարծում էին, որ մեր արդյունքները պարզապես «չափազանց զարմանալի և ոչ ինտուիտիվ էին»:

«Եթե դուք մտածում եք այն մասին, որ մարդկային լեզուն տասնյակ հազարավոր տարիներ անցել է օպտիմալացման գործընթացի միջով, ապա լիովին խելամիտ է, որ մեր ասված բառերը լավ հավասարակշռություն են գտել աղմուկի և ազդանշանի միջև», - ասաց Լիփսոնը: «Հետևաբար, երբ դիտարկվում է Շենոն Էնտրոպիայի ոսպնյակի միջոցով, տրամաբանական է, որ մարդկային լեզվով վարժեցված նեյրոնային ցանցը գերազանցում է պարզ 1-երով և 0-երով վարժեցված նեյրոնային ցանցին»:

Ուսումնասիրությունը կներկայացվի 3 թվականի մայիսի 2021-ին «Ուսուցման ներկայացումների միջազգային կոնֆերանսում»:

«Մենք պետք է մտածենք արհեստական ինտելեկտի համակարգերի վերապատրաստման նոր և ավելի լավ ուղիներ օգտագործելու մասին՝ ավելի մեծ տվյալների հավաքածուներ հավաքելու փոխարեն», - ասաց Չենը: «Եթե մենք վերանայենք, թե ինչպես ենք մենք վերապատրաստման տվյալները ներկայացնում մեքենային, մենք կարող ենք ավելի լավ աշխատանք կատարել որպես ուսուցիչներ»:

«Մարդկային էվոլյուցիայի ամենամեծ առեղծվածներից մեկն այն է, թե ինչպես են մեր նախնիները լեզուն ձեռք բերել, և ինչպես են երեխաները սովորում այդքան առանց ջանքերի խոսել», - ավելացնում է Լիփսոնը: «Եթե մարդկային փոքրիկները լավագույնս սովորում են կրկնվող խոսակցական ցուցումներով, ապա միգուցե AI համակարգերը նույնպես կարող են»:

Հարակից թեմաներ.AI Արհեստական բանականություն Արհեստական նյարդային ցանցեր

Հաջորդը

Pexip-ը համագործակցում է NVIDIA-ի հետ՝ ստեղծելու վիդեո հանդիպումների համընկնող փորձառություններ

Բաց մի թողեք

Habana Labs AI արագացուցիչները կօգտագործվեն Voyager սուպերհամակարգչում

Ալեքս Մաքֆարլանդ

Ալեքս Մաքֆարլանդը արհեստական ինտելեկտի լրագրող և գրող է, ով ուսումնասիրում է արհեստական բանականության վերջին զարգացումները: Նա համագործակցել է արհեստական ինտելեկտի բազմաթիվ ստարտափների և հրատարակությունների հետ ամբողջ աշխարհում: