քոթուկ Ի՞նչ է Few-Shot Learning-ը: - Միացեք.AI
Միացեք մեզ
AI Masterclass.

AI 101 թ

Ի՞նչ է Few-Shot Learning-ը:

mm
Թարմացվել է on

Few-shot ուսուցումը վերաբերում է մի շարք ալգորիթմների և տեխնիկայի, որոնք օգտագործվում են AI մոդելի մշակման համար՝ օգտագործելով շատ փոքր քանակությամբ վերապատրաստման տվյալներ: Քիչ ուսուցումը փորձում է թույլ տալ, որ AI մոդելը ճանաչի և դասակարգի նոր տվյալները՝ համեմատաբար քիչ վերապատրաստման դեպքերի ենթարկվելուց հետո: Քիչ կրակոցների ուսուցումը հակադրվում է մեքենայական ուսուցման մոդելների ուսուցման ավանդական մեթոդներին, որտեղ սովորաբար օգտագործվում են մեծ քանակությամբ վերապատրաստման տվյալներ: Քիչ ուսուցում է օգտագործվում է հիմնականում համակարգչային տեսողության մեջ:

Ավելի լավ ինտուիցիա զարգացնելու համար մի քանի կրակոցներով սովորելու համար եկեք ավելի մանրամասն քննարկենք հայեցակարգը: Մենք կուսումնասիրենք մի քանի կրակոցներով ուսուցման հիմքում ընկած շարժառիթներն ու հասկացությունները, կուսումնասիրենք մի քանի կրակոցներով ուսուցման որոշ տեսակներ և կներառենք որոշ մոդելներ, որոնք օգտագործվում են բարձր մակարդակով մի քանի կրակոցներով ուսուցման մեջ: Ի վերջո, մենք կքննարկենք մի քանի կիրառական կիրառություններ մի քանի կրակոցների ուսուցման համար:

Ի՞նչ է Few-Shot Learning-ը:

«Few-shot ուսուցումը» նկարագրում է մեքենայական ուսուցման մոդելի ուսուցման պրակտիկան նվազագույն քանակությամբ տվյալների հետ: Սովորաբար, մեքենայական ուսուցման մոդելները վերապատրաստվում են մեծ ծավալի տվյալների վրա, որքան մեծ, այնքան լավ: Այնուամենայնիվ, մի քանի կրակոցի ուսուցումը կարևոր մեքենայական ուսուցման հայեցակարգ է մի քանի տարբեր պատճառներով:

Քիչ կրակոցների ուսուցումն օգտագործելու պատճառներից մեկն այն է, որ այն կարող է կտրուկ կրճատել մեքենայական ուսուցման մոդելը վարժեցնելու համար անհրաժեշտ տվյալների քանակը, ինչը կրճատում է տվյալների մեծ հավաքածուները պիտակավորելու համար անհրաժեշտ ժամանակը: Նմանապես, մի ​​քանի կրակոցների ուսուցումը նվազեցնում է տարբեր առաջադրանքների համար հատուկ առանձնահատկություններ ավելացնելու անհրաժեշտությունը, երբ օգտագործվում է ընդհանուր տվյալների բազա տարբեր նմուշներ ստեղծելու համար: Քիչ ուսուցումը կարող է իդեալականորեն մոդելները դարձնել ավելի ամուր և ունակ ճանաչել օբյեկտների վրա հիմնված ավելի քիչ տվյալների վրա՝ ստեղծելով ավելի ընդհանուր մոդելներ՝ ի տարբերություն բարձր մասնագիտացված մոդելների, որոնք նորմ են:

Քիչ ուսուցումն առավել հաճախ օգտագործվում է համակարգչային տեսողության ոլորտում, քանի որ համակարգչային տեսողության խնդիրների բնույթը պահանջում է կամ մեծ ծավալի տվյալներ կամ ճկուն մոդել:

Ենթակատեգորիաներ

«Քիչ կրակոցներով» ուսուցում արտահայտությունն իրականում ուսուցման ընդամենը մեկ տեսակ է, օգտագործելով շատ քիչ ուսուցման օրինակներ: Քանի որ դուք օգտագործում եք ընդամենը «մի քանի» ուսուցման օրինակներ, կան մի քանի կրակոցների ուսուցման ենթակատեգորիաներ, որոնք ներառում են նաև տվյալների նվազագույն քանակով ուսուցում: «Մեկ կրակոցով» ուսուցումը մոդելային ուսուցման մեկ այլ տեսակ է, որը ներառում է մոդելին սովորեցնել ճանաչել օբյեկտը այդ օբյեկտի միայն մեկ պատկերը տեսնելուց հետո: Ընդհանուր մարտավարությունը, որն օգտագործվում է մեկ կրակոց ուսուցման և մի քանի կրակոց ուսուցման ժամանակ, նույնն է: Ուշադիր եղեք, որ «մի քանի կրակոց» տերմինը կարող է օգտագործվել որպես համապարփակ տերմին՝ նկարագրելու ցանկացած իրավիճակ, երբ մոդելը վերապատրաստվում է շատ քիչ տվյալների հետ:

Մոտեցումներ քիչ կրակոց ուսուցման համար

Քիչ ուսուցման մոտեցումների մեծ մասը կարող է տեղավորվել երեք կատեգորիաներից մեկում՝ տվյալների մակարդակի մոտեցումներ, պարամետրային մակարդակի մոտեցումներ և չափումների վրա հիմնված մոտեցումներ:

Տվյալների մակարդակի մոտեցումներ

Տվյալների մակարդակի մոտեցումները մի քանի կրակոցներով ուսուցման հայեցակարգով շատ պարզ են: Որպեսզի վերապատրաստեք մոդել, երբ դուք չունեք բավարար ուսուցման տվյալներ, կարող եք պարզապես ստանալ ավելի շատ ուսուցման տվյալներ: Կան տարբեր մեթոդներ, որոնք տվյալների գիտնականները կարող են օգտագործել՝ մեծացնելու իրենց ունեցած վերապատրաստման տվյալների քանակը:

Նմանատիպ ուսումնական տվյալները կարող են կրկնօրինակել ճշգրիտ թիրախային տվյալները, որոնց վրա դասակարգիչ եք պատրաստում: Օրինակ, եթե դասակարգիչ եք վարժեցնում՝ ճանաչելու հատուկ շների տեսակները, բայց չունեք այն կոնկրետ տեսակների բազմաթիվ պատկերներ, որոնք փորձում էիք դասակարգել, կարող եք ներառել շների բազմաթիվ պատկերներ, որոնք կօգնեն դասակարգչին որոշել շունը կազմող ընդհանուր հատկանիշները։ .

Տվյալների ավելացումը կարող է ավելի շատ ուսումնական տվյալներ ստեղծել դասակարգչի համար: Սա սովորաբար ներառում է փոխակերպումների կիրառում առկա ուսուցման տվյալների վրա, օրինակ՝ գոյություն ունեցող պատկերների պտտումը, որպեսզի դասակարգիչը ուսումնասիրի պատկերները տարբեր տեսանկյուններից: GAN-ները կարող են օգտագործվել նաև վերապատրաստման նոր օրինակներ ստեղծելու համար՝ հիմնվելով այն բանի վրա, ինչ նրանք սովորում են ձեր ունեցած վերապատրաստման տվյալների մի քանի վավերական օրինակներից:

Պարամետրային մակարդակի մոտեցումներ

Մետա-ուսուցում

Մի քանի պարամետրային ուսուցման մոտեցումներից մեկը ներառում է տեխնիկայի օգտագործումը, որը կոչվում է «մետա-ուսուցում»: Մետա-ուսուցումը ներառում է սովորեցնել մոդելին, թե ինչպես սովորել որ հատկանիշներն են կարևոր մեքենայական ուսուցման առաջադրանքում: Սա կարող է իրականացվել՝ ստեղծելով մեթոդ՝ կարգավորելու մոդելի պարամետրային տարածության ուսումնասիրությունը:

Մետա-ուսուցումն օգտագործում է երկու տարբեր մոդելներ՝ ուսուցչի մոդել և ուսանողի մոդել: «Ուսուցչի» մոդելը և «աշակերտի» մոդելը. Ուսուցչի մոդելը սովորում է, թե ինչպես ընդգրկել պարամետրերի տարածությունը, մինչդեռ ուսանողի ալգորիթմը սովորում է, թե ինչպես ճանաչել և դասակարգել տվյալների բազայի իրական տարրերը: Այլ կերպ ասած, ուսուցչի մոդելը սովորում է, թե ինչպես օպտիմալացնել մոդելը, մինչդեռ ուսանողի մոդելը սովորում է դասակարգել: Ուսուցչի մոդելի արդյունքներն օգտագործվում են աշակերտի մոդելին ուսուցանելու համար՝ ցույց տալով աշակերտի մոդելին, թե ինչպես պետք է կարգավորել մեծ պարամետրային տարածքը, որը ստացվում է վերապատրաստման չափազանց քիչ տվյալների արդյունքում: Այստեղից էլ «մետա»-ն մետա-ուսուցման մեջ:

Քիչ կրակոցներով ուսուցման մոդելների հիմնական խնդիրներից մեկն այն է, որ դրանք հեշտությամբ կարող են գերազանցել ուսուցման տվյալների վրա, քանի որ դրանք հաճախ ունենում են մեծաչափ տարածություններ: Մոդելի պարամետրային տարածության սահմանափակումը լուծում է այս խնդիրը, և թեև այն կարող է իրականացվել կանոնավորացման տեխնիկայի կիրառմամբ և կորստի ճիշտ գործառույթները ընտրելով, ուսուցչի ալգորիթմի օգտագործումը կարող է կտրուկ բարելավել մի քանի կրակոցների մոդելի կատարումը:

Մի քանի կրակոց ուսուցման դասակարգիչի մոդելը (աշակերտի մոդելը) կփորձի ընդհանրացնել՝ հիմնվելով իր տրամադրված ուսուցման փոքր քանակի տվյալների վրա, և դրա ճշգրտությունը կարող է բարելավվել ուսուցչի մոդելի միջոցով՝ այն ուղղորդելու բարձր ծավալային պարամետրային տարածության միջով: Այս ընդհանուր ճարտարապետությունը կոչվում է «գրադիենտի վրա հիմնված» մետա սովորող:

Գրադիենտի վրա հիմնված մետա սովորողի վերապատրաստման ամբողջական գործընթացը հետևյալն է.

  1. Ստեղծեք բազային-սովորող (ուսուցիչ) մոդելը
  2. Վարժեցրեք բազային սովորող մոդելը աջակցության հավաքածուի վրա
  3. Ունեցեք բազային սովորողի վերադարձի կանխատեսումներ հարցումների հավաքածուի համար
  4. Վերապատրաստեք մետասովորողին (աշակերտին) դասակարգման սխալից առաջացած կորստի մասին

Մետա-ուսուցման տատանումներ

Մոդել-ագնոստիկ մետա-ուսուցում մեթոդ է, որն օգտագործվում է ընդլայնելու հիմնական գրադիենտի վրա հիմնված մետա-ուսուցման տեխնիկան, որը մենք անդրադարձել ենք վերևում:

Ինչպես վերը նկարագրեցինք, գրադիենտի վրա հիմնված մետա-սովորողը օգտագործում է ուսուցչի մոդելի ձեռք բերած նախկին փորձը ինքն իրեն լավ կարգավորելու համար և ավելի ճշգրիտ կանխատեսումներ տալ վերապատրաստման փոքր քանակությամբ տվյալների համար: Այնուամենայնիվ, պատահականորեն սկզբնավորվող պարամետրերից սկսելը նշանակում է, որ մոդելը դեռ կարող է պոտենցիալ չափից ավելի տեղավորել տվյալները: Սրանից խուսափելու համար ստեղծվում է «Model-agnostic» մետասովորող՝ սահմանափակելով ուսուցչի մոդելի/բազային մոդելի ազդեցությունը: Ուսուցչի մոդելի կողմից արված կանխատեսումների համար աշակերտի մոդելն ուղղակիորեն կորստի վրա վարժեցնելու փոխարեն, ուսանողի մոդելը վերապատրաստվում է կորստի վրա՝ սեփական կանխատեսումների համար:

Մոդել-ագնոստիկ մետա սովորողի վերապատրաստման յուրաքանչյուր դրվագի համար.

  1. Ստեղծվում է ընթացիկ մետա-սովորող մոդելի պատճենը:
  2. Պատճենը վերապատրաստվում է բազային մոդելի/ուսուցչի մոդելի օգնությամբ:
  3. Պատճենը վերադարձնում է վերապատրաստման տվյալների կանխատեսումներ:
  4. Հաշվարկված կորուստն օգտագործվում է մետա սովորողի թարմացման համար:

Մետրիկա-Ուսուցում

Մի քանի կրակոց ուսուցման մոդելի նախագծման մետրային ուսուցման մոտեցումներ սովորաբար ներառում է որ հեռավորության հիմնական չափումների օգտագործումը տվյալների հավաքածուի նմուշների միջև համեմատություններ կատարելու համար: Մետրիկական ուսուցման ալգորիթմները, ինչպիսիք են կոսինուսային հեռավորությունը, օգտագործվում են հարցումների նմուշները դասակարգելու համար՝ հիմնվելով օժանդակ նմուշների հետ դրանց նմանության վրա: Պատկերների դասակարգչի համար դա կնշանակի պարզապես պատկերների դասակարգում` հիմնված մակերեսային բնութագրերի նմանության վրա: Այն բանից հետո, երբ ընտրվում է պատկերների օժանդակ հավաքածու և վերածվում ներկառուցվող վեկտորի, նույնն արվում է հարցումների հավաքածուի հետ, այնուհետև համեմատվում են երկու վեկտորների արժեքները, դասակարգիչը ընտրելով այն դասը, որն ունի ամենամոտ արժեքները վեկտորացված հարցումների հավաքածուին: .

Մետրիկայի վրա հիմնված ավելի առաջադեմ լուծումը «նախատիպային ցանց»: Նախատիպային ցանցերը միավորում են տվյալների կետերը՝ միավորելով կլաստերավորման մոդելները վերը նկարագրված մետրային վրա հիմնված դասակարգման հետ: Ինչպես K-means կլաստերավորման դեպքում, ցենտրոիդները կլաստերների համար հաշվարկվում են աջակցության և հարցումների հավաքածուների դասերի համար: Այնուհետև կիրառվում է էվկլիդեսյան հեռավորության չափիչ՝ հարցումների հավաքածուների և աջակցության բազմության կենտրոնների միջև տարբերությունը որոշելու համար՝ հարցման հավաքածուն վերագրելով աջակցող խմբի դասերին, որոնք ավելի մոտ են:

Մի քանի այլ ուսուցման մոտեցումների մեծ մասը պարզապես վերը նշված հիմնական տեխնիկայի տատանումներ են:

Դիմումներ Few-Shot Learning-ի համար

Few-shot ուսուցումը կիրառություն ունի տվյալների գիտության բազմաթիվ տարբեր ենթաոլորտներում, ինչպիսիք են համակարգչային տեսլականը, բնական լեզվի մշակումը, ռոբոտաշինությունը, առողջապահությունը և ազդանշանների մշակումը:

Համակարգչային տեսողության տարածքում մի քանի կրակոցների ուսուցման կիրառությունները ներառում են նիշերի արդյունավետ ճանաչում, պատկերների դասակարգում, օբյեկտների ճանաչում, օբյեկտների հետևում, շարժման կանխատեսում և գործողությունների տեղայնացում: Բնական լեզվի մշակման հավելվածները մի քանի կրակոցներով ուսուցման համար ներառում են թարգմանությունը, նախադասության ավարտը, օգտագործողի մտադրության դասակարգումը, զգացմունքների վերլուծությունը և տեքստի բազմաբնույթ դասակարգումը: Քիչ ուսուցումը կարող է օգտագործվել ռոբոտաշինության ոլորտում՝ օգնելու ռոբոտներին սովորել առաջադրանքների մասին ընդամենը մի քանի ցուցադրությունից՝ թույլ տալով ռոբոտներին սովորել, թե ինչպես կատարել գործողություններ, շարժվել և նավարկել իրենց շուրջը գտնվող աշխարհով: Թմրամիջոցների մի քանի կրակոցների հայտնաբերումը արհեստական ​​ինտելեկտի առողջապահության նոր ոլորտ է: Վերջապես, մի ​​քանի կրակոցների ուսուցումն ունի ակուստիկ ազդանշանի մշակման հավելվածներ, որոնք ձայնային տվյալների վերլուծության գործընթացն են՝ թույլ տալով, որ AI համակարգերը կլոնավորեն ձայները՝ հիմնված ընդամենը մի քանի օգտատերերի նմուշների կամ ձայնի փոխակերպման վրա մեկ օգտագործողից մյուսին:

Բլոգեր և ծրագրավորող մասնագիտություններով Machine Learning և Խորը ուսուցում թեմաներ. Դանիելը հույս ունի օգնել ուրիշներին օգտագործել AI-ի ուժը սոցիալական բարօրության համար: