քոթուկ Ի՞նչ է խորը ուսուցումը: (2024) - Unite.AI
Միացեք մեզ
AI Masterclass.

AI 101 թ

Ի՞նչ է խորը ուսուցումը:

mm
Թարմացվել է on

Խորը ուսուցումը արհեստական ​​բանականության ամենաազդեցիկ և ամենաարագ զարգացող ոլորտներից մեկն է: Այնուամենայնիվ, խորը ուսուցման ինտուիտիվ ըմբռնումը կարող է դժվար լինել, քանի որ խորը ուսուցում տերմինը ներառում է մի շարք տարբեր ալգորիթմներ և տեխնիկա: Խորը ուսուցումը նաև ընդհանուր առմամբ մեքենայական ուսուցման ենթաճյուղ է, ուստի կարևոր է հասկանալ, թե ինչ է մեքենայական ուսուցումը, որպեսզի հասկանանք խորը ուսուցումը:

Ի՞նչ է մեքենաշինությունը

Խորը ուսուցում մեքենայական ուսուցումից բխող որոշ հասկացությունների ընդլայնումն է, ուստի այդ պատճառով եկեք մեկ րոպե տրամադրենք բացատրելու, թե ինչ է մեքենայական ուսուցումը:

Պարզ ասած, մեքենայական ուսուցումը համակարգիչներին հնարավորություն է տալիս կատարել կոնկրետ առաջադրանքներ՝ առանց այդ առաջադրանքները կատարելու համար օգտագործվող ալգորիթմների յուրաքանչյուր տողի հստակ կոդավորման: Կան բազմաթիվ տարբեր մեքենայական ուսուցման ալգորիթմներ, բայց ամենից հաճախ օգտագործվող ալգորիթմներից մեկը ա բազմաշերտ պերցեպտրոն. Բազմաշերտ պերցեպտրոնը նաև կոչվում է նեյրոնային ցանց, և այն բաղկացած է մի շարք հանգույցներից/նեյրոններից՝ կապված միմյանց հետ: Բազմաշերտ պերցեպտրոնում կան երեք տարբեր շերտեր՝ մուտքային շերտ, թաքնված շերտ և ելքային շերտ:

Մուտքային շերտը տվյալները տանում է ցանց, որտեղ դրանք շահագործվում են միջին/թաքնված շերտի հանգույցների կողմից: Թաքնված շերտի հանգույցները մաթեմատիկական ֆունկցիաներ են, որոնք կարող են շահարկել մուտքային շերտից եկող տվյալները՝ մուտքային տվյալներից համապատասխան օրինաչափություններ հանելով։ Այսպես է «սովորում» նեյրոնային ցանցը։ Նյարդային ցանցերն իրենց անվանումը ստացել են նրանից, որ դրանք ոգեշնչված են մարդու ուղեղի կառուցվածքով և գործառույթներով:

Ցանցի հանգույցների միջև կապերն ունեն արժեքներ, որոնք կոչվում են կշիռներ: Այս արժեքները, ըստ էության, ենթադրություններ են այն մասին, թե ինչպես են մի շերտի տվյալները կապված հաջորդ շերտի տվյալների հետ: Ցանցի մարզումների ընթացքում կշիռները ճշգրտվում են, և նպատակն այն է, որ տվյալների վերաբերյալ կշիռները/ենթադրությունները, ի վերջո, համընկնեն արժեքների վրա, որոնք ճշգրիտ կերպով ներկայացնում են տվյալների մեջ իմաստալից օրինաչափությունները:

Ակտիվացման գործառույթները առկա են ցանցի հանգույցներում, և այդ ակտիվացման գործառույթները փոխակերպում են տվյալները ոչ գծային ձևով, ինչը հնարավորություն է տալիս ցանցին սովորել տվյալների բարդ ներկայացում: Ակտիվացման գործառույթները բազմապատկում են մուտքային արժեքները քաշի արժեքներով և ավելացնում կողմնակալության տերմին:

Ի՞նչ է խորը ուսուցումը:

Խորը ուսուցումն այն տերմինն է, որը տրված է մեքենայական ուսուցման ճարտարապետություններին, որոնք միացնում են բազմաթիվ բազմաշերտ պերցեպտրոններ, այնպես որ կա ոչ միայն մեկ թաքնված շերտ, այլ շատ թաքնված շերտեր: Որքան «խորը» է խորը նեյրոնային ցանցը, այնքան ավելի բարդ օրինաչափություններ կարող է սովորել ցանցը:

Նեյրոններից կազմված խորը շերտերի ցանցերը երբեմն կոչվում են ամբողջությամբ միացված ցանցեր կամ լիովին միացված շերտեր՝ հղում անելով այն փաստին, որ տվյալ նեյրոնը կապ է պահպանում իրեն շրջապատող բոլոր նեյրոնների հետ: Լիովին միացված ցանցերը կարող են համակցվել մեքենայական ուսուցման այլ գործառույթների հետ՝ ստեղծելու խորը ուսուցման տարբեր ճարտարապետություններ:

Խորը ուսուցման տարբեր տեսակներ

Կան մի շարք խորը ուսուցման ճարտարապետություններ, որոնք օգտագործվում են հետազոտողների և ինժեներների կողմից, և տարբեր ճարտարապետություններից յուրաքանչյուրն ունի իր հատուկ օգտագործման դեպքը:

Convolutional նյարդային ցանցեր

Կոնվոլյուցիոն նեյրոնային ցանցեր, կամ CNN-ները նեյրոնային ցանցի ճարտարապետությունն են, որը սովորաբար օգտագործվում է համակարգչային տեսողության համակարգերի ստեղծման ժամանակ։ Կովոլյուցիոն նեյրոնային ցանցերի կառուցվածքը նրանց հնարավորություն է տալիս մեկնաբանել պատկերի տվյալները՝ դրանք վերածելով թվերի, որոնք լիովին միացված ցանցը կարող է մեկնաբանել: CNN-ն ունի չորս հիմնական բաղադրիչ.

  • Կոնվոլյուցիոն շերտեր
  • Ենթանմուշառում/շերտերի միավորում
  • Ակտիվացման գործառույթներ
  • Լիովին միացված շերտեր

Կովոլյուցիոն շերտերն այն են, ինչ պատկերներն ընդունում են որպես մուտքեր ցանց՝ վերլուծելով պատկերները և ստանալով պիքսելների արժեքները: Ենթամեկուսիչը կամ միավորումն այն է, որտեղ պատկերի արժեքները փոխարկվում/նվազեցնում են՝ պարզեցնելու պատկերների ներկայացումը և նվազեցնելու պատկերի զտիչների զգայունությունը աղմուկի նկատմամբ: Ակտիվացման գործառույթները վերահսկում են, թե ինչպես են տվյալները հոսում մի շերտից հաջորդ շերտ, և ամբողջությամբ միացված շերտերն են, որոնք վերլուծում են պատկերը ներկայացնող արժեքները և սովորում այդ արժեքներում պահվող օրինաչափությունները:

RNN/LSTMs

Կրկնվող նեյրոնային ցանցեր, կամ RNN-ները տարածված են այն առաջադրանքների համար, որտեղ կարևոր է տվյալների կարգը, որտեղ ցանցը պետք է իմանա տվյալների հաջորդականության մասին: RNN-ները սովորաբար կիրառվում են այնպիսի խնդիրների համար, ինչպիսիք են բնական լեզվի մշակումը, քանի որ բառերի հերթականությունը կարևոր է նախադասության իմաստը վերծանելիս: Հերթական նեյրոնային ցանց տերմինի «հերթական» մասը գալիս է նրանից, որ տվյալ տարրի ելքը հաջորդականությամբ կախված է նախորդ հաշվարկից, ինչպես նաև ընթացիկ հաշվարկից: Ի տարբերություն խորը նեյրոնային ցանցերի այլ ձևերի, RNN-ներն ունեն «հիշողություններ», և հաջորդականության տարբեր ժամանակային քայլերում հաշվարկված տեղեկատվությունը օգտագործվում է վերջնական արժեքները հաշվարկելու համար:

Գոյություն ունեն RNN-ների մի քանի տեսակներ, ներառյալ երկկողմանի RNN-ները, որոնք ապրանքի արժեքը հաշվարկելիս հաշվի են առնում ապագա տարրերը հաջորդականությամբ, բացի նախորդ կետերից: RNN-ի մեկ այլ տեսակ ա Երկար կարճաժամկետ հիշողություն կամ LSTM, ցանց. LSTM-ները RNN-ի տեսակներ են, որոնք կարող են մշակել տվյալների երկար շղթաներ: Սովորական RNN-ները կարող են զոհ դառնալ մի բանի, որը կոչվում է «պայթող գրադիենտ խնդիր»: Այս խնդիրն առաջանում է, երբ մուտքային տվյալների շղթան չափազանց երկար է դառնում, սակայն LSTM-ներն ունեն այս խնդրի դեմ պայքարի տեխնիկա:

Ավտոկոդավորիչներ

Մինչ այժմ նշված խորը ուսուցման ճարտարապետությունների մեծ մասը կիրառվում է վերահսկվող ուսուցման խնդիրների, այլ ոչ թե չվերահսկվող ուսումնական առաջադրանքների համար: Ավտոկոդավորիչներն ի վիճակի են չվերահսկվող տվյալները վերափոխել վերահսկվող ձևաչափի, ինչը թույլ է տալիս օգտագործել նեյրոնային ցանցերը խնդրի վրա:

Ավտոկոդավորիչներ հաճախ օգտագործվում են տվյալների հավաքածուներում անոմալիաները հայտնաբերելու համար, չվերահսկվող ուսուցման օրինակ, քանի որ անոմալիայի բնույթը հայտնի չէ: Անոմալիաների հայտնաբերման նման օրինակները ներառում են ֆինանսական հաստատությունների համար խարդախության հայտնաբերումը: Այս համատեքստում, autoencoder-ի նպատակն է որոշել տվյալների կանոնավոր օրինաչափությունների հիմնական գիծը և բացահայտել անոմալիաները կամ արտաքուստները:

Autoencoder-ի կառուցվածքը հաճախ սիմետրիկ է, թաքնված շերտերով դասավորված այնպես, որ ցանցի ելքը նման է մուտքագրմանը: Հաճախակի օգտագործվող ավտոկոդավորիչների չորս տեսակներն են.

  • Սովորական/պարզ ինքնակոդավորիչներ
  • Բազմաշերտ կոդավորիչներ
  • Կոնվոլյուցիոն կոդավորիչներ
  • Կանոնավորեցված կոդավորիչներ

Սովորական/պարզ ինքնակոդավորիչները պարզապես նյարդային ցանցեր են՝ մեկ թաքնված շերտով, մինչդեռ բազմաշերտ ինքնակոդավորիչները խորը ցանցեր են՝ մեկից ավելի թաքնված շերտով: Convolutional autoencoder-ներն օգտագործում են կոնվոլյուցիոն շերտեր՝ ամբողջությամբ միացված շերտերի փոխարեն կամ դրանցից բացի: Կանոնավորվող ինքնակոդավորիչներն օգտագործում են կորստի ֆունկցիայի հատուկ տեսակ, որը թույլ է տալիս նեյրոնային ցանցին իրականացնել ավելի բարդ գործառույթներ, այլ գործառույթներ, քան պարզապես մուտքերը ելքերին պատճենելը:

Generative Adversarial Networks

Ստեղծող հակառակորդային ցանցեր (GANS) իրականում մի քանի խորը նյարդային ցանցեր են՝ ընդամենը մեկ ցանցի փոխարեն: Խորը ուսուցման երկու մոդելները միաժամանակ վերապատրաստվում են, և դրանց արդյունքները սնվում են մյուս ցանցին: Ցանցերը մրցակցում են միմյանց հետ, և քանի որ դրանք հասանելի են դառնում միմյանց ելքային տվյալներին, նրանք և՛ սովորում են այս տվյալներից, և՛ բարելավվում են: Երկու ցանցերը, ըստ էության, խաղում են կեղծիքի և հայտնաբերման խաղ, որտեղ գեներատիվ մոդելը փորձում է ստեղծել նոր դեպքեր, որոնք կխաբեն դետեկտիվ մոդելին/խտրականացնողին: GAN-ները հայտնի են դարձել համակարգչային տեսողության ոլորտում:

Deep Learning Ամփոփում

Խորը ուսուցումն ընդլայնում է նեյրոնային ցանցերի սկզբունքները՝ ստեղծելու բարդ մոդելներ, որոնք կարող են սովորել բարդ օրինաչափություններ և ընդհանրացնել այդ օրինաչափությունները ապագա տվյալների հավաքածուներին: Կովոլյուցիոն նեյրոնային ցանցերն օգտագործվում են պատկերները մեկնաբանելու համար, իսկ RNN/LSTM-ները՝ հաջորդական տվյալները մեկնաբանելու համար: Ավտոկոդավորիչները կարող են չվերահսկվող ուսումնական առաջադրանքները վերածել վերահսկվող ուսումնական առաջադրանքների: Վերջապես, GAN-ները միմյանց դեմ հակադրված բազմաթիվ ցանցեր են, որոնք հատկապես օգտակար են համակարգչային տեսողության առաջադրանքների համար:

Բլոգեր և ծրագրավորող մասնագիտություններով Machine Learning և Խորը ուսուցում թեմաներ. Դանիելը հույս ունի օգնել ուրիշներին օգտագործել AI-ի ուժը սոցիալական բարօրության համար: