stub X'inhuma CNNs (Netwerks Newrali Konvoluzzjonali)? - Unite.AI
Kuntatt magħna
Masterclass AI:

AI 101

X'inhuma CNNs (Netwerks Newrali Konvoluzzjonali)?

mm
Aġġornata on

Forsi stajt ħsibt kif Facebook jew Instagram kapaċi jagħrfu awtomatikament l-uċuħ f’immaġini, jew kif Google iħallik tfittex fuq il-web ritratti simili sempliċement billi ttella’ ritratt tiegħek. Dawn il-karatteristiċi huma eżempji ta 'viżjoni bil-kompjuter, u huma mħaddma minn netwerks newrali konvoluzzjonali (CNNs). Iżda x'inhuma eżattament in-netwerks newrali konvoluzzjonali? Ejja ngħaddu fil-fond fl-arkitettura ta' CNN u nifhmu kif joperaw.

X'inhuma Netwerks Newrali?

Qabel ma nibdew nitkellmu dwar netwerks newrali konvoluzzjonali, ejja nieħdu mument biex niddefinixxu netwerk newrali regolari. Hemm artikolu ieħor dwar is-suġġett tan-netwerks newrali disponibbli, għalhekk mhux se nidħlu wisq fihom hawn. Madankollu, biex jiddefinixxuhom fil-qosor huma mudelli komputazzjonali ispirati mill-moħħ tal-bniedem. Netwerk newrali jopera billi jieħu data u jimmanipula d-data billi jaġġusta "piżijiet", li huma suppożizzjonijiet dwar kif il-karatteristiċi ta 'input huma relatati ma' xulxin u l-klassi tal-oġġett. Hekk kif in-netwerk ikun imħarreġ il-valuri tal-piżijiet huma aġġustati u nisperaw li jikkonverġu fuq piżijiet li jaqbdu b'mod preċiż ir-relazzjonijiet bejn il-karatteristiċi.

Dan huwa kif jopera netwerk newrali feed-forward, u CNNs huma magħmula minn żewġ nofsijiet: netwerk newrali feed-forward u grupp ta 'saffi konvoluzzjonali.

X'inhuma n-Netwerks Neurali tal-Konvoluzzjoni (CNNs)?

X'inhuma l-"konvoluzzjonijiet" li jseħħu f'netwerk newrali konvoluzzjonali? Konvoluzzjoni hija operazzjoni matematika li toħloq sett ta 'piżijiet, essenzjalment toħloq rappreżentazzjoni ta' partijiet tal-immaġni. Dan is-sett ta 'piżijiet jissejjaħ għadma jew filtru. Il-filtru li jinħoloq huwa iżgħar mill-immaġni kollha tad-dħul, li jkopri biss subsezzjoni tal-immaġni. Il-valuri fil-filtru huma mmultiplikati mal-valuri fl-immaġini. Il-filtru mbagħad jiġi mċaqlaq biex jifforma rappreżentazzjoni ta 'parti ġdida tal-immaġni, u l-proċess jiġi ripetut sakemm l-immaġni kollha tkun ġiet koperta.

Mod ieħor biex taħseb dwar dan huwa li timmaġina ħajt tal-briks, bil-briks jirrappreżentaw il-pixels fl-immaġni tal-input. "Tieqa" qed tiżżerżaq 'il quddiem u lura tul il-ħajt, li huwa l-filtru. Il-briks li jistgħu jidhru mit-tieqa huma l-pixels li għandhom il-valur tagħhom immultiplikat bil-valuri fi ħdan il-filtru. Għal din ir-raġuni, dan il-metodu ta 'ħolqien ta' piżijiet b'filtru spiss jissejjaħ it-teknika ta '"twieqi li jiżżerżqu".

L-output mill-filtri li qed jiġu mċaqalqa madwar l-immaġni kollha tad-dħul hija firxa bidimensjonali li tirrappreżenta l-immaġni kollha. Din il-firxa tissejjaħ a “mappa tal-karatteristiċi”.

Għaliex il-Konvoluzzjonijiet huma Essenzjali

X'inhu l-iskop li jinħolqu konvoluzzjonijiet xorta waħda? Il-konvoluzzjonijiet huma meħtieġa minħabba li netwerk newrali jrid ikun kapaċi jinterpreta l-pixels f'immaġni bħala valuri numeriċi. Il-funzjoni tas-saffi konvoluzzjonali hija li tikkonverti l-immaġni f'valuri numeriċi li n-netwerk newrali jista 'jinterpreta u mbagħad estratt mudelli rilevanti minnhom. Ix-xogħol tal-filtri fin-netwerk konvoluzzjonali huwa li joħolqu firxa bidimensjonali ta 'valuri li jistgħu jiġu mgħoddija fis-saffi aktar tard ta' netwerk newrali, dawk li se jitgħallmu l-mudelli fl-immaġni.

Filtri U Kanali

Ritratt: cecebur permezz ta' Wikimedia Commons, CC BY SA 4.0 (https://commons.wikimedia.org/wiki/File:Convolutional_Neural_Network_NeuralNetworkFeatureLayers.gif)

Is-CNNs ma jużawx filtru wieħed biss biex jitgħallmu mudelli mill-immaġini tal-input. Jintużaw filtri multipli, peress li l-arrays differenti maħluqa mill-filtri differenti jwasslu għal rappreżentazzjoni aktar kumplessa u rikka tal-immaġni tal-input. Numri komuni ta 'filtri għas-CNNs huma 32, 64, 128, u 512. Iktar ma jkun hemm filtri, aktar opportunitajiet is-CNN għandu jeżamina d-dejta tal-input u jitgħallmu minnha.

CNN janalizza d-differenzi fil-valuri tal-pixels sabiex jiddetermina l-fruntieri tal-oġġetti. F'immaġni fuq skala griża, is-CNN tħares biss lejn id-differenzi f'termini iswed u abjad, minn dawl għal skur. Meta l-immaġini huma immaġini bil-kulur, is-CNN mhux biss iqis id-dlam u d-dawl, iżda jrid iqis ukoll it-tliet kanali tal-kulur differenti - aħmar, aħdar u blu. F'dan il-każ, il-filtri jippossjedu 3 kanali, bħalma tagħmel l-immaġni nnifisha. In-numru ta 'kanali li għandu filtru jissejjaħ il-fond tiegħu, u n-numru ta' kanali fil-filtru għandu jaqbel man-numru ta 'kanali fl-immaġni.

Netwerk Newrali Konvoluzzjonali (CNN) arkitettura

Ejja nagħtu ħarsa lejn l-arkitettura sħiħa ta ' netwerk newrali konvoluzzjonali. Saff konvoluzzjonali jinstab fil-bidu ta 'kull netwerk konvoluzzjonali, peress li huwa meħtieġ li d-dejta tal-immaġni tittrasforma f'arrays numeriċi. Madankollu, saffi konvoluzzjonali jistgħu wkoll jiġu wara saffi konvoluzzjonali oħra, li jfisser li dawn is-saffi jistgħu jiġu f'munzelli fuq xulxin. Li jkollok saffi konvoluzzjonali multipli jfisser li l-outputs minn saff wieħed jistgħu jgħaddu minn aktar konvoluzzjonijiet u jinġabru flimkien f'mudelli rilevanti. Prattikament, dan ifisser li hekk kif id-dejta tal-immaġni tipproċedi permezz tas-saffi konvoluzzjonali, in-netwerk jibda "jirrikonoxxi" karatteristiċi aktar kumplessi tal-immaġni.

Is-saffi bikrija ta 'ConvNet huma responsabbli għall-estrazzjoni tal-karatteristiċi ta' livell baxx, bħall-pixels li jiffurmaw linji sempliċi. Saffi aktar tard tal-ConvNet se jingħaqdu dawn il-linji flimkien f'forom. Dan il-proċess ta 'ċaqliq minn analiżi fil-livell tal-wiċċ għal analiżi fil-fond ikompli sakemm il-ConvNet qed jirrikonoxxi forom kumplessi bħall-annimali, uċuħ umani, u karozzi.

Wara li d-dejta tkun għaddiet mis-saffi konvoluzzjonali kollha, tipproċedi fil-parti densament konnessa tas-CNN. Is-saffi konnessi b'mod dens huma kif jidher netwerk newrali feed-forward tradizzjonali, serje ta 'nodi mqassma f'saffi li huma konnessi ma' xulxin. Id-dejta tipproċedi permezz ta 'dawn is-saffi konnessi b'mod dens, li jitgħallmu l-mudelli li ġew estratti mis-saffi konvoluzzjonali, u b'hekk in-netwerk isir kapaċi jagħraf l-oġġetti.