stubs Kas ir neironu tīkli? - Apvienojieties.AI
Savienoties ar mums
AI meistarklase:

AI 101

Kas ir neironu tīkli?

mm
Atjaunināts on

Kas ir mākslīgie neironu tīkli (ANN)?

Daudzi no lielākajiem AI sasniegumiem ir ko vada mākslīgie neironu tīkli. Mākslīgie neironu tīkli (ANN) ir matemātisko funkciju savienojums, kas savienots formātā, ko iedvesmojuši cilvēka smadzenēs atrodamie neironu tīkli. Šie ANN spēj no datiem iegūt sarežģītus modeļus, piemērojot šos modeļus neredzamiem datiem, lai klasificētu/atpazītu datus. Tādā veidā iekārta “mācās”. Šis ir īss neironu tīklu apraksts, taču aplūkosim neironu tīklus tuvāk, lai labāk saprastu, kas tie ir un kā tie darbojas.

Paskaidrots daudzslāņu perceptrons

Pirms mēs aplūkojam sarežģītākus neironu tīklus, mēs veltīsim brīdi, lai apskatītu vienkāršu ANN versiju, Daudzslāņu perceptrons (MLP).

Iedomājieties montāžas līniju rūpnīcā. Uz šīs montāžas līnijas viens strādnieks saņem preci, veic tajā dažus pielāgojumus un pēc tam nodod to nākamajam līnijas strādniekam, kurš dara to pašu. Šis process turpinās, līdz pēdējais strādnieks rindā pieliek izstrādājumam pēdējo pieskārienu un uzliek to uz jostas, kas to izvedīs no rūpnīcas. Šajā analoģijā montāžas līnijai ir vairāki “slāņi”, un produkti pārvietojas starp slāņiem, pārvietojoties no darbinieka uz strādnieku. Montāžas līnijai ir arī ieejas un izejas punkts.

Daudzslāņu perceptronu var uzskatīt par ļoti vienkāršu ražošanas līniju, kas kopumā sastāv no trim slāņiem: ievades slāņa, slēptā slāņa un izvades slāņa. Ievades slānis ir vieta, kur dati tiek ievadīti MLP, un slēptajā slānī daži “darbinieki” apstrādā datus, pirms tos nodod izvades slānim, kas nodod produktu ārējai pasaulei. MLP gadījumā šos darbiniekus sauc par “neironiem” (vai dažreiz mezgliem), un, apstrādājot datus, viņi ar tiem manipulē, izmantojot virkni matemātisku funkciju.

Tīklā ir struktūras, kas savieno mezglu ar mezglu, ko sauc par "svari”. Svari ir pieņēmums par to, kā datu punkti ir saistīti, kad tie pārvietojas tīklā. Citiem vārdiem sakot, svari atspoguļo viena neirona ietekmes līmeni uz citu neironu. Svari iziet cauri “aktivizēšanas funkcijai”, kad tie atstāj pašreizējo mezglu, kas ir matemātiskās funkcijas veids, kas pārveido datus. Tie pārveido lineāros datus nelineāros attēlojumos, kas ļauj tīklam analizēt sarežģītus modeļus.

"Mākslīgā neironu tīkla" radītā analoģija ar cilvēka smadzenēm izriet no fakta, ka neironi, kas veido cilvēka smadzenes, ir savienoti kopā līdzīgi kā ANN mezgli ir saistīti.

Lai gan daudzslāņu perceptroni pastāv kopš 1940. gadiem, bija vairāki ierobežojumi, kas neļāva tiem būt īpaši noderīgiem. Tomēr pēdējo pāris gadu desmitu laikā tehnika, ko sauc par "atpakaļpavairošana” tika izveidots, kas ļāva tīkliem pielāgot neironu svaru un tādējādi daudz efektīvāk mācīties. Backpropagation maina svarus neironu tīklā, ļaujot tīklam labāk uztvert faktiskos datu modeļus.

Dziļie neironu tīkli

Dziļie neironu tīkli iegūst MLP pamatformu un padara to lielāku, modeļa vidū pievienojot vairāk slēptu slāņu. Tātad tā vietā, lai būtu ievades slānis, slēptais slānis un izvades slānis, vidū ir daudz slēpto slāņu, un viena slēptā slāņa izvadi kļūst par nākamā slēptā slāņa ievadi, līdz dati ir pilnībā izveidoti. caur tīklu un tika atgriezti.

Vairāki dziļā neironu tīkla slēptie slāņi spēj interpretēt sarežģītākus modeļus nekā tradicionālais daudzslāņu perceptrons. Dažādi dziļā neironu tīkla slāņi apgūst dažādu datu daļu modeļus. Piemēram, ja ievades dati sastāv no attēliem, pirmā tīkla daļa var interpretēt pikseļu spilgtumu vai tumšumu, savukārt vēlākie slāņi izvēlēsies formas un malas, ko var izmantot, lai atpazītu attēla objektus.

Dažādi neironu tīklu veidi

Ir dažādi neironu tīklu veidi, un katram no dažādajiem neironu tīklu veidiem ir savas priekšrocības un trūkumi (un līdz ar to arī savi lietošanas gadījumi). Iepriekš aprakstītais dziļā neironu tīkla veids ir visizplatītākais neironu tīkla veids, un to bieži dēvē par pārejošo neironu tīklu.

Viena no neironu tīklu variācijām ir atkārtotais neironu tīkls (RNN). Atkārtotu neironu tīklu gadījumā tiek izmantoti cilpas mehānismi, lai saglabātu informāciju no iepriekšējiem analīzes stāvokļiem, kas nozīmē, ka tie var interpretēt datus, kur secībai ir nozīme. RNN ir noderīgi, lai iegūtu modeļus no secīgiem/hronoloģiskiem datiem. Atkārtoti neironu tīkli var būt vienvirziena vai divvirzienu. Divvirzienu neironu tīkla gadījumā tīkls var iegūt informāciju no secības vēlākām daļām, kā arī no iepriekšējām secības daļām. Tā kā divvirzienu RNN ņem vērā vairāk informācijas, tas var labāk iegūt pareizos modeļus no datiem.

Konvolucionālais neironu tīkls ir īpašs neironu tīkla veids, kas prasmīgi interpretē attēlos atrodamos modeļus. CNN darbojas, nolaižot filtru pār attēla pikseļiem un panākot attēla pikseļu skaitlisku attēlojumu, ko pēc tam var analizēt, lai noteiktu modeļus. CNN ir strukturēts tā, ka vispirms ir konvolucionālie slāņi, kas izvelk pikseļus no attēla, un pēc tam nāk blīvi saistītie uz priekšu vērstie slāņi, tie, kas faktiski iemācīsies atpazīt objektus.

Emuāru autors un programmētājs ar specialitātēm Mašīnu mācīšana un Dziļa mācīšanās tēmas. Daniels cer palīdzēt citiem izmantot mākslīgā intelekta spēku sociālā labuma gūšanai.