škrbina Kaj so nevronske mreže? - Združi se.AI
Povežite se z nami

AI 101

Kaj so nevronske mreže?

mm
Posodobljeno on

Kaj so umetne nevronske mreže (ANN)?

Številni največji napredki v AI so poganjajo umetne nevronske mreže. Umetne nevronske mreže (ANN) so povezava matematičnih funkcij, združenih v obliki, ki se zgleduje po nevronskih mrežah v človeških možganih. Ti ANN-ji so zmožni izluščiti zapletene vzorce iz podatkov in te vzorce uporabiti na nevidnih podatkih za klasifikacijo/prepoznavanje podatkov. Na ta način se stroj "uči". To je kratek pregled nevronskih mrež, vendar si oglejmo nevronske mreže pobližje, da bomo bolje razumeli, kaj so in kako delujejo.

Razlaga večplastnega perceptrona

Preden pogledamo bolj zapletene nevronske mreže, si bomo vzeli trenutek in si ogledali preprosto različico ANN, večplastni perceptron (MLP).

Predstavljajte si tekoči trak v tovarni. Na tem tekočem traku en delavec prejme artikel, ga nekaj prilagodi in ga nato preda naslednjemu delavcu v liniji, ki naredi isto. Ta proces se nadaljuje, dokler zadnji delavec v liniji ne dodela izdelka in ga natakne na pas, ki ga bo odpeljal iz tovarne. V tej analogiji obstaja več "plasti" na tekočem traku in izdelki se premikajo med plastmi, ko se premikajo od delavca do delavca. Tekoči trak ima tudi vstopno in izstopno točko.

Večplastni perceptron si lahko predstavljamo kot zelo preprosto proizvodno linijo, sestavljeno iz treh plasti: vhodne plasti, skrite plasti in izhodne plasti. Vhodna plast je mesto, kjer se podatki dovajajo v MLP, v skriti plasti pa nekaj "delavcev" obravnava podatke, preden jih posreduje izhodni plasti, ki izdelek posreduje zunanjemu svetu. V primeru MLP se ti delavci imenujejo "nevroni" (ali včasih vozlišča) in ko ravnajo s podatki, jih manipulirajo prek niza matematičnih funkcij.

Znotraj omrežja obstajajo strukture, ki povezujejo vozlišča z vozlišči, imenovane "Uteži”. Uteži so predpostavka o tem, kako so podatkovne točke povezane med premikanjem po omrežju. Povedano drugače, uteži odražajo stopnjo vpliva, ki jo ima en nevron na drugega nevrona. Uteži gredo skozi "aktivacijsko funkcijo", ko zapustijo trenutno vozlišče, kar je vrsta matematične funkcije, ki preoblikuje podatke. Pretvarjajo linearne podatke v nelinearne predstavitve, kar omrežju omogoča analizo kompleksnih vzorcev.

Analogija s človeškimi možgani, ki jo implicira "umetna nevronska mreža", izhaja iz dejstva, da so nevroni, ki sestavljajo človeške možgane, združeni na podoben način, kot so povezana vozlišča v ANN.

Medtem ko večplastni perceptroni obstajajo že od štiridesetih let 1940. stoletja, je obstajalo več omejitev, ki so jim preprečile, da bi bili posebej uporabni. Vendar pa je v zadnjih nekaj desetletjih tehnika, imenovana "povratno širjenje” je bilo ustvarjeno, ki je omrežjem omogočilo prilagajanje uteži nevronov in se tako veliko bolj učinkovito učiti. Širjenje nazaj spremeni uteži v nevronski mreži, kar omrežju omogoči boljše zajemanje dejanskih vzorcev v podatkih.

Globoke nevronske mreže

Globoke nevronske mreže prevzamejo osnovno obliko MLP in jo povečajo z dodajanjem več skritih plasti na sredini modela. Torej namesto vhodne plasti, skrite plasti in izhodne plasti je na sredini veliko skritih plasti in izhodi ene skrite plasti postanejo vhodi za naslednjo skrito plast, dokler podatki ne pridejo do konca. prek omrežja in je bil vrnjen.

Več skritih plasti globoke nevronske mreže lahko interpretira bolj zapletene vzorce kot tradicionalni večplastni perceptron. Različne plasti globoke nevronske mreže se naučijo vzorcev različnih delov podatkov. Na primer, če so vhodni podatki sestavljeni iz slik, lahko prvi del omrežja interpretira svetlost ali temnost pikslov, medtem ko bodo poznejši sloji izbrali oblike in robove, ki jih je mogoče uporabiti za prepoznavanje predmetov na sliki.

Različne vrste nevronskih mrež

Obstajajo različne vrste nevronskih mrež in vsaka od različnih vrst nevronskih mrež ima svoje prednosti in slabosti (in s tem svoje primere uporabe). Zgoraj opisana vrsta globoke nevronske mreže je najpogostejša vrsta nevronske mreže in jo pogosto imenujemo nevronska mreža s posredovanjem podatkov.

Ena različica nevronskih mrež je ponavljajoča se nevronska mreža (RNN). V primeru ponavljajočih se nevronskih mrež se mehanizmi zanke uporabljajo za shranjevanje informacij iz prejšnjih stanj analize, kar pomeni, da lahko interpretirajo podatke, kjer je vrstni red pomemben. RNN so uporabni pri pridobivanju vzorcev iz zaporednih/kronoloških podatkov. Ponavljajoče se nevronske mreže so lahko enosmerne ali dvosmerne. V primeru dvosmerne nevronske mreže lahko mreža vzame informacije iz kasnejših in prejšnjih delov zaporedja. Ker dvosmerni RNN upošteva več informacij, lahko bolje črpa prave vzorce iz podatkov.

Konvolucijska nevronska mreža je posebna vrsta nevronske mreže, ki je spretna pri interpretaciji vzorcev, ki jih najdemo v slikah. CNN deluje tako, da preide filter čez slikovne pike in doseže numerično predstavitev slikovnih pik v sliki, ki jo lahko nato analizira za vzorce. CNN je strukturiran tako, da najprej pridejo konvolucijski sloji, ki potegnejo slikovne pike iz slike, nato pa pridejo gosto povezani napajalni sloji, tisti, ki se bodo dejansko naučili prepoznavati predmete, pa pridejo za tem.

Bloger in programer s posebnostmi v strojno učenje in Globoko učenje teme. Daniel upa, da bo drugim pomagal uporabiti moč umetne inteligence za družbeno dobro.