tynkä Mitä ovat hermoverkot? - Unite.AI
Liity verkostomme!

AI 101

Mitä ovat hermoverkot?

mm
Päivitetty on

Mitä ovat keinotekoiset hermoverkot (ANN:t)?

Monet tekoälyn suurimmista edistysaskeleista ovat keinotekoisten hermoverkkojen ohjaamana. Keinotekoiset hermoverkot (ANN:t) ovat matemaattisten toimintojen yhdistäminen toisiinsa muodossa, joka on saanut inspiraationsa ihmisen aivoista löytyvistä hermoverkoista. Nämä ANN:t pystyvät poimimaan monimutkaisia ​​​​kuvioita tiedosta ja soveltamaan näitä kuvioita näkymättömään dataan tietojen luokittelemiseksi/tunnistamiseksi. Tällä tavalla kone "oppii". Tämä on nopea yhteenveto neuroverkoista, mutta katsotaanpa hermoverkkoja lähemmin ymmärtääksemme paremmin, mitä ne ovat ja miten ne toimivat.

Monikerroksinen Perceptron selitetty

Ennen kuin tarkastelemme monimutkaisempia neuroverkkoja, katsomme hetken ANN:n yksinkertaista versiota, Multi-Layer Perceptron (MLP).

Kuvittele kokoonpanolinja tehtaalla. Tällä kokoonpanolinjalla yksi työntekijä vastaanottaa tuotteen, tekee siihen joitain muutoksia ja välittää sen sitten linjan seuraavalle työntekijälle, joka tekee saman. Tämä prosessi jatkuu, kunnes linjan viimeinen työntekijä viimeistelee tuotteen ja laittaa sen hihnalle, joka vie sen pois tehtaalta. Tässä analogiassa kokoonpanolinjalla on useita "kerroksia", ja tuotteet liikkuvat kerrosten välillä, kun ne siirtyvät työntekijältä työntekijälle. Kokoonpanolinjalla on myös sisään- ja poistumispiste.

Multi-Layer Perceptron voidaan ajatella hyvin yksinkertaisena tuotantolinjana, joka koostuu yhteensä kolmesta kerroksesta: syöttökerroksesta, piilotetusta kerroksesta ja tulostekerroksesta. Syöttökerros on paikka, jossa tiedot syötetään MLP:hen, ja piilokerroksessa jotkut "työntekijät" käsittelevät tietoja ennen kuin välittävät sen tuloskerrokseen, joka antaa tuotteen ulkomaailmalle. MLP:n tapauksessa näitä työntekijöitä kutsutaan "neuroneiksi" (tai joskus solmuiksi), ja kun he käsittelevät tietoja, he käsittelevät sitä useiden matemaattisten funktioiden avulla.

Verkossa on rakenteita, jotka yhdistävät solmun solmuun nimeltä "painot”. Painot ovat oletus siitä, kuinka datapisteet liittyvät toisiinsa, kun ne liikkuvat verkossa. Toisin sanoen painot heijastavat vaikutustasoa, joka yhdellä neuronilla on toiseen neuroniin. Painot kulkevat "aktivointifunktion" läpi, kun ne poistuvat nykyisestä solmusta, joka on eräänlainen matemaattinen funktio, joka muuntaa tiedot. Ne muuntavat lineaarisen datan epälineaarisiksi esityksiksi, mikä mahdollistaa verkon analysoinnin monimutkaisia ​​kuvioita.

"Keinotekoisen hermoverkon" viittaama analogia ihmisen aivoihin tulee siitä tosiasiasta, että ihmisen aivot muodostavat neuronit on liitetty toisiinsa samalla tavalla kuin ANN:n solmut.

Vaikka monikerroksisia perceptroneja on ollut olemassa 1940-luvulta lähtien, monet rajoitukset estivät niitä olemasta erityisen hyödyllisiä. Kuitenkin viimeisten parin vuosikymmenen aikana tekniikka nimeltä "takaisinlisäystä” luotiin, mikä antoi verkostoille mahdollisuuden säätää hermosolujen painoja ja siten oppia paljon tehokkaammin. Backpropagation muuttaa painoja hermoverkossa, jolloin verkko pystyy paremmin sieppaamaan datan todelliset kuviot.

Deep Neural Networks

Syvät neuroverkot ottavat MLP:n perusmuodon ja tekevät siitä suuremman lisäämällä piilotettuja kerroksia mallin keskelle. Joten sen sijaan, että olisi syöttökerros, piilotettu kerros ja tuloskerros, keskellä on monia piilotettuja kerroksia ja yhden piilotetun kerroksen lähdöistä tulee seuraavan piilokerroksen syötteitä, kunnes tiedot ovat päässeet siihen asti. verkon kautta ja palautettu.

Syvän hermoverkon useat piilotetut kerrokset pystyvät tulkitsemaan monimutkaisempia kuvioita kuin perinteinen monikerroksinen perceptron. Syvän hermoverkon eri kerrokset oppivat datan eri osien kuvioita. Jos syöttödata koostuu esimerkiksi kuvista, verkon ensimmäinen osa saattaa tulkita pikselien kirkkauden tai tummuuden, kun taas myöhemmät tasot poimivat muotoja ja reunoja, joita voidaan käyttää kuvan kohteiden tunnistamiseen.

Erityyppiset hermoverkot

Neuroverkkoja on erilaisia, ja jokaisella eri neuroverkkotyypeillä on omat etunsa ja haittansa (ja siten omat käyttötapauksensa). Yllä kuvattu syvän neuroverkon tyyppi on yleisin hermoverkon tyyppi, ja sitä kutsutaan usein myötäkytkentäiseksi hermoverkoksi.

Yksi neuroverkkojen muunnelma on Recurrent Neural Network (RNN). Toistuvien hermoverkkojen tapauksessa silmukkamekanismeja käytetään säilyttämään tietoja aikaisemmista analyysitiloista, mikä tarkoittaa, että ne voivat tulkita dataa siellä, missä järjestyksellä on merkitystä. RNN:t ovat hyödyllisiä kuvioiden johtamisessa peräkkäisistä/kronologisista tiedoista. Toistuvat hermoverkot voivat olla joko yksi- tai kaksisuuntaisia. Kaksisuuntaisen hermoverkon tapauksessa verkko voi ottaa tietoa myöhemmästä sekvenssistä sekä sekvenssin aikaisemmista osista. Koska kaksisuuntainen RNN ottaa enemmän tietoa huomioon, se pystyy paremmin piirtämään oikeat kuviot tiedoista.

Konvoluutiohermoverkko on erityinen hermoverkko, joka on taitava tulkitsemaan kuvista löytyviä malleja. CNN toimii välittämällä suodattimen kuvan pikselien yli ja saamalla kuvan pikselien numeerisen esityksen, jonka se voi sitten analysoida kuvioiden varalta. CNN on rakennettu niin, että konvoluutiokerrokset, jotka vetävät pikseleitä pois kuvasta, tulevat ensin, ja sitten tulevat tiiviisti liittyvät eteenpäinsyöttökerrokset, ne, jotka todella oppivat tunnistamaan esineitä.

Bloggaaja ja ohjelmoija erikoisaloilla Koneen oppiminen ja Deep Learning aiheita. Daniel toivoo voivansa auttaa muita käyttämään tekoälyn voimaa yhteiskunnalliseen hyvään.