AI 101

Co jsou to neuronové sítě?

aktualizováno on Října 17, 2020

Co jsou to umělé neuronové sítě (ANN)?

Mnoho z největších pokroků v AI je poháněné umělými neuronovými sítěmi. Umělé neuronové sítě (ANN) jsou spojením matematických funkcí spojených dohromady ve formátu inspirovaném neuronovými sítěmi nacházejícími se v lidském mozku. Tyto ANN jsou schopny extrahovat složité vzory z dat a aplikovat tyto vzory na neviditelná data pro klasifikaci/rozpoznání dat. Tímto způsobem se stroj „učí“. To je rychlý přehled o neuronových sítích, ale podívejme se blíže na neuronové sítě, abychom lépe porozuměli tomu, co jsou a jak fungují.

Vysvětlení vícevrstvého perceptronu

Než se podíváme na složitější neuronové sítě, na chvíli se podíváme na jednoduchou verzi ANN, vícevrstvý perceptron (MLP).

Představte si montážní linku v továrně. Na této montážní lince jeden pracovník obdrží položku, provede na ní nějaké úpravy a poté ji předá dalšímu pracovníkovi na lince, který udělá totéž. Tento proces pokračuje, dokud poslední pracovník na lince neprovede konečnou úpravu předmětu a nasadí jej na pás, který jej odveze z továrny. V této analogii existuje několik „vrstev“ na montážní lince a produkty se pohybují mezi vrstvami, jak se pohybují od pracovníka k pracovníkovi. Montážní linka má také vstupní a výstupní bod.

Multi-Layer Perceptron lze považovat za velmi jednoduchou výrobní linku, vyrobenou celkem ze tří vrstev: vstupní vrstva, skrytá vrstva a výstupní vrstva. Vstupní vrstva je místo, kde jsou data přiváděna do MLP, a ve skryté vrstvě určitý počet „pracovníků“ zpracovává data, než je předá výstupní vrstvě, která poskytuje produkt vnějšímu světu. V případě MLP se tito pracovníci nazývají „neurony“ (nebo někdy uzly) a když manipulují s daty, manipulují s nimi prostřednictvím řady matematických funkcí.

V rámci sítě existují struktury spojující uzel s uzlem nazvané „závaží“. Váhy jsou předpokladem toho, jak spolu souvisí datové body, když se pohybují sítí. Jinak řečeno, váhy odrážejí úroveň vlivu, který má jeden neuron na jiný neuron. Váhy procházejí „aktivační funkcí“, když opouštějí aktuální uzel, což je typ matematické funkce, která transformuje data. Transformují lineární data na nelineární reprezentace, což umožňuje síti analyzovat složité vzory.

Analogie k lidskému mozku implikovaná „umělou neuronovou sítí“ pochází ze skutečnosti, že neurony, které tvoří lidský mozek, jsou spojeny podobným způsobem, jakým jsou spojeny uzly v ANN.

Zatímco vícevrstvé perceptrony existují již od 1940. let XNUMX. století, existovala řada omezení, která jim bránila v tom, aby byly obzvláště užitečné. V průběhu posledních několika desetiletí se však objevila technika zvaná „zpětná propagace” byl vytvořen, který umožnil sítím upravovat váhy neuronů a tím se učit mnohem efektivněji. Zpětné šíření mění váhy v neuronové síti, což umožňuje síti lépe zachytit skutečné vzory v datech.

Hluboké neuronové sítě

Hluboké neuronové sítě mají základní formu MLP a zvětšují ji přidáním dalších skrytých vrstev uprostřed modelu. Takže místo vstupní vrstvy, skryté vrstvy a výstupní vrstvy je mnoho skrytých vrstev uprostřed a výstupy jedné skryté vrstvy se stanou vstupy pro další skrytou vrstvu, dokud data nedosáhnou celou cestu. přes síť a byly vráceny.

Mnohonásobné skryté vrstvy hluboké neuronové sítě jsou schopny interpretovat složitější vzory než tradiční vícevrstvý perceptron. Různé vrstvy hluboké neuronové sítě se učí vzory různých částí dat. Pokud se například vstupní data skládají z obrázků, první část sítě může interpretovat jas nebo tmavost pixelů, zatímco pozdější vrstvy vyberou tvary a hrany, které lze použít k rozpoznání objektů v obrázku.

Různé typy neuronových sítí

Existují různé typy neuronových sítí a každý z různých typů neuronových sítí má své výhody a nevýhody (a tedy své vlastní případy použití). Výše popsaný typ hluboké neuronové sítě je nejběžnějším typem neuronové sítě a často se o ní hovoří jako o dopředné neuronové síti.

Jednou z variant neuronových sítí je rekurentní neuronová síť (RNN). V případě rekurentních neuronových sítí se k uchování informací z předchozích stavů analýzy používají mechanismy smyčkování, což znamená, že mohou interpretovat data tam, kde na pořadí záleží. RNN jsou užitečné při odvozování vzorů ze sekvenčních/chronologických dat. Rekurentní neuronové sítě mohou být jednosměrné nebo obousměrné. V případě obousměrné neuronové sítě může síť přebírat informace z pozdější části sekvence, stejně jako z dřívějších částí sekvence. Vzhledem k tomu, že obousměrný RNN bere v úvahu více informací, je lépe schopen z dat čerpat správné vzory.

Konvoluční neuronová síť je speciální typ neuronové sítě, která je zběhlá v interpretaci vzorců nalezených v obrazech. CNN funguje tak, že prochází filtrem přes pixely obrázku a dosahuje číselné reprezentace pixelů v obrázku, které pak může analyzovat na vzory. CNN je strukturována tak, že nejprve přijdou konvoluční vrstvy, které vytahují pixely z obrazu, a poté přijdou hustě propojené dopředné vrstvy, ty, které se skutečně naučí rozpoznávat objekty.

Související témata:101

Nahoru Další

Co je to počítačové vidění?

Nenechte si ujít

Učení pod dohledem vs. učení bez dozoru

Daniel Nelson

Blogerka a programátorka se specializací v Strojové učení a Hluboké učení témata. Daniel doufá, že pomůže ostatním využívat sílu AI pro společenské dobro.

Unite.AI

Co jsou to neuronové sítě?

AI 101

Co jsou to neuronové sítě?

Obsah

Co jsou to umělé neuronové sítě (ANN)?

Vysvětlení vícevrstvého perceptronu

Hluboké neuronové sítě

Různé typy neuronových sítí

Unite.AI

Co jsou to neuronové sítě?

Obsah

Co jsou to umělé neuronové sítě (ANN)?

Vysvětlení vícevrstvého perceptronu

Hluboké neuronové sítě

Různé typy neuronových sítí

Můžete se vám líbit