AI 101
Co jsou neuronové sítě?

Co jsou umělá neuronová síť (ANNs)?
Mnohé z největších pokroků v oblasti AI jsou řízeny umělými neuronovými sítěmi. Umělá neuronová síť (ANNs) je spojení matematických funkcí spojených dohromady ve formátu inspirovaném neuronovými sítěmi nalezenými v lidském mozku. Tyto ANNs jsou schopny extrahovat komplexní vzory z dat, aplikovat tyto vzory na neviditelná data za účelem klasifikace/rozpoznání dat. Tímto způsobem se stroj “učí”. To je rychlý přehled neuronových sítí, ale pojďme se podívat na neuronové sítě blíže, abychom lépe pochopili, co jsou a jak fungují.
Vícevrstvý perceptron vysvětlen
Než se podíváme na složitější neuronové sítě, chvíli se zastavíme u jednoduché verze ANNs, vícevrstvého perceptronu (MLP).

Představte si montážní linku v továrně. Na této montážní lince jeden pracovník přijme předmět, provede na něm einige úpravy a poté ho předá dalšímu pracovníkovi v lince, který totéž provede. Tento proces pokračuje, dokud poslední pracovník v lince nedá předmětu konečnou podobu a nevloží ho na pás, který ho vyveze z továrny. V této analogii existují multiple “vrstvy” montážní linky a produkty se pohybují mezi vrstvami, jak se pohybují od pracovník k pracovníkovi. Montážní linka má také vstupní a výstupní bod.
Vícevrstvý perceptron lze považovat za velmi jednoduchou výrobní linku, složenou ze tří vrstev: vstupní vrstvy, skryté vrstvy a výstupní vrstvy. Vstupní vrstva je místem, kde jsou data zavedena do MLP, a ve skryté vrstvě einige “pracovníci” zpracovávají data, než je předají výstupní vrstvě, která produkt předává vnějšímu světu. V případě MLP jsou tito pracovníci nazýváni “neurony” (nebo někdy uzly) a když zpracovávají data, manipulují jimi prostřednictvím série matematických funkcí.
V rámci sítě existují struktury spojující uzel k uzlu nazývané “váhy“. Váhy jsou předpokladem o tom, jak jsou data bodů vzájemně spojeny, když procházejí sítí. Jinými slovy, váhy odrážejí úroveň vlivu, kterou má jeden neuron na jiný neuron. Váhy procházejí “aktivní funkcí”, když opouštějí aktuální uzel, což je typ matematické funkce, která transformuje data. Transformují lineární data na nelineární reprezentace, což umožňuje síti analyzovat komplexní vzory.
Analogie s lidským mozkem naznačená “umělou neuronovou sítí” pochází z faktu, že neurony, které tvoří lidský mozek, jsou spojeny podobným způsobem, jako uzly v ANNs.
Zatímco vícevrstvé perceptrony existují již od 40. let, existovalo několik omezení, která bránila jejich větší užitečnosti. Nicméně, v průběhu posledních několika desetiletí, byla vytvořena technika nazývaná “backpropagation“, která umožnila sítím upravovat váhy neuronů a tím se učit mnohem efektivněji. Backpropagation mění váhy v neuronové síti, což umožňuje síti lépe zachytit skutečné vzory v datech.
Hluboké neuronové sítě
Hluboké neuronové sítě berou základní formu MLP a dělají ji větší přidáním více skrytých vrstev uprostřed modelu. Místo toho, aby existovala vstupní vrstva, skrytá vrstva a výstupní vrstva, existuje mnoho skrytých vrstev uprostřed a výstupy jedné skryté vrstvy se stávají vstupy pro další skrytou vrstvu, dokud data neprojdou celou sítí a nejsou vrácena.
Mnohé skryté vrstvy hluboké neuronové sítě jsou schopny interpretovat komplexnější vzory než tradiční vícevrstvý perceptron. Různé vrstvy hluboké neuronové sítě se učí vzorům různých částí dat. Například, pokud vstupní data sestávají z obrázků, první část sítě může interpretovat jasnost nebo tmavost pixelů, zatímco pozdější vrstvy budou vybírat tvary a hrany, které lze použít k rozpoznání objektů na obrázku.
Různé typy neuronových sítí

Existuje několik typů neuronových sítí a každý typ neuronové sítě má své vlastní výhody a nevýhody (a proto své vlastní použití). Typ hluboké neuronové sítě popsaný výše je nejčastější typ neuronové sítě a často se nazývá feedforward neuronová síť.
Jedna varianta neuronových sítí je Recurrent Neural Network (RNN). V případě RNN se používají smyčkové mechanismy k uchování informací z předchozích stavů analýzy, což znamená, že mohou interpretovat data, kde pořadí záleží. RNN jsou užitečné při odvozování vzorů z sekvencí/chronologických dat. RNN mohou být buď unidirekční nebo bidirekční. V případě bidirekční neuronové sítě může síť přijmout informace z pozdějších částí sekvence, stejně jako z dřívějších částí sekvence. Protože bidirekční RNN bere v úvahu více informací, je lépe schopna vyvodit správné vzory z dat.
Convolutional Neural Network je speciální typ neuronové sítě, který je schopen interpretovat vzory nalezené v obrazech. CNN funguje tak, že prochází filtr přes pixely obrázku a dosahuje numerické reprezentace pixelů v obraze, kterou může poté analyzovat na vzory. CNN je strukturován tak, že konvoluční vrstvy, které vytahují pixely z obrázku, přicházejí první, a poté následují hustě spojené feedforward vrstvy, které se skutečně naučí rozpoznávat objekty, přicházejí po této.












