AI 101

Čo sú to neurónové siete?

Aktualizované on Októbra 17, 2020

Čo sú to umelé neurónové siete (ANN)?

Mnohé z najväčších pokrokov v AI sú poháňané umelými neurónovými sieťami. Umelé neurónové siete (ANN) sú spojením matematických funkcií spojených dohromady vo formáte inšpirovanom neurónovými sieťami nachádzajúcimi sa v ľudskom mozgu. Tieto ANN sú schopné extrahovať zložité vzory z údajov a aplikovať tieto vzory na neviditeľné údaje na klasifikáciu/rozpoznanie údajov. Týmto spôsobom sa stroj „učí“. To je rýchly prehľad o neurónových sieťach, ale pozrime sa bližšie na neurónové siete, aby sme lepšie pochopili, čo sú a ako fungujú.

Vysvetlenie viacvrstvového perceptrónu

Predtým, než sa pozrieme na zložitejšie neurónové siete, chvíľku sa pozrieme na jednoduchú verziu ANN, viacvrstvový perceptrón (MLP).

Predstavte si montážnu linku v továrni. Na tejto montážnej linke jeden pracovník dostane položku, vykoná na nej nejaké úpravy a potom ju odovzdá ďalšiemu pracovníkovi v rade, ktorý urobí to isté. Tento proces pokračuje, kým posledný pracovník v linke neupraví predmet a neuloží ho na pás, ktorý ho odvezie z továrne. V tejto analógii existuje niekoľko „vrstiev“ na montážnej linke a výrobky sa pohybujú medzi vrstvami, keď sa pohybujú od pracovníka k pracovníkovi. Montážna linka má tiež vstupný bod a výstupný bod.

Viacvrstvový perceptrón si možno predstaviť ako veľmi jednoduchú výrobnú linku, ktorá sa skladá celkovo z troch vrstiev: vstupná vrstva, skrytá vrstva a výstupná vrstva. Vstupná vrstva je miesto, kde sa údaje vkladajú do MLP, a v skrytej vrstve určitý počet „pracovníkov“ spracováva údaje pred ich odovzdaním do výstupnej vrstvy, ktorá poskytuje produkt vonkajšiemu svetu. V prípade MLP sa títo pracovníci nazývajú „neuróny“ (alebo niekedy uzly) a keď manipulujú s údajmi, manipulujú s nimi prostredníctvom série matematických funkcií.

V rámci siete existujú štruktúry spájajúce uzol s uzlom s názvom „závažia“. Váhy sú predpokladom vzťahu údajových bodov pri ich pohybe v sieti. Inak povedané, váhy odrážajú úroveň vplyvu, ktorý má jeden neurón na iný neurón. Váhy prechádzajú cez „aktivačnú funkciu“, keď opúšťajú aktuálny uzol, čo je typ matematickej funkcie, ktorá transformuje údaje. Transformujú lineárne údaje na nelineárne reprezentácie, čo umožňuje sieti analyzovať zložité vzory.

Analógia s ľudským mozgom implikovaná „umelou neurónovou sieťou“ pochádza zo skutočnosti, že neuróny, ktoré tvoria ľudský mozog, sú spojené podobným spôsobom, ako sú spojené uzly v ANN.

Zatiaľ čo viacvrstvové perceptróny existujú od 1940. rokov XNUMX. storočia, existovalo množstvo obmedzení, ktoré im bránili v tom, aby boli obzvlášť užitočné. V priebehu posledných niekoľkých desaťročí sa však objavila technika s názvom „spätné šírenie” bol vytvorený, ktorý umožnil sieťam upravovať váhy neurónov a tým sa učiť oveľa efektívnejšie. Backpropagation mení váhy v neurónovej sieti, čo umožňuje sieti lepšie zachytiť skutočné vzory v údajoch.

Deep Neural Networks

Hlboké neurónové siete majú základnú formu MLP a zväčšujú ho pridaním ďalších skrytých vrstiev do stredu modelu. Takže namiesto vstupnej vrstvy, skrytej vrstvy a výstupnej vrstvy je v strede veľa skrytých vrstiev a výstupy jednej skrytej vrstvy sa stanú vstupmi pre ďalšiu skrytú vrstvu, až kým dáta nedosiahnu celú cestu. cez sieť a boli vrátené.

Viaceré skryté vrstvy hlbokej neurónovej siete sú schopné interpretovať zložitejšie vzorce ako tradičný viacvrstvový perceptrón. Rôzne vrstvy hlbokej neurónovej siete sa učia vzory rôznych častí údajov. Napríklad, ak vstupné údaje pozostávajú z obrázkov, prvá časť siete môže interpretovať jas alebo tmavosť pixelov, zatiaľ čo neskoršie vrstvy vyberú tvary a hrany, ktoré možno použiť na rozpoznanie objektov na obrázku.

Rôzne typy neurónových sietí

Existujú rôzne typy neurónových sietí a každý z rôznych typov neurónových sietí má svoje výhody a nevýhody (a teda aj vlastné prípady použitia). Typ hlbokej neurónovej siete opísaný vyššie je najbežnejším typom neurónovej siete a často sa označuje ako dopredná neurónová sieť.

Jednou z variácií neurónových sietí je rekurentná neurónová sieť (RNN). V prípade rekurentných neurónových sietí sa na uchovávanie informácií z predchádzajúcich stavov analýzy používajú mechanizmy cyklovania, čo znamená, že môžu interpretovať údaje tam, kde záleží na poradí. RNN sú užitočné pri odvodzovaní vzorov zo sekvenčných/chronologických údajov. Rekurentné neurónové siete môžu byť jednosmerné alebo obojsmerné. V prípade obojsmernej neurónovej siete môže sieť preberať informácie z neskoršej časti sekvencie, ako aj z predchádzajúcich častí sekvencie. Keďže obojsmerná RNN zohľadňuje viac informácií, dokáže z údajov lepšie čerpať správne vzory.

Konvolučná neurónová sieť je špeciálny typ neurónovej siete, ktorá je zbehlá v interpretácii vzorov nachádzajúcich sa v obrázkoch. CNN funguje tak, že prejde filtrom cez pixely obrázka a dosiahne číselnú reprezentáciu pixelov v obrázku, ktorú potom môže analyzovať na vzory. CNN je štruktúrovaná tak, že najprv prídu konvolučné vrstvy, ktoré vytiahnu pixely z obrazu, a potom prídu na rad husto spojené dopredné vrstvy, tie, ktoré sa skutočne naučia rozpoznávať objekty.