Umelá inteligencia

Hlboké učenie vs posilňovacie učenie

Aktualizované on Januára 18, 2023

Deep Learning a Reinforcement Learning sú dve z najpopulárnejších podskupín umelej inteligencie. AI trh bola v roku 120 približne 2022 miliárd USD a zvyšuje sa pri ohromujúcej CAGR nad 38 %. Ako sa umelá inteligencia vyvíjala, tieto dva prístupy (RL a DL) sa používali na riešenie mnohých problémov vrátane rozpoznávania obrázkov, strojového prekladu a rozhodovania pre zložité systémy. Ľahko zrozumiteľným spôsobom preskúmame, ako fungujú spolu s ich aplikáciami, obmedzeniami a rozdielmi.

Čo je hlboké učenie (DL)?

Hlboké učenie je podmnožinou strojové učenie v ktorej používame neurónové siete na rozpoznávanie vzorov v daných údajoch na prediktívne modelovanie na neviditeľných údajoch. Údaje môžu byť tabuľkové, textové, obrazové alebo rečové.

Hlboké učenie sa objavilo v 1950-tych rokoch, keď Frank Rosenblatt napísal výskumnú prácu o Perceptróne v roku 1958. Perceptrón bol prvou architektúrou neurónovej siete, ktorú bolo možné trénovať na vykonávanie úloh lineárneho učenia pod dohľadom. Postupom času výskum v tejto oblasti, dostupnosť obrovského množstva údajov a rozsiahle výpočtové zdroje prehĺbili oblasť hlbokého vzdelávania.

Ako funguje hlboké vzdelávanie?

Neurónová sieť je stavebným kameňom hlbokého učenia. Ľudský mozog inšpiruje neurónovú sieť; Obsahuje uzly (neuróny), ktoré prenášajú informácie. Neurónová sieť má tri vrstvy:

Vstupná vrstva
Skrytá vrstva
Výstupná vrstva.

Vstupná vrstva prijíma dáta zadané používateľom a odovzdáva ich skrytej vrstve. Skrytá vrstva vykonáva nelineárnu transformáciu údajov a výstupná vrstva zobrazuje výsledky. Chyba medzi predikciou na výstupnej vrstve a skutočnou hodnotou sa vypočíta pomocou stratovej funkcie. Proces pokračuje opakovane, kým sa strata minimalizuje.

Neural Network

Typy architektúr hlbokého učenia

Existujú rôzne typy architektúr neurónových sietí, ako napríklad:

Umelé neurónové siete (ANN)
Konvolučné neurónové siete (CNN)
Opakujúce sa neurónové siete (RNN)
Generative Adversarial Networks (GAN) atď.

Použitie architektúry neurónovej siete závisí od typu uvažovaného problému.

Aplikácie hlbokého učenia

Deep Learning nachádza svoje uplatnenie v mnohých odvetviach.

V zdravotníctve Počítačové videnie môžu byť použité metódy založené na konvolučných neurónových sieťach analýza lekárskych snímokCT a MRI skeny.
Vo finančnom sektore dokáže predpovedať ceny akcií a odhaliť podvodné aktivity.
Metódy hlbokého učenia v Spracovanie prirodzeného jazyka sa používajú na strojový preklad, analýzu sentimentu atď.

Obmedzenia hlbokého učenia

Hoci hlboké vzdelávanie dosiahlo v mnohých odvetviach najmodernejšie výsledky, má svoje obmedzenia, ktoré sú nasledovné:

Obrovské údaje: Hlboké učenie vyžaduje obrovské množstvo označených údajov na školenie. Nedostatok označených údajov poskytne podpriemerné výsledky.
Časová náročnosť: Tréning na množine údajov môže trvať hodiny a niekedy aj dni. Hlboké učenie zahŕňa veľa experimentov na dosiahnutie požadovaného benchmarku alebo hmatateľných výsledkov a nedostatok rýchleho opakovania môže spomaliť proces.
Výpočtové zdroje: Hlboké vzdelávanie vyžaduje na školenie výpočtové zdroje, ako sú GPU a TPU. Modely hlbokého učenia zaberajú po tréningu dostatok priestoru, čo môže byť problém počas nasadenia.

Čo je posilňovacie vzdelávanie (RL)?

Na druhej strane posilňovacie učenie je podmnožinou umelej inteligencie, v ktorej agent vykonáva akciu vo svojom prostredí. „Učenie“ sa deje odmeňovaním agenta, keď podstúpi požadované správanie, a inak ho penalizuje. Vďaka skúsenostiam sa agent naučí optimálnu politiku na maximalizáciu odmeny.

Historicky sa posilňovacie učenie dostalo do centra pozornosti v 1950. a 1960. rokoch XNUMX. storočia, pretože rozhodovacie algoritmy boli vyvinuté pre zložité systémy. Preto výskum v tejto oblasti viedol k novým algoritmom, ako je Q-Learning, SARSA a herec-kritik, ktoré podporili praktickosť tejto oblasti.

Aplikácie posilňovacieho vzdelávania

Posilňovacie vzdelávanie má významné uplatnenie vo všetkých hlavných priemyselných odvetviach.

Robotika je jednou z najslávnejších aplikácií v posilňovacom učení. Pomocou metód učenia zosilnenia umožňujeme robotom učiť sa z prostredia a vykonávať požadovanú úlohu.
Reinforcement Learning sa používa na vývoj motorov pre hry ako Chess and Go. AlphaGo (Go engine) a AlphaZero (šachový engine) sú vyvinuté pomocou posilňovacieho učenia.
Vo financiách môže posilnenie učenia pomôcť pri vytváraní ziskového obchodu.

Obmedzenia posilňovacieho vzdelávania

Obrovské údaje: Posilňovacie vzdelávanie vyžaduje veľké množstvo údajov a skúseností, aby ste sa naučili optimálne pravidlá.
Využívanie odmeny: Je dôležité udržiavať rovnováhu medzi skúmaním stavu, formovaním optimálnej politiky a využívaním získaných vedomostí na zvýšenie odmeny. Agent nedosiahne najlepší výsledok, ak je prieskum podpriemerný.
Bezpečnosť: Posilňovacie vzdelávanie vyvoláva obavy o bezpečnosť, ak systém odmeňovania nie je navrhnutý a primerane obmedzený.

Výrazné rozdiely

Stručne povedané, hlavné rozdiely medzi posilňovaním a hlbokým učením sú nasledovné:

Deep Learning	Posilňovacie učenie
Obsahuje vzájomne prepojené uzly a učenie sa deje minimalizáciou strát úpravou váh a zaujatosti neurónov.	Obsahuje agenta, ktorý sa učí od prostredia interakciou s ním, aby dosiahol optimálnu politiku.
Hlboké učenie sa používa pri problémoch s riadeným učením, kde sú údaje označené. Používa sa však v učenie bez dozoru pre prípady použitia, ako je detekcia anomálií atď.	Posilnené učenie zahŕňa agenta, ktorý sa učí zo svojho prostredia bez toho, aby potreboval označené údaje.
Používa sa pri detekcii a klasifikácii objektov, strojovom preklade a analýze sentimentu atď.	Používa sa v robotike, hrách a autonómnych vozidlách.

Hlboké posilňovacie vzdelávanie – kombinácia

Hlboké posilnenie učenia sa objavila ako nová technika, ktorá kombinuje metódy posilňovania a hlbokého učenia. Najnovší šachový motor, ako napr alfazero, je príkladom Deep Reinforcement Learning. V AlphaZero využíva Deep Neural Networks matematické funkcie, aby sa agent naučil hrať šach sám proti sebe.

Každý rok veľkí hráči na trhu vyvíjajú nové výskumy a produkty na trhu. Očakáva sa, že hlboké vzdelávanie a posilňovacie vzdelávanie nás ohromí špičkovými metódami a produktmi.

Chcete viac obsahu súvisiaceho s AI? Navštívte zjednotiť.ai.