peň Čo je to metaučenie? - Spojte sa.AI
Spojte sa s nami
Masterclass AI:

AI 101

Čo je to metaučenie?

mm
Aktualizované on

Čo je to metaučenie?

Jednou z najrýchlejšie rastúcich oblastí výskumu strojového učenia je oblasť meta-učenie. Meta-learning v kontexte strojového učenia je použitie algoritmov strojového učenia na pomoc pri trénovaní a optimalizácii iných modelov strojového učenia. Keďže sa meta-learning stáva čoraz populárnejším a vyvíja sa viac meta-learningových techník, je užitočné pochopiť, čo je meta-učenie a mať zmysel pre rôzne spôsoby jeho využitia. Pozrime sa na myšlienky meta-learningu, typy metaučenia, ako aj niektoré zo spôsobov, ako je možné použiť meta-learning.

Termín meta-learning zaviedol Donald Maudsley, aby opísal proces, v ktorom ľudia začínajú formovať to, čo sa učia, a získavajú „čoraz väčšiu kontrolu nad návykmi vnímania, skúmania, učenia a rastu, ktoré si osvojili“. Neskôr kognitívni vedci a psychológovia opísali metaučenie ako „učenie sa, ako sa učiť“.

Vo verzii strojového učenia meta-learningu sa všeobecná myšlienka „učiť sa, ako sa učiť“ aplikuje na systémy AI. V zmysle AI je metaučenie schopnosťou umelo inteligentného stroja naučiť sa vykonávať rôzne zložité úlohy, pričom princípy, ktoré použil na učenie sa jednej úlohy, aplikujú na iné úlohy. Systémy AI sa zvyčajne musia trénovať, aby splnili úlohu zvládnutím mnohých malých čiastkových úloh. Toto školenie môže trvať dlho a agenti AI len ťažko prenášajú vedomosti získané počas jednej úlohy do inej úlohy. Vytváranie modelov a techník metaučenia môže pomôcť AI naučiť sa zovšeobecňovať metódy učenia a rýchlejšie získavať nové zručnosti.

Typy metaučenia

Meta-Learning Optimalizátora

Meta-learning sa často používa na optimalizáciu výkonu už existujúcej neurónovej siete. Metódy metaučenia optimalizátora zvyčajne fungujú vyladením hyperparametrov inej neurónovej siete, aby sa zlepšil výkon základnej neurónovej siete. Výsledkom je, že cieľová sieť by sa mala zlepšiť pri plnení úloh, na ktoré sa trénuje. Jedným z príkladov optimalizátora meta-learningu je použitie siete na zlepšenie gradientný zostup výsledky.

Meta-učenie s niekoľkými zábermi

Metóda meta-learningu s niekoľkými zábermi je taká, pri ktorej je vytvorená hlboká neurónová sieť, ktorá je schopná zovšeobecniť z tréningových dátových súborov na neviditeľné dátové súbory. Inštancia niekoľkonásobnej klasifikácie je podobná bežnej klasifikačnej úlohe, ale namiesto toho sú vzorkami údajov celé súbory údajov. Model je trénovaný na mnohých rôznych vzdelávacích úlohách/súboroch údajov a potom je optimalizovaný pre špičkový výkon pri množstve tréningových úloh a neviditeľných údajov. V tomto prístupe je jedna tréningová vzorka rozdelená do viacerých tried. To znamená, že každá tréningová vzorka/súbor údajov by sa potenciálne mohla skladať z dvoch tried, čo predstavuje celkovo 4 snímky. V tomto prípade by sa celková tréningová úloha dala opísať ako 4-záberová 2-triedna klasifikačná úloha.

Pri niekoľkonásobnom učení ide o to, že jednotlivé tréningové vzorky sú minimalistické a že sieť sa môže naučiť identifikovať objekty po tom, čo videla len niekoľko obrázkov. Je to podobné, ako keď sa dieťa učí rozlišovať predmety po tom, čo videlo len pár obrázkov. Tento prístup sa použil na vytvorenie techník, ako sú jednorazové generatívne modely a neurónové siete s rozšírenou pamäťou.

Metrické metaučenie

Meta-učenie založené na metrike je využitie neurónových sietí na určenie, či sa metrika používa efektívne a či sieť alebo siete dosahujú cieľovú metriku. Metrické meta-learning je podobné učeniu niekoľkých záberov v tom, že sa používa len niekoľko príkladov na trénovanie siete a na to, aby sa naučila metrický priestor. Rovnaká metrika sa používa v rôznych doménach a ak sa siete odchýlia od metriky, považujú sa za zlyhávajúce.

Opakované modelové metaučenie

Opakujúce sa modelové metaučenie je aplikácia techník metaučenia na opakujúce sa neurónové siete a podobné siete s dlhou krátkodobou pamäťou. Táto technika funguje tak, že sa trénuje model RNN/LSTM, aby sa postupne naučil súbor údajov, a potom sa tento natrénovaný model používa ako základ pre ďalšieho študenta. Meta-učiaci sa používa špecifický optimalizačný algoritmus, ktorý bol použitý na trénovanie pôvodného modelu. Zdedená parametrizácia meta-learnera umožňuje rýchlu inicializáciu a konvergenciu, ale stále je schopná aktualizovať sa pre nové scenáre.

Ako funguje metaučenie?

Presný spôsob, akým sa meta-učenie vykonáva, sa líši v závislosti od modelu a povahy danej úlohy. Vo všeobecnosti je to však úloha metaučenia zahŕňa kopírovanie parametrov prvej siete do parametrov druhej siete/optimalizátora.

V meta-learningu existujú dva tréningové procesy. Meta-learningový model sa zvyčajne trénuje po vykonaní niekoľkých krokov školenia na základnom modeli. Po krokoch vpred, vzad a optimalizácii, ktoré trénujú základný model, sa vykoná prechod vpred pre optimalizačný model. Napríklad po troch alebo štyroch krokoch tréningu na základnom modeli sa vypočíta meta-strata. Po vypočítaní meta-straty sa vypočítajú gradienty pre každý metaparameter. Keď k tomu dôjde, metaparametre v optimalizátore sa aktualizujú.

Jednou z možností na výpočet meta-straty je dokončenie prechodu dopredného tréningu počiatočného modelu a potom skombinovanie strát, ktoré už boli vypočítané. Meta-optimalizátor by mohol byť dokonca ďalší meta-učiaci sa, hoci v určitom bode sa musí použiť diskrétny optimalizátor ako ADAM alebo SGD.

Mnohé modely hlbokého učenia môžu mať státisíce alebo dokonca milióny parametrov. Vytvorenie meta-učiaceho sa, ktorý má úplne nový súbor parametrov, by bolo výpočtovo nákladné, a z tohto dôvodu sa zvyčajne používa taktika nazývaná zdieľanie súradníc. Zdieľanie súradníc zahŕňa vytvorenie meta-učiaceho/optimalizátora tak, aby sa naučil jeden parameter zo základného modelu a potom len naklonoval tento parameter namiesto všetkých ostatných parametrov. Výsledkom je, že parametre, ktoré má optimalizátor, nezávisia od parametrov modelu.

Bloger a programátor so špecializáciou v Strojové učenie a Deep Learning témy. Daniel dúfa, že pomôže ostatným využívať silu AI pre sociálne dobro.