výhonek Co je to meta-learning? - Spojte se.AI
Spojte se s námi
Mistrovská třída AI:

AI 101

Co je to meta-learning?

mm
aktualizováno on

Co je to meta-learning?

Jednou z nejrychleji rostoucích oblastí výzkumu v oblasti strojového učení je oblast meta-učení. Meta-learning v kontextu strojového učení je použití algoritmů strojového učení, které pomáhají při trénování a optimalizaci jiných modelů strojového učení. Vzhledem k tomu, že se meta-learning stává stále populárnějším a rozvíjí se více meta-learningových technik, je prospěšné porozumět tomu, co meta-learning je, a mít smysl pro různé způsoby jeho použití. Pojďme se podívat na myšlenky meta-learningu, typy meta-learningu, stejně jako některé ze způsobů, jak lze meta-learning použít.

Termín meta-learning zavedl Donald Maudsley, aby popsal proces, při kterém lidé začínají utvářet to, co se učí, a získávají „stále větší kontrolu nad návyky vnímání, dotazování, učení a růstu, které si osvojili“. Později kognitivní vědci a psychologové popsali metaučení jako „učení se, jak se učit“.

U verze meta-learningu se strojovým učením je obecná myšlenka „učit se, jak se učit“ aplikována na systémy AI. Ve smyslu umělé inteligence je meta-learning schopnost uměle inteligentního stroje naučit se provádět různé složité úkoly, převzít principy, které používal k naučení jednoho úkolu, a aplikovat je na jiné úkoly. Systémy umělé inteligence musí být obvykle vyškoleny, aby splnily úkol prostřednictvím zvládnutí mnoha malých dílčích úkolů. Toto školení může trvat dlouho a agenti umělé inteligence nesnadno převádějí znalosti naučené během jednoho úkolu do jiného. Vytváření modelů a technik metavzdělávání může pomoci umělé inteligenci naučit se zobecňovat metody učení a rychleji získávat nové dovednosti.

Typy meta-learningu

Meta-Learning Optimalizátoru

Meta-learning se často používá k optimalizaci výkonu již existující neuronové sítě. Metody meta-learningu Optimalizátoru obvykle fungují vyladěním hyperparametrů jiné neuronové sítě, aby se zlepšil výkon základní neuronové sítě. Výsledkem je, že cílová síť by se měla zlepšit při plnění úkolu, na který je trénována. Jedním z příkladů optimalizátoru metalearningu je využití sítě ke zlepšení gradientní sestup výsledky.

Meta-learning z několika výstřelů

Několikanásobný meta-learningový přístup je takový, kdy je navržena hluboká neuronová síť, která je schopna zobecnit z trénovacích datových sad na neviditelné datové sady. Instance několikanásobné klasifikace je podobná běžné klasifikační úloze, ale místo toho jsou vzorky dat celé datové sady. Model je trénován na mnoha různých výukových úlohách/souborech dat a poté je optimalizován pro špičkový výkon u mnoha trénovacích úloh a neviditelných dat. V tomto přístupu je jeden tréninkový vzorek rozdělen do více tříd. To znamená, že každý tréninkový vzorek/soubor dat by mohl být potenciálně tvořen dvěma třídami, celkem tedy 4 snímky. V tomto případě lze celkový tréninkový úkol popsat jako 4-ranný 2třídní klasifikační úkol.

V několikanásobném učení je myšlenkou, že jednotlivé tréninkové vzorky jsou minimalistické a že se síť může naučit identifikovat objekty poté, co viděla jen několik obrázků. Je to podobné, jako když se dítě učí rozlišovat předměty poté, co vidělo jen pár obrázků. Tento přístup byl použit k vytvoření technik, jako jsou jednorázové generativní modely a neuronové sítě rozšířené o paměť.

Metrický meta-learning

Meta-learning založený na metrikách je využití neuronových sítí k určení, zda je metrika používána efektivně a zda síť nebo sítě dosahují cílové metriky. Metrické meta-learning je podobné několikanásobnému učení v tom, že se používá jen několik příkladů k trénování sítě a jejímu učení se metrický prostor. Stejná metrika se používá v různých doménách, a pokud se sítě od této metriky liší, jsou považovány za selhávající.

Opakující se model metaučení

Rekurentní model meta-learning je aplikace meta-learningových technik na opakující se neuronové sítě a podobné sítě s dlouhou krátkodobou pamětí. Tato technika funguje tak, že se trénuje model RNN/LSTM, aby se postupně naučil soubor dat, a poté se tento trénovaný model používá jako základ pro dalšího studenta. Meta-učitel převezme specifický optimalizační algoritmus, který byl použit k trénování původního modelu. Zděděná parametrizace meta-learneru umožňuje rychle se inicializovat a konvergovat, ale stále být schopen aktualizovat pro nové scénáře.

Jak funguje meta-learning?

Přesný způsob, jakým je meta-learning veden, se liší v závislosti na modelu a povaze daného úkolu. Obecně však jde o meta-learningový úkol zahrnuje kopírování parametrů první sítě do parametrů druhé sítě/optimalizátoru.

V meta-learningu existují dva tréninkové procesy. Meta-learningový model je obvykle trénován po provedení několika kroků trénování na základním modelu. Po krocích vpřed, vzad a optimalizaci, které trénují základní model, se provádí trénovací průchod vpřed pro model optimalizace. Například po třech nebo čtyřech krocích tréninku na základním modelu se vypočítá meta-ztráta. Poté, co je vypočítána ztráta metadat, jsou pro každý metaparametr vypočítány gradienty. Poté, co k tomu dojde, jsou aktualizovány metaparametry v optimalizátoru.

Jednou z možností pro výpočet metaztrát je dokončit dopředný tréninkový průchod počátečního modelu a poté zkombinovat ztráty, které již byly spočítány. Meta-optimalizátor by mohl být dokonce dalším meta-učitelem, i když v určitém okamžiku je nutné použít diskrétní optimalizátor, jako je ADAM nebo SGD.

Mnoho modelů hlubokého učení může mít stovky tisíc nebo dokonce miliony parametrů. Vytvoření meta-learneru, který má zcela novou sadu parametrů, by bylo výpočetně nákladné, a z tohoto důvodu se obvykle používá taktika zvaná sdílení souřadnic. Sdílení souřadnic zahrnuje vytvoření meta-learneru/optimalizátoru tak, aby se naučil jeden parametr ze základního modelu a pak pouze naklonoval tento parametr na místo všech ostatních parametrů. Výsledkem je, že parametry, které má optimalizátor, nezávisí na parametrech modelu.

Blogerka a programátorka se specializací v Strojové učení a Hluboké učení témata. Daniel doufá, že pomůže ostatním využívat sílu AI pro společenské dobro.