škrbina Što je meta-učenje? - Ujedinite se.AI
Povežite se s nama
Majstorski tečaj umjetne inteligencije:

AI 101

Što je meta-učenje?

mm
Ažurirano on

Što je meta-učenje?

Jedno od najbrže rastućih područja istraživanja strojnog učenja je područje meta-učenje. Metaučenje, u kontekstu strojnog učenja, korištenje je algoritama strojnog učenja za pomoć u obuci i optimizaciji drugih modela strojnog učenja. Kako meta-učenje postaje sve popularnije i razvija se više tehnika meta-učenja, korisno je razumjeti što je meta-učenje i imati osjećaj za različite načine na koje se može primijeniti. Ispitajmo ideje iza meta-učenja, vrste metaučenja, kao i neke od načina na koje se meta-učenje može koristiti.

Izraz meta-učenje skovao je Donald Maudsley kako bi opisao proces kojim ljudi počinju oblikovati ono što uče, postajući "sve više kontrolirajući navike percepcije, istraživanja, učenja i rasta koje su internalizirali". Kasnije će kognitivni znanstvenici i psiholozi opisati meta-učenje kao "učiti kako učiti".

Za verziju metaučenja sa strojnim učenjem, opća ideja "učiti kako učiti" primjenjuje se na AI sustave. U smislu umjetne inteligencije, meta-učenje je sposobnost umjetno inteligentnog stroja da nauči kako izvršiti različite složene zadatke, preuzimajući principe koje je koristio za učenje jednog zadatka i primjenjujući ih na druge zadatke. Sustavi umjetne inteligencije obično se moraju uvježbati da izvrše zadatak kroz svladavanje mnogih malih podzadataka. Ova obuka može potrajati dugo i AI agenti ne mogu lako prenijeti znanje stečeno tijekom jednog zadatka na drugi zadatak. Stvaranje modela i tehnika metaučenja može pomoći umjetnoj inteligenciji da nauči generalizirati metode učenja i brže stjecati nove vještine.

Vrste metaučenja

Optimizator meta-učenje

Meta-učenje se često koristi za optimiziranje performansi već postojeće neuronske mreže. Metode meta učenja pomoću optimizatora obično funkcioniraju podešavanjem hiperparametara različite neuronske mreže kako bi se poboljšala izvedba osnovne neuronske mreže. Rezultat je da bi ciljna mreža trebala postati bolja u obavljanju zadatka za koji se trenira. Jedan primjer optimizatora meta učenja je korištenje mreže za poboljšanje gradijentni spust Rezultati.

Nekoliko snimaka meta-učenja

Pristup metaučenju s nekoliko poteza je onaj u kojem se konstruira duboka neuronska mreža koja je sposobna generalizirati skupove podataka za obuku na nevidljive skupove podataka. Instanca klasifikacije u nekoliko slučajeva slična je normalnom zadatku klasifikacije, ali umjesto toga uzorci podataka su cijeli skupovi podataka. Model se trenira na mnogo različitih zadataka učenja/setova podataka, a zatim se optimizira za vrhunsku izvedbu na mnoštvu zadataka učenja i nevidljivih podataka. U ovom pristupu, jedan uzorak obuke podijeljen je u više klasa. To znači da bi svaki uzorak/skup podataka za obuku potencijalno mogao biti sastavljen od dvije klase, za ukupno 4 snimke. U ovom slučaju, ukupni zadatak obuke mogao bi se opisati kao zadatak klasifikacije od 4 hica i 2 klase.

Kod učenja u nekoliko snimaka, ideja je da su pojedinačni uzorci za obuku minimalistički i da mreža može naučiti identificirati objekte nakon što je vidjela samo nekoliko slika. To je slično načinu na koji dijete uči razlikovati predmete nakon što je vidjelo samo nekoliko slika. Ovaj pristup korišten je za stvaranje tehnika kao što su jednokratni generativni modeli i neuronske mreže s proširenom memorijom.

Metričko meta-učenje

Metaučenje temeljeno na metrici je korištenje neuronskih mreža za određivanje koristi li se metrika učinkovito i postižu li mreža ili mreže ciljnu metriku. Metričko meta-učenje slično je učenju u nekoliko pokušaja po tome što se samo nekoliko primjera koristi za treniranje mreže i njezino učenje metričkog prostora. Ista metrika koristi se u različitim domenama i ako mreže odstupaju od metrike, smatra se da ne uspijevaju.

Rekurentni model meta-učenja

Rekurentni model meta-učenja je primjena tehnika meta-učenja na rekurentne neuronske mreže i slične mreže dugotrajnog pamćenja. Ova tehnika funkcionira obučavanjem RNN/LSTM modela za sekvencijalno učenje skupa podataka i zatim korištenjem ovog obučenog modela kao osnove za drugog učenika. Metaučenik preuzima specifični algoritam optimizacije koji je korišten za obuku početnog modela. Naslijeđena parametrizacija meta-učenika omogućuje mu brzu inicijalizaciju i konvergenciju, ali i dalje mogućnost ažuriranja za nove scenarije.

Kako funkcionira metaučenje?

Točan način na koji se provodi meta-učenje varira ovisno o modelu i prirodi zadatka. Međutim, općenito, zadatak meta učenja uključuje kopiranje parametara prve mreže u parametre druge mreže/optimizatora.

U meta-učenju postoje dva procesa obuke. Model metaučenja obično se trenira nakon nekoliko koraka obuke na osnovnom modelu. Nakon koraka naprijed, unatrag i optimizacije koji treniraju osnovni model, provodi se prolaz obuke naprijed za model optimizacije. Na primjer, nakon tri ili četiri koraka obuke na osnovnom modelu, izračunava se meta-gubitak. Nakon što se izračuna meta-gubitak, gradijenti se izračunavaju za svaki meta-parametar. Nakon što se to dogodi, meta-parametri u optimizatoru se ažuriraju.

Jedna od mogućnosti za izračunavanje meta-gubitka je završiti prolaz naprijed početnog modela i zatim kombinirati gubitke koji su već izračunati. Meta-optimizator bi čak mogao biti još jedan meta-učenik, iako se u određenom trenutku mora koristiti diskretni optimizator poput ADAM-a ili SGD-a.

Mnogi modeli dubokog učenja mogu imati stotine tisuća ili čak milijune parametara. Stvaranje meta-učenika koji ima potpuno novi skup parametara bilo bi računski skupo i iz tog razloga obično se koristi taktika koja se zove dijeljenje koordinata. Dijeljenje koordinata uključuje projektiranje meta-učenika/optimizatora tako da nauči jedan parametar iz osnovnog modela, a zatim samo klonira taj parametar umjesto svih ostalih parametara. Rezultat je da parametri koje optimizator posjeduje ne ovise o parametrima modela.

Bloger i programer sa specijalnošću u Strojno učenje i Duboko učenje temama. Daniel se nada pomoći drugima da iskoriste snagu umjetne inteligencije za društveno dobro.