stub Kas yra „Fow-shot“ mokymasis? - Vienykitės.AI
Susisiekti su mumis
AI meistriškumo klasė:

AI 101 m

Kas yra „Fow-shot“ mokymasis?

mm
Atnaujinta on

Mokymasis iš kelių kartų reiškia įvairius algoritmus ir metodus, naudojamus kuriant AI modelį naudojant labai nedidelį mokymo duomenų kiekį. Mokymosi metu stengiamasi leisti dirbtinio intelekto modeliui atpažinti ir klasifikuoti naujus duomenis po to, kai buvo atlikta palyginti nedaug mokymo atvejų. Nedaug kadrų mokymo skiriasi nuo tradicinių mašininio mokymosi modelių mokymo metodų, kai paprastai naudojamas didelis mokymo duomenų kiekis. Mokymasis yra nedidelis daugiausia naudojamas kompiuteriniam regėjimui.

Norėdami sukurti geresnę intuiciją mokymuisi per kelis kartus, panagrinėkime koncepciją išsamiau. Išnagrinėsime motyvus ir koncepcijas, slypinčias už kelių kadrų mokymosi, išnagrinėsime kai kuriuos įvairius mokymosi per kelis kartus tipus ir apžvelgsime kai kuriuos modelius, naudojamus aukšto lygio mokymuisi per kelis kartus. Galiausiai išnagrinėsime kai kurias mokymosi programas.

Kas yra „Fow-shot“ mokymasis?

„Mokymasis iš kelių kartų“ apibūdina mašininio mokymosi modelio mokymo praktiką su minimaliu duomenų kiekiu. Paprastai mašininio mokymosi modeliai mokomi naudojant didelius duomenų kiekius, kuo didesnis, tuo geriau. Tačiau mokymasis iš kelių kartų yra svarbi mašininio mokymosi koncepcija dėl kelių skirtingų priežasčių.

Viena iš kelių kartų mokymosi priežasčių yra ta, kad tai gali labai sumažinti duomenų kiekį, reikalingą mašininio mokymosi modeliui parengti, o tai sutrumpina laiką, reikalingą dideliems duomenų rinkiniams pažymėti. Be to, mokymasis per kelis kartus sumažina poreikį pridėti specifinių funkcijų įvairioms užduotims, kai naudojamas bendras duomenų rinkinys skirtingiems pavyzdžiams kurti. Išmokus nedaug kadrų, modeliai idealiai gali tapti tvirtesni ir atpažinti objektus remiantis mažiau duomenų, sukuriant bendresnius modelius, o ne labai specializuotus modelius, kurie yra įprasta.

Kompiuterinio regėjimo lauke dažniausiai naudojamas mokymasis iš kelių kartų, nes dėl kompiuterinio regėjimo problemų pobūdžio reikia arba didelio duomenų kiekio, arba lankstaus modelio.

Pogrupiai

Frazė „mokymasis iš kelių kartų“ iš tikrųjų yra tik viena mokymosi rūšis, naudojant labai nedaug mokymo pavyzdžių. Kadangi naudojate tik „kelis“ mokymo pavyzdžius, yra kelių kartų mokymosi subkategorijos, kurios taip pat apima mokymą su minimaliu duomenų kiekiu. Vienkartinis mokymasis yra dar vienas modelio mokymo tipas, kurio metu modelis mokomas atpažinti objektą pamačius tik vieną to objekto vaizdą. Bendroji mokymosi vienu metu ir kelių kadrų taktika yra tokia pati. Žinokite, kad terminas „keleto kadrų“ mokymasis gali būti naudojamas kaip bendras terminas, apibūdinantis bet kokią situaciją, kai modelis mokomas naudojant labai mažai duomenų.

Mokymosi mažai kartų metodai

Daugumą trumpalaikių mokymosi metodų galima priskirti vienai iš trijų kategorijų: duomenų lygio metodai, parametrų lygio metodai ir metrika pagrįsti metodai.

Duomenų lygio metodai

Duomenų lygmens požiūris į mokymąsi kelis kartus yra labai paprastas. Norėdami išmokyti modelį, kai neturite pakankamai treniruočių duomenų, galite tiesiog gauti daugiau treniruočių duomenų. Yra įvairių metodų, kuriuos duomenų mokslininkas gali naudoti, kad padidintų turimų mokymo duomenų kiekį.

Panašūs treniruočių duomenys gali sukurti tikslių tikslinių duomenų, pagal kuriuos treniruojate klasifikatorių, atsarginę kopiją. Pavyzdžiui, jei mokote klasifikatorių atpažinti konkrečias šunų rūšis, bet neturite daug konkrečios rūšies, kurią bandėte klasifikuoti, vaizdų, galite įtraukti daug šunų vaizdų, kurie padėtų klasifikatoriui nustatyti bendrąsias šuns savybes. .

Duomenų papildymas gali sukurti daugiau treniruočių duomenų klasifikatoriui. Paprastai tai apima transformacijų taikymą esamiems mokymo duomenims, pvz., esamų vaizdų pasukimą, kad klasifikatorius peržiūrėtų vaizdus iš skirtingų kampų. GAN taip pat gali būti naudojami naujiems mokymo pavyzdžiams generuoti remiantis tuo, ką jie išmoko iš kelių autentiškų jūsų turimų mokymo duomenų pavyzdžių.

Parametrų lygio metodai

Meta-mokymasis

Vienas iš parametrų lygio mokymosi kelių kartų metodu apima technikos, vadinamos „meta-mokymasis“. Meta mokymasis apima mokyti modelio, kaip mokytis kurios funkcijos yra svarbios atliekant mašininio mokymosi užduotį. Tai galima pasiekti sukuriant metodą, kaip reguliuoti modelio parametrų erdvės tyrinėjimą.

Meta-mokymasis naudoja du skirtingus modelius: mokytojo modelį ir mokinio modelį. „Mokytojo“ ir „mokinio“ modelis. Mokytojo modelis išmoksta įterpti parametrų erdvę, o mokinio algoritmas išmoksta atpažinti ir klasifikuoti tikrus duomenų rinkinio elementus. Kitaip tariant, mokytojo modelis išmoksta optimizuoti modelį, o mokinio modelis – klasifikuoti. Mokytojo modelio išėjimai naudojami mokinio modeliui mokyti, mokinio modeliui parodant, kaip derėtis dėl didelės parametrų erdvės, atsirandančios dėl per mažai mokymo duomenų. Taigi meta-mokymosi „meta“.

Viena iš pagrindinių problemų, susijusių su kelių kadrų mokymosi modeliais, yra ta, kad jie gali lengvai prisitaikyti prie treniruočių duomenų, nes juose dažnai yra didelės erdvės. Modelio parametrų erdvės ribojimas išsprendžia šią problemą, ir nors tai galima padaryti taikant reguliavimo metodus ir parenkant tinkamas praradimo funkcijas, mokytojo algoritmo naudojimas gali žymiai pagerinti kelių kadrų modelio našumą.

Kelių kadrų mokymosi klasifikatoriaus modelis (mokinio modelis) stengsis apibendrinti, remdamasis nedideliu mokymo duomenų kiekiu, kurį jis pateikia, o jo tikslumas gali padidėti naudojant mokytojo modelį, nukreipiantį jį per didelių matmenų parametrų erdvę. Ši bendra architektūra vadinama „gradientu pagrįstu“ meta-mokytoju.

Visas gradientu pagrįsto meta besimokančiojo mokymo procesas yra toks:

  1. Sukurkite bazinį besimokančiojo (mokytojo) modelį
  2. Treniruokite pagrindinį besimokančiojo modelį ant atramos rinkinio
  3. Nustatykite bazinio besimokančiojo grąžos prognozes pagal užklausą
  4. Apmokykite meta-besimokantį (studentą) apie nuostolius, atsiradusius dėl klasifikavimo klaidos

Meta mokymosi variantai

Modelis-Agnostic Meta-Learning yra metodas, naudojamas pagrindiniam gradientu pagrįsto meta-mokymosi metodui, kurį aptarėme aukščiau, papildyti.

Kaip minėjome aukščiau, gradientu pagrįstas meta-mokytojas naudoja ankstesnę patirtį, įgytą taikant mokytojo modelį sureguliuoti save ir pateikti tikslesnes prognozes nedideliam treniruočių duomenų kiekiui. Tačiau pradedant nuo atsitiktinai inicijuotų parametrų, modelis vis tiek gali per daug pritaikyti duomenis. Siekiant to išvengti, apribojant mokytojo modelio/bazinio modelio įtaką, sukuriamas „modelio agnostikos“ meta-mokinys. Užuot mokęs mokinio modelį tiesiogiai pagal mokytojo modelio numatytų prognozių praradimą, mokinio modelis mokomas apie savo prognozių praradimą.

Kiekvienam modelio agnostiko meta-mokančiojo mokymo epizodui:

  1. Sukurta dabartinio meta-mokančiojo modelio kopija.
  2. Kopija apmokoma naudojant bazinį modelį / mokytojo modelį.
  3. Kopija pateikia treniruočių duomenų prognozes.
  4. Skaičiuoti nuostoliai naudojami meta-mokymo programai atnaujinti.

Metrinis mokymasis

Metriniai mokymosi metodai kuriant kelių kadrų mokymosi modelį paprastai apima As pagrindinių atstumo metrikų naudojimas kad būtų galima palyginti duomenų rinkinio pavyzdžius. Metriniai mokymosi algoritmai, tokie kaip kosinuso atstumas, naudojami klasifikuojant užklausos pavyzdžius pagal jų panašumą į pagalbinius pavyzdžius. Vaizdo klasifikatoriui tai reikštų tiesiog vaizdų klasifikavimą pagal paviršinių savybių panašumą. Pasirinkus palaikomąjį vaizdų rinkinį ir pavertus jį įterpimo vektoriumi, tas pats daroma su užklausų rinkiniu ir lyginamos dviejų vektorių reikšmės, o klasifikatorius pasirenka klasę, kurios reikšmes yra artimiausios vektorizuotos užklausos rinkiniui. .

Pažangesnis metrika pagrįstas sprendimas yra „prototipinis tinklas“. Prototipiniai tinklai sujungia duomenų taškus, derindami grupavimo modelius su aukščiau aprašyta metrika pagrįsta klasifikacija. Kaip ir K-means klasterizavimo atveju, klasterių centroidai apskaičiuojami pagal klases, esančias palaikymo ir užklausų rinkiniuose. Tada taikoma euklidinė atstumo metrika, skirta nustatyti skirtumą tarp užklausų rinkinių ir paramos rinkinio centroidų, priskiriant užklausų rinkinį, kuriai paramos rinkinių klasės yra artimesnės.

Dauguma kitų kelių žingsnių mokymosi metodų yra tik pirmiau aprašytų pagrindinių metodų variantai.

Programos, skirtos „Fow-Shot Learning“.

Keletas žingsnių mokymasis gali būti pritaikytas daugelyje skirtingų duomenų mokslo posričių, tokių kaip kompiuterinis matymas, natūralios kalbos apdorojimas, robotika, sveikatos priežiūra ir signalų apdorojimas.

Kelių kadrų mokymosi kompiuterinės regos erdvėje programos apima efektyvų simbolių atpažinimą, vaizdų klasifikavimą, objektų atpažinimą, objekto sekimą, judesio numatymą ir veiksmų lokalizavimą. Natūralios kalbos apdorojimo programos, skirtos kelių kadrų mokymuisi, apima vertimą, sakinio užbaigimą, vartotojo ketinimų klasifikavimą, nuotaikų analizę ir kelių etikečių teksto klasifikavimą. Robotikos srityje galima pasinaudoti mažais žingsniais, kad robotai išmoktų užduotis iš kelių demonstracijų, leidžiant robotams išmokti atlikti veiksmus, judėti ir naršyti juos supantį pasaulį. Vaistų atradimas nedaug kartų yra nauja DI sveikatos priežiūros sritis. Galiausiai, kelių kadrų mokymasis turi akustinio signalo apdorojimo programų, kurios yra garso duomenų analizės procesas, leidžiantis dirbtinio intelekto sistemoms klonuoti balsus, remiantis vos keliais vartotojų pavyzdžiais arba balso konvertavimu iš vieno vartotojo į kitą.

Tinklaraštininkas ir programuotojas, turintis specialybių Mašininis mokymasis ir Gilus mokymasis temomis. Danielis tikisi padėti kitiems panaudoti AI galią socialinei gerovei.