UA 101

Modele gjenerative kundër diskriminuese të mësimit të makinerisë

Përditësuar on Janar 2, 2021

Disa modele të mësimit të makinerive i përkasin ose kategorive të modeleve "gjeneruese" ose "diskriminuese". Megjithatë çfarë është diferenca midis këto dy kategori modelesh? Çfarë do të thotë që një model të jetë diskriminues apo gjenerues?

Përgjigja e shkurtër është se modelet gjeneruese janë ato që përfshijnë shpërndarjen e grupit të të dhënave, duke kthyer një probabilitet për një shembull të caktuar. Modelet gjeneruese përdoren shpesh për të parashikuar se çfarë ndodh më pas në një sekuencë. Ndërkohë, modelet diskriminuese përdoren si për klasifikim ashtu edhe për regresion dhe ato japin një parashikim bazuar në kusht probabiliteti. Le të shqyrtojmë më në detaje ndryshimet midis modeleve gjeneruese dhe diskriminuese, në mënyrë që të kuptojmë me të vërtetë se çfarë i ndan dy llojet e modeleve dhe kur duhet të përdoret secili lloj.

Modelet gjeneruese kundrejt modeleve diskriminuese

Ka shumë mënyra për të kategorizuar një model të mësimit të makinës. Një model mund të klasifikohet si i përket kategorive të ndryshme si: modele gjeneruese, modele diskriminuese, modele parametrike, modele joparametrike, modele të bazuara në pemë, modele jo të bazuara në pemë.

Ky artikull do të fokusohet në ndryshimet midis modeleve gjeneruese dhe modeleve diskriminuese. Ne do të fillojmë me përcaktimin e modeleve gjeneruese dhe diskriminuese, dhe më pas do të eksplorojmë disa shembuj të secilit lloj modeli.

Modele Gjenerative

Modele gjeneruese janë ato që përqendrohen në shpërndarjen e klasave brenda grupit të të dhënave. Algoritmet e mësimit të makinerive zakonisht modelojnë shpërndarjen e pikave të të dhënave. Modelet gjeneruese mbështeten në gjetjen e probabilitetit të përbashkët. Krijimi i pikave ku një veçori e dhënë e hyrjes dhe një dalje/etiketë e dëshiruar ekzistojnë njëkohësisht.

Modelet gjeneruese zakonisht përdoren për të vlerësuar probabilitetet dhe gjasat, duke modeluar pikat e të dhënave dhe duke bërë dallimin midis klasave bazuar në këto probabilitete. Për shkak se modeli mëson një shpërndarje probabiliteti për grupin e të dhënave, ai mund t'i referohet kësaj shpërndarjeje probabiliteti për të gjeneruar instanca të reja të dhënash. Modelet gjeneruese shpesh mbështeten në Teorema e Bayes për të gjetur probabilitetin e përbashkët, duke gjetur p(x,y). Në thelb, modelet gjeneruese modelojnë se si u krijuan të dhënat, përgjigjuni pyetjes së mëposhtme:

"Cilat janë gjasat që kjo klasë ose një klasë tjetër të krijojë këtë pikë/shembull të dhënash?"

Shembuj të modeleve gjeneruese të mësimit të makinerive përfshijnë Analizën Diskriminuese Lineare (LDA), modelet e fshehura të Markovit dhe rrjetet Bayesian si Naive Bayes.

Modele diskriminuese

Ndërsa modelet gjeneruese mësojnë rreth shpërndarjes së grupit të të dhënave, modele diskriminuese mësoni rreth kufirit midis klasave brenda një grupi të dhënash. Me modelet diskriminuese, qëllimi është identifikimi kufiri i vendimit ndërmjet klasave për të aplikuar etiketa të besueshme të klasave në instancat e të dhënave. Modelet diskriminuese ndajnë klasat në grupin e të dhënave duke përdorur probabilitetin e kushtëzuar, duke mos bërë asnjë supozim për pikat individuale të të dhënave.

Modelet diskriminuese synojnë t'i përgjigjen pyetjes së mëposhtme:

"Në cilën anë të kufirit të vendimit gjendet ky shembull?"

Shembuj të modeleve diskriminuese në mësimin e makinerive përfshijnë makinat me vektor mbështetës, regresionin logjistik, pemët e vendimit dhe pyjet e rastësishme.

Dallimet midis Gjenerative dhe Diskriminuese

Këtu është një përmbledhje e shpejtë e ndryshimeve kryesore midis modeleve gjeneruese dhe diskriminuese.

Modelet gjeneruese:

Modelet gjeneruese synojnë të kapin shpërndarjen aktuale të klasave në grupin e të dhënave.
Modelet gjeneruese parashikojnë shpërndarjen e përbashkët të probabilitetit – p(x,y) – duke shfrytëzuar teoremën e Bayes.
Modelet gjeneruese janë llogaritëse të shtrenjta në krahasim me modelet diskriminuese.
Modelet gjeneruese janë të dobishme për detyrat e mësimit të makinerive të pambikëqyrura.
Modelet gjeneruese ndikohen nga prania e të dhënave të jashtme më shumë sesa modelet diskriminuese.

Modelet diskriminuese:

Modelet diskriminuese modelojnë kufirin e vendimit për klasat e të dhënave.
Modelet diskriminuese mësojnë probabilitetin e kushtëzuar – p(y|x).
Modelet diskriminuese janë llogaritëse të lira në krahasim me modelet gjeneruese.
Modelet diskriminuese janë të dobishme për detyrat e mbikëqyrura të mësimit të makinerisë.
Modelet diskriminuese kanë përparësinë e të qenit më të qëndrueshme ndaj të jashtmeve, ndryshe nga modelet gjeneruese.
Modelet diskriminuese janë më të qëndrueshme për të jashtzakonshme në krahasim me modelet gjeneruese.

Tani do të shqyrtojmë shkurtimisht disa shembuj të ndryshëm të modeleve gjeneruese dhe diskriminuese të mësimit të makinerive.

Shembuj të modeleve gjeneruese

Analiza Diskriminuese Lineare (LDA)

Modelet LDA funksionojnë duke vlerësuar variancën dhe mesataren e të dhënave për secilën klasë në grupin e të dhënave. Pasi të jetë llogaritur mesatarja dhe variancat për çdo klasë, mund të bëhen parashikime duke vlerësuar probabilitetin që një grup i caktuar inputesh i përket një klase të caktuar.

Modele të fshehura Markov

Zinxhirët Markov mund të mendohen si grafikë me probabilitete që tregojnë se sa gjasa ka që ne të kalojmë nga një pikë e zinxhirit, një "gjendje", në një gjendje tjetër. Zinxhirët Markov përdoren për të përcaktuar probabilitetin e lëvizjes nga gjendja j në gjendjen i, e cila mund të shënohet si p(i,j). Ky është vetëm probabiliteti i përbashkët i përmendur më lart. Një model i fshehur Markov është vendi ku përdoret një zinxhir Markov i padukshëm dhe i pavëzhgueshëm. Të dhënat hyrëse i jepen modelit dhe probabilitetet për gjendjen aktuale dhe gjendjen menjëherë para tij përdoren për të llogaritur rezultatin më të mundshëm.

Rrjetet Bayesian

Rrjetet Bayesian janë një lloj modeli grafik probabilistik. Ato përfaqësojnë varësi të kushtëzuara midis variablave, siç përfaqësohen nga një Grafik Aciklik i Drejtuar. Në një rrjet Bayesian, çdo skaj i grafikut përfaqëson një varësi të kushtëzuar dhe çdo nyje korrespondon me një ndryshore unike. Pavarësia e kushtëzuar për marrëdhëniet unike në grafik mund të përdoret për të përcaktuar shpërndarjen e përbashkët të variablave dhe për të llogaritur probabilitetin e përbashkët. Me fjalë të tjera, një rrjet Bayesian kap një nëngrup të marrëdhënieve të pavarura në një shpërndarje specifike të përbashkët probabiliteti.

Pasi një rrjet Bayesian të jetë krijuar dhe përcaktuar siç duhet, me të njohura variablat e rastësishëm, marrëdhëniet e kushtëzuara dhe shpërndarjet e probabilitetit, ai mund të përdoret për të vlerësuar probabilitetin e ngjarjeve ose rezultateve.

Një nga llojet më të përdorura të rrjeteve Bayesian është një model Naive Bayes. Një model Naive Bayes trajton sfidën e llogaritjes së probabilitetit për grupet e të dhënave me shumë parametra/variabla duke i trajtuar të gjitha tiparet si të pavarura nga njëri-tjetri.

Shembuj të modeleve diskriminuese

Mbështetni makineritë vektoriale

Mbështetni makinat vektoriale veprojnë duke vizatuar një kufi vendimi midis pikave të të dhënave, duke gjetur kufirin e vendimit që ndan më mirë klasat e ndryshme në grupin e të dhënave. Algoritmi SVM vizaton ose linja ose hiperplane që ndajnë pikat, respektivisht për hapësira 2-dimensionale dhe hapësira 3D. SVM përpiqet të gjejë vijën/hiperplanin që ndan më mirë klasat duke u përpjekur të maksimizojë diferencën, ose distancën ndërmjet vijës/hiperplanit deri në pikat më të afërta. Modelet SVM mund të përdoren gjithashtu në grupe të dhënash që nuk janë të ndashme në mënyrë lineare duke përdorur "mashtrimin e kernelit" për të identifikuar kufijtë e vendimeve jolineare.

Regresioni logjistik

Regresioni logjistik është një algoritëm që përdor një funksion logit (log-odds) për të përcaktuar probabilitetin që një hyrje të jetë në një nga dy gjendjet. Një funksion sigmoid përdoret për të "shtrënguar" probabilitetin drejt 0 ose 1, e vërtetë ose e gabuar. Probabilitetet më të mëdha se 0.50 supozohen të jenë klasa 1, ndërsa probabilitetet 0.49 ose më të ulëta supozohen të jenë 0. Për këtë arsye, regresioni logjistik zakonisht përdoret në problemet e klasifikimit binar. Megjithatë, regresioni logjistik mund të zbatohet për problemet me shumë klasa duke përdorur një qasje një kundër të gjithëve, duke krijuar një model klasifikimi binar për secilën klasë dhe duke përcaktuar probabilitetin që një shembull të jetë një klasë synuese ose një klasë tjetër në grupin e të dhënave.

Pema e Vendimit

A pema e vendimit modeli funksionon duke ndarë një grup të dhënash në pjesë gjithnjë e më të vogla, dhe pasi nëngrupet nuk mund të ndahen më, rezultati është një pemë me nyje dhe gjethe. Nyjet në një pemë vendimi janë vendi ku vendimet për pikat e të dhënave merren duke përdorur kritere të ndryshme filtrimi. Gjethet në një pemë vendimi janë pikat e të dhënave që janë klasifikuar. Algoritmet e pemës së vendimit mund të trajtojnë të dhëna numerike dhe kategorike, dhe ndarjet në pemë bazohen në variabla / veçori specifike.

Pyjet e rastësishme

A model pylli i rastësishëm është në thelb vetëm një koleksion i pemëve të vendimit ku parashikimet e pemëve individuale vlerësohen për të arritur në një vendim përfundimtar. Algoritmi i rastësishëm i pyjeve zgjedh vëzhgimet dhe veçoritë në mënyrë të rastësishme, duke ndërtuar pemët individuale bazuar në këto përzgjedhje.

Ky artikull udhëzues do të eksplorojë se si të krijoni një Box Plot në Matplotlib. Grafikët e kutive përdoren për të vizualizuar statistikat përmbledhëse të një grupi të dhënash, duke shfaqur atributet e shpërndarjes si diapazoni dhe shpërndarja e të dhënave.

Temat e ngjashme:modele diskriminuese modele gjeneruese

E rradhes

Çfarë është rritja e gradientit?

Mos e humbas

Farë është siguria në internet?

Daniel Nelson

Bloger dhe programues me specialitete në Mësim Machine Mësim i thellë temave. Daniel shpreson të ndihmojë të tjerët të përdorin fuqinë e AI për të mirën sociale.