cung Mësimi i Mbikëqyrur kundër Mësimit të Pambikëqyrur - Unite.AI
Lidhu me ne
Masterclass i AI:

UA 101

Mësimi i mbikëqyrur kundrejt të mësuarit të pambikëqyrur

mm
Përditësuar on

Në mësimin e makinerive, shumica e detyrave mund të kategorizohen lehtësisht në një nga dy klasat e ndryshme: problemet e të mësuarit të mbikëqyrura ose problemet e të mësuarit të pambikëqyrura. Në mësimin e mbikëqyrur, të dhënat kanë etiketa ose klasa të bashkangjitura, ndërsa në rastin e mësimit të pambikëqyrur të dhënat janë të paetiketuara. Le të hedhim një vështrim nga afër se pse ky dallim është i rëndësishëm dhe të shohim disa nga algoritmet që lidhen me secilin lloj mësimi.

Mësimi i mbikëqyrur kundrejt të mësuarit të pambikëqyrur

Shumica e detyrave të mësimit të makinerive janë në domenin e mësimi i mbikëqyrur. Në algoritmet e të mësuarit të mbikëqyrur, instancat/pikat individuale të të dhënave në grupin e të dhënave kanë një klasë ose etiketë të caktuar për to. Kjo do të thotë që modeli i mësimit të makinerive mund të mësojë të dallojë cilat veçori lidhen me një klasë të caktuar dhe se inxhinieri i mësimit të makinës mund të kontrollojë performancën e modelit duke parë se sa shembuj janë klasifikuar siç duhet. Algoritmet e klasifikimit mund të përdoren për të dalluar shumë modele komplekse, për sa kohë që të dhënat janë etiketuar me klasat e duhura. Për shembull, një algoritëm i mësimit të makinës mund të mësojë të dallojë kafshë të ndryshme nga njëra-tjetra bazuar në karakteristikat si "mustaqet", "bishti", "kthetra", etj.

Në ndryshim nga mësimi i mbikëqyrur, mësimi i pambikëqyrur përfshin krijimin e një modeli që është në gjendje të nxjerrë modele nga të dhënat e paetiketuara. Me fjalë të tjera, kompjuteri analizon tiparet hyrëse dhe përcakton vetë se cilat janë tiparet dhe modelet më të rëndësishme. Të mësuarit e pambikëqyrur përpiqet të gjejë ngjashmëritë e qenësishme midis rasteve të ndryshme. Nëse një algoritëm i të mësuarit i mbikëqyrur synon të vendosë pika të dhënash në klasa të njohura, algoritmet e të mësuarit të pambikëqyrur do të shqyrtojnë tiparet e përbashkëta për instancat e objektit dhe do t'i vendosin ato në grupe bazuar në këto veçori, duke krijuar në thelb klasat e veta.

Shembuj të algoritmeve të të mësuarit të mbikëqyrur janë Regresioni Linear, Regresioni Logjistik, Fqinjët më të afërt K, Pemët e Vendimit dhe Makinat Vektoriale Mbështetëse.

Ndërkohë, disa shembuj të algoritmeve të mësimit të pambikëqyrur janë Analiza e Komponentit Kryesor dhe K-Means Clustering.

Algoritmi i të mësuarit të mbikëqyrur

Linear regresionit është një algoritëm që merr dy veçori dhe përshkruan marrëdhënien ndërmjet tyre. Regresioni linear përdoret për të parashikuar vlerat numerike në lidhje me variablat e tjerë numerikë. Regresioni linear ka ekuacionin e Y = a +bX, ku b është pjerrësia e vijës dhe a është vendi ku y kalon boshtin X.

Regresioni logjistik është një algoritëm binar klasifikimi. Algoritmi ekzaminon lidhjen midis veçorive numerike dhe gjen probabilitetin që shembulli të mund të klasifikohet në një nga dy klasat e ndryshme. Vlerat e probabilitetit janë "shtrydhur" drejt 0 ose 1. Me fjalë të tjera, probabilitetet e forta do t'i afrohen 0.99 ndërsa probabilitetet e dobëta do t'i afrohen 0.

K-Fqinjët më të afërt cakton një klasë në pikat e reja të të dhënave bazuar në klasat e caktuara të një numri të zgjedhur fqinjësh në grupin e trajnimit. Numri i fqinjëve të konsideruar nga algoritmi është i rëndësishëm dhe shumë pak ose shumë fqinjë mund të keqklasifikojnë pikat.

Pemët e Vendimit janë një lloj algoritmi klasifikimi dhe regresioni. Një pemë vendimi funksionon duke ndarë një grup të dhënash në pjesë gjithnjë e më të vogla derisa nëngrupet nuk mund të ndahen më dhe ajo që rezulton është një pemë me nyje dhe gjethe. Nyjet janë vendi ku vendimet për pikat e të dhënave merren duke përdorur kritere të ndryshme filtrimi, ndërsa gjethet janë rastet që u është caktuar një etiketë (një pikë e të dhënave që është klasifikuar). Algoritmet e pemës së vendimit janë të afta të trajtojnë të dhëna numerike dhe kategorike. Ndarjet bëhen në pemë në variabla/veçori specifike.

Mbështetni makineritë vektoriale janë një algoritëm klasifikimi që funksionon duke vizatuar hiperplane, ose vija të ndarjes, ndërmjet pikave të të dhënave. Pikat e të dhënave ndahen në klasa bazuar në cilën anë të hiperplanit ndodhen. Hiperplane të shumta mund të vizatohen nëpër një plan, duke zhytur një grup të dhënash në klasa të shumta. Klasifikuesi do të përpiqet të maksimizojë distancën midis hiperplanit të zhytjes dhe pikave në të dyja anët e avionit, dhe sa më e madhe të jetë distanca midis vijës dhe pikave, aq më i sigurt është klasifikuesi.

Algoritme mësimore të pambikëqyrura

Analiza e Komponentit Kryesor është një teknikë e përdorur për reduktimin e dimensionalitetit, që do të thotë se dimensionaliteti ose kompleksiteti i të dhënave paraqitet në një mënyrë më të thjeshtë. Algoritmi i analizës së komponentit kryesor gjen dimensione të reja për të dhënat që janë ortogonale. Ndërsa dimensionaliteti i të dhënave është zvogëluar, varianca midis të dhënave duhet të ruhet sa më shumë që të jetë e mundur. Çfarë do të thotë kjo në terma praktikë është se ai merr veçoritë në grupin e të dhënave dhe i distilon ato në më pak karakteristika që përfaqësojnë shumicën e të dhënave.

K-Means Clustering është një algoritëm që grupon automatikisht pikat e të dhënave në grupe bazuar në karakteristika të ngjashme. Modelet brenda grupit të të dhënave analizohen dhe pikat e të dhënave ndahen në grupe bazuar në këto modele. Në thelb, K-means krijon klasat e veta nga të dhënat e paetiketuara. Algoritmi K-Means funksionon duke caktuar qendra grupeve, ose centroideve, dhe duke lëvizur centroidet derisa të gjendet pozicioni optimal për centroidet. Pozicioni optimal do të jetë ai ku distanca midis centroideve në pikat e të dhënave përreth brenda klasës është minimizuar. "K" në grupimin e mjeteve K i referohet numrit të qendrave të zgjedhura.

përmbledhje

Për ta mbyllur, le të kalojmë shpejt mbi ndryshimet kryesore midis tyre mësimi i mbikëqyrur dhe i pambikëqyrur.

Siç kemi diskutuar më parë, në detyrat mësimore të mbikëqyrura, të dhënat hyrëse janë etiketuar dhe numri i klasave është i njohur. Ndërkohë, të dhënat hyrëse janë të paetiketuara dhe numri i klasave nuk dihet në rastet e mësimit të pambikëqyrur. Mësimi i pambikëqyrur priret të jetë më pak i ndërlikuar nga ana llogaritëse, ndërsa mësimi i mbikëqyrur priret të jetë më i ndërlikuar nga ana llogaritëse. Ndërsa rezultatet e të nxënit të mbikëqyrur priren të jenë shumë të sakta, rezultatet e mësimit të pambikëqyrur priren të jenë më pak të sakta/mesatarisht të sakta.