Stumm Iwwerwaacht vs net iwwerwaacht Léieren - Unite.AI
Connect mat eis

AI 101

Iwwerwaacht vs net iwwerwaacht Léieren

mm
aktualiséiert on

Am Maschinnléiere kënnen déi meescht Aufgaben einfach an eng vun zwou verschiddene Klassen kategoriséiert ginn: iwwerwaachte Léierprobleemer oder net iwwerwaachte Léierproblemer. Beim iwwerwaacht Léieren hunn d'Donnéeën Etiketten oder Klassen derbäi bäigefüügt, wärend am Fall vun oniwwerwaachter Léieren d'Donnéeën net markéiert sinn. Loosst eis genau kucken firwat dësen Ënnerscheed wichteg ass a kucken e puer vun den Algorithmen, déi mat all Typ vu Léieren verbonne sinn.

Iwwerwaacht vs net iwwerwaacht Léieren

Déi meescht Maschinn Léieren Aufgaben sinn am Beräich vun iwwerwaacht Léieren. An iwwerwaachte Léieralgorithmen hunn déi eenzel Instanzen / Datepunkten an der Dataset eng Klass oder Label hinnen zougewisen. Dëst bedeit datt de Maschinnléieremodell léiere kann z'ënnerscheeden wéi eng Features mat enger bestëmmter Klass korreléiert sinn an datt de Maschinnléieringenieur d'Leeschtung vum Modell iwwerpréift andeems Dir kuckt wéivill Instanzen richteg klasséiert goufen. Klassifikatioun Algorithmen kënne benotzt ginn fir vill komplex Mustere z'ënnerscheeden, soulaang d'Donnéeën mat de richtege Klassen markéiert sinn. Zum Beispill kann e Maschinnléieralgorithmus léieren verschidden Déieren vuneneen ze ënnerscheeden op Basis vu Charakteristiken wéi "Whiskers", "Schwänz", "Klauen", asw.

Am Géigesaz zum iwwerwaachte Léieren, oniwwerwaacht Léieren involvéiert e Modell ze kreéieren deen fäeg ass Musteren aus net-labeléierten Donnéeën ze extrahieren. An anere Wierder, de Computer analyséiert d'Input Features a bestëmmt fir sech selwer wat déi wichtegst Features a Mustere sinn. Oniwwerwaacht Léieren probéiert déi inherent Ähnlechkeeten tëscht verschiddenen Instanzen ze fannen. Wann e iwwerwaachte Léieralgorithmus zielt fir Datepunkte a bekannte Klassen ze placéieren, wäerten oniwwerwaachte Léieralgorithmen d'Features ënnersichen, déi allgemeng fir den Objektinstanzen sinn a se a Gruppen placéieren op Basis vun dëse Funktiounen, am Wesentlechen seng eege Klassen erstellen.

Beispiller vu iwwerwaachte Léieralgorithmen sinn Linear Regressioun, Logistesch Regressioun, K-nächst Noperen, Entscheedungsbeem, an Ënnerstëtzungsvektormaschinnen.

Mëttlerweil sinn e puer Beispiller vun net iwwerwaachte Léieralgorithmen Principal Component Analysis a K-Means Clustering.

Iwwerwaacht Léieren Algorithmus

Linear Regressioun ass en Algorithmus deen zwou Features hëlt an d'Relatioun tëscht hinnen aussetzt. Linear Regressioun gëtt benotzt fir numeresch Wäerter a Relatioun mat aneren numeresche Variabelen virauszesoen. Linear Regressioun huet d'Equatioun vun Y = a +bX, wou b den Hang vun der Linn ass an a wou y d'X-Achs kräizt.

Logistesch Regressioun ass e binäre Klassifikatioun Algorithmus. Den Algorithmus iwwerpréift d'Relatioun tëscht numeresche Funktiounen a fënnt d'Wahrscheinlechkeet datt d'Instanz an eng vun zwou verschiddene Klassen klasséiert ka ginn. D'Wahrscheinlechkeet Wäerter sinn "gequetscht" op entweder 0 oder 1. An anere Wierder, staark Wahrscheinlechkeeten wäert Approche 0.99 iwwerdeems schwaach Wahrscheinlechkeeten wäert Approche 0.

K-Noosten Noperen gëtt eng Klass op nei Daten Punkten baséiert op der zougewisen Klassen vun e puer gewielt Betrag vun Noperen am Training Formatioun. D'Zuel vun den Noperen, déi vum Algorithmus berücksichtegt sinn, ass wichteg, an ze wéineg oder ze vill Nopere kënne Punkte falsch klassifizéieren.

Entscheedung Beem sinn eng Zort Klassifikatioun a Regressioun Algorithmus. En Entscheedungsbam funktionnéiert andeems en Dataset a méi kleng a méi kleng Portiounen opgedeelt gëtt, bis d'Subsets net méi kënnen opgedeelt ginn a wat Resultater ass e Bam mat Wirbelen a Blieder. D'Node sinn wou Entscheedungen iwwer Datepunkte gemaach gi mat verschiddene Filterkriterien, während d'Blieder d'Instanzen sinn, déi e Label zougewisen hunn (en Datepunkt dee klasséiert gouf). Entscheedungsbaum Algorithmen si fäeg souwuel numeresch wéi och kategoresch Daten ze handhaben. Splits ginn am Bam op spezifesch Variablen / Features gemaach.

Ënnerstëtzung Vecteure Maschinnen sinn e Klassifizéierungsalgorithmus dee funktionnéiert andeems Hyperplanen oder Trennungslinnen tëscht Datenpunkten zeechnen. Datepunkte ginn a Klassen getrennt baséiert op wéi enger Säit vum Hyperplane se sinn. Multiple Hyperplane kënnen iwwer e Fliger gezeechent ginn, en Dataset a verschidde Klassen tauchen. De Klassifizéierer wäert probéieren d'Distanz tëscht dem Tauchhyperplan an de Punkten op béide Säiten vum Fliger ze maximéieren, a wat méi grouss d'Distanz tëscht der Linn an de Punkten ass, wat méi zouversiichtlech ass de Klassifizéierer.

Net iwwerwaacht Léieralgorithmen

Haaptkomponent Analyse ass eng Technik fir Dimensiounsreduktioun benotzt, dat heescht datt d'Dimensioun oder Komplexitéit vun den Donnéeën op eng méi einfach Manéier duergestallt gëtt. De Principal Component Analysis Algorithmus fënnt nei Dimensiounen fir d'Donnéeën déi orthogonal sinn. Wärend d'Dimensioun vun den Donnéeën reduzéiert gëtt, sollt d'Varianz tëscht den Donnéeën esou vill wéi méiglech erhale bleiwen. Wat dëst praktesch bedeit ass datt et d'Features am Dataset hëlt an se a manner Features distilléiert déi déi meescht vun den Daten representéieren.

K-Mëtt Clustering ass en Algorithmus deen automatesch Datenpunkte a Cluster gruppéiert baséiert op ähnlechen Features. D'Muster am Dataset ginn analyséiert an d'Datepunkte ginn a Gruppen opgedeelt op Basis vun dëse Mustere. Wesentlech erstellt K-means seng eege Klassen aus net-labeléierten Donnéeën. De K-Means Algorithmus funktionnéiert andeems d'Zentren un d'Cluster oder Zentroiden zougewisen ginn an d'Zentroiden beweegen bis déi optimal Positioun fir d'Zentroiden fonnt gëtt. Déi optimal Positioun wäert eng sinn, wou d'Distanz tëscht den Zentroiden zu den Ëmgéigend Datepunkte bannent der Klass miniméiert ass. De "K" am K-bedeit Clustering bezitt sech op wéivill Zentroiden gewielt goufen.

Resumé

Fir zouzemaachen, loosst eis séier iwwer d'Schlëssel Differenzen tëscht goen iwwerwaacht an net iwwerwaacht Léieren.

Wéi mir virdru diskutéiert hunn, an iwwerwaachte Léieraufgaben sinn d'Inputdaten markéiert an d'Zuel vun de Klassen ass bekannt. Mëttlerweil sinn d'Inputdaten net markéiert an d'Zuel vun de Klassen net bekannt an onkontrolléierte Léierfäll. Net iwwerwaacht Léieren tendéiert manner computationally komplex ze sinn, wärend iwwerwaacht Léieren éischter méi computationally komplex ass. Wärend iwwerwaachte Léierresultater éischter héich präzis sinn, tendéieren net iwwerwaachte Léierresultater manner korrekt / mëttelméisseg korrekt.