AI 101
Ăvervakad vs oövervakad inlĂ€rning

Inom maskinlärning kan de flesta uppgifter enkelt kategoriseras i en av två olika klasser: övervakade inlärningsproblem eller oövervakade inlärningsproblem. Vid övervakad inlärning har data etiketter eller klasser tillagda, medan datan vid oövervakad inlärning är oetiketterad. Låt oss ta en närmare titt på varför denna distinktion är viktig och titta på några av de algoritmer som är associerade med varje typ av inlärning.
Övervakad vs oövervakad inlärning
De flesta maskinlärningsuppgifter ligger inom området övervakad inlärning. Vid övervakade inlärningsalgoritmer har de enskilda instanserna/datapunkterna i datamängden en klass eller etikett tillagd. Detta innebär att maskinlärningsmodellen kan lära sig att skilja vilka funktioner som korrelerar med en given klass och att maskinläringsingenjören kan kontrollera modellens prestanda genom att se hur många instanser som klassificerades korrekt. Klassificeringsalgoritmer kan användas för att urskilja många komplexa mönster, så länge datan är etiketterad med rätt klasser. Till exempel kan en maskinlärningsalgoritm lära sig att skilja olika djur från varandra baserat på egenskaper som “vibriss”, “svans”, “klor” etc.
Till skillnad från övervakad inlärning innebär oövervakad inlärning att skapa en modell som kan extrahera mönster från oetiketterad data. Med andra ord analyserar datorn ingångsfunktionerna och bestämmer själv vilka de viktigaste funktionerna och mönstren är. Oövervakad inlärning försöker hitta de inbyggda likheterna mellan olika instanser. Om en övervakad inlärningsalgoritm syftar till att placera datapunkter i kända klasser, kommer oövervakade inlärningsalgoritmer att undersöka funktionerna som är gemensamma för objektsinstanserna och placera dem i grupper baserat på dessa funktioner, i princip skapa sina egna klasser.
Exempel på övervakade inlärningsalgoritmer är Linjär Regression, Logistisk Regression, K-närmaste grannar, BeslutsTräd och StödvektorMaskiner.
Samtidigt är några exempel på oövervakade inlärningsalgoritmer Principal Component Analysis och K-MedelClustering.
Övervakad inlärningsalgoritm
Linjär Regression är en algoritm som tar två funktioner och plotar ut relationen mellan dem. Linjär Regression används för att förutsäga numeriska värden i relation till andra numeriska variabler. Linjär Regression har ekvationen Y = a + bX, där b är linjens lutning och a är där y skär x-axeln.
Logistisk Regression är en binär klassificeringsalgoritm. Algoritmen undersöker relationen mellan numeriska funktioner och hittar sannolikheten att instansen kan klassificeras i en av två olika klasser. Sannolikheterna “kläms” mot antingen 0 eller 1. Med andra ord kommer starka sannolikhet att närma sig 0,99 medan svaga sannolikhet kommer att närma sig 0.
K-närmaste grannar tilldelar en klass till nya datapunkter baserat på de tilldelade klasserna för några valda grannar i träningsmängden. Antalet grannar som övervägs av algoritmen är viktigt, och för få eller för många grannar kan missklassificera punkter.
BeslutsTräd är en typ av klassificerings- och regressionsalgoritm. Ett beslutsTräd fungerar genom att dela upp en datamängd i mindre och mindre delar tills undermängderna inte kan delas längre och vad som resulterar är ett träd med noder och blad. Noderna är där beslut om datapunkter fattas med hjälp av olika filterkriterier, medan bladen är de instanser som har tilldelats någon etikett (en datapunkt som har klassificerats). BeslutsTräd-algoritmer kan hantera både numeriska och kategoriska data. Delningar görs i trädet på specifika variabler/funktioner.
StödvektorMaskiner är en klassificeringsalgoritm som fungerar genom att rita hyperplan, eller skiljelinjer, mellan datapunkter. Datapunkter delas in i klasser baserat på vilken sida av hyperplanet de är på. Flera hyperplan kan ritas över en plan, som delar en datamängd i flera klasser. Klassificeringen kommer att försöka maximera avståndet mellan den skiljande hyperplanet och punkterna på båda sidor om planet, och ju större avståndet mellan linjen och punkterna, desto mer säker är klassificeringen.
Oövervakad inlärningsalgoritm
Principal Component Analysis är en teknik som används för dimensionella reduktion, vilket innebär att dimensionella eller komplexiteten hos datan representeras på ett enklare sätt. Principal Component Analysis-algoritmen hittar nya dimensioner för datan som är ortogonala. Medan dimensionella datan reduceras, bör variansen mellan datan bevaras så mycket som möjligt. Vad detta innebär i praktiska termer är att det tar funktionerna i datamängden och destillerar dem ner till färre funktioner som representerar mestadels datan.
K-MedelClustering är en algoritm som automatiskt grupperar datapunkter i kluster baserat på liknande funktioner. Mönstren i datamängden analyseras och datapunkterna delas in i grupper baserat på dessa mönster. I princip skapar K-medel sina egna klasser utifrån oetiketterad data. K-Medel-algoritmen fungerar genom att tilldela centra till klustren, eller centroider, och flytta centroiderna tills den optimala positionen för centroiderna hittas. Den optimala positionen kommer att vara en där avståndet mellan centroiderna och de omgivande datapunkterna inom klassen är minimerad. “K” i K-medelClustering hänvisar till hur många centroider som har valts.
Sammanfattning
Till sist, låt oss gå igenom de viktigaste skillnaderna mellan övervakad och oövervakad inlärning.
Som vi tidigare diskuterade, i övervakade inlärningsuppgifter är indata etiketterad och antalet klasser är kända. Medan indata är oetiketterad och antalet klasser inte är kända i oövervakade inlärningsfall. Oövervakad inlärning tenderar att vara mindre beräkningsmässigt komplex, medan övervakad inlärning tenderar att vara mer beräkningsmässigt komplex. Medan övervakad inlärning tenderar att ge hög noggrannhet, tenderar oövervakad inlärning att ge mindre noggrannhet/måttlig noggrannhet.












