AI 101
Valvottu vs Valvomaton Oppiminen

Koneoppimisessa useimmat tehtävät voidaan helposti luokitella jompaan kumpaan kahdesta eri luokasta: valvottuihin oppimistehtäviin tai valvomattomiin oppimistehtäviin. Valvotussa oppimisessa dataan on liitetty merkinnät tai luokat, kun taas valvomattomassa oppimisessa data on merkintämätöntä. Tarkastellaan tarkemmin, miksi tämä ero on tärkeä ja katsotaan joitakin algoritmeja, jotka liittyvät kumpaankin oppimistyyppiin.
Valvottu vs Valvomaton Oppiminen
Useimmat koneoppimistehtävät kuuluvat valvotun oppimisen alueeseen. Valvotussa oppimisessa algoritmit ovat sellaisia, että yksittäiset instanssit/tietopisteet aineistossa on varustettu luokalla tai merkinnällä. Tämä tarkoittaa, että koneoppimismalli voi oppia erottamaan, mitkä ominaisuudet ovat yhteydessä tiettyyn luokkaan, ja koneoppimisen insinööri voi tarkistaa mallin suorituskyvyn näkemällä, kuinka monta instanssia luokiteltiin oikein. Luokittelualgoritmeja voidaan käyttää monien monimutkaisten mallien havaitsemiseen, kunhan data on merkitty oikeilla luokilla. Esimerkiksi koneoppimisalgoritmi voi oppia erottamaan eri eläimiä toisistaan ominaisuuksien perusteella kuten “vihu”, “häntä”, “kynnet” jne.
Toisin kuin valvottu oppiminen, valvomaton oppiminen liittyy mallin luomiseen, joka pystyy erottamaan malleja merkinnättömästä datasta. Toisin sanoen tietokone analysoi syöteominaisuudet ja määrittää itse, mitkä ovat tärkeimmät ominaisuudet ja malleja. Valvomaton oppiminen pyrkii löytämään luonnolliset yhtäläisyydet eri instanssien välillä. Jos valvottu oppimisalgoritmi pyrkii sijoittamaan data-pisteet tunnettuun luokkaan, valvomaton oppimisalgoritmi tarkastelee ominaisuuksia, jotka ovat yhteisiä objektien instanssien kesken, ja sijoittaa ne ryhmiin näiden ominaisuuksien perusteella, luoden käytännössä omat luokkansa.
Esimerkkejä valvotusta oppimisalgoritmeista ovat Lineaari Regressio, Logistinen Regressio, K-lähin Naapuri, Päätöspuut ja Tukivektorikoneet.
Vastaavasti joitakin esimerkkejä valvomattomista oppimisalgoritmeista ovat Pääkomponenttianalyysi ja K-Means -klusterointi.
Valvottu Oppimisalgoritmi
Lineaari Regressio on algoritmi, joka ottaa kaksi ominaisuutta ja piirtää niiden välisen suhteen. Lineaari Regressio käytetään numeeristen arvojen ennustamiseen muiden numeeristen muuttujien suhteen. Lineaari Regressiolla on yhtälö Y = a + bX, jossa b on linjan kulmakerroin ja a on kohta, jossa y leikkaa X-akselin.
Logistinen Regressio on binääri luokittelualgoritmi. Algoritmi tarkastelee suhdetta numeeristen ominaisuuksien ja löytää todennäköisyyden, että instanssi voidaan luokitella yhteen kahdesta eri luokasta. Todennäköisyysarvot “painesivat” kohti 0 tai 1. Toisin sanoen vahvat todennäköisyydet lähestyvät 0,99, kun taas heikot todennäköisyydet lähestyvät 0.
K-lähin Naapuri sijoittaa uudet data-pisteet luokkiin perustuen valittujen naapureiden luokkiin koulutusjoukossa. Naapureiden määrä, jota algoritmi ottaa huomioon, on tärkeä, ja liian vähän tai liian monta naapuria voi johtaa luokituksen virheisiin.
Päätöspuut ovat luokittelun ja regressioalgoritmi. Päätöspuu toimii jakamalla aineisto pienempiin ja pienempiin osiin, kunnes alijoukot eivät voi enää jakautua, ja lopputuloksena on puu, jossa on solmuja ja lehtiä. Solmut ovat kohdat, joissa tehdään päätöksiä tietopisteistä eri suodatuskriteerien perusteella, kun taas lehdet ovat instansseja, joille on annettu jokin merkintä (tietopiste, joka on luokiteltu). Päätöspuualgoritmit pystyvät käsittelemään sekä numeerista että kategorista dataa. Jakoa tehdään puussa tiettyjen muuttujien/ominaisuuksien perusteella.
Tukivektorikoneet ovat luokittelualgoritmi, joka toimii piirtämällä hyper tasot, eli erottelulinjoja, data-pisteiden välille. Data-pisteet jaetaan luokkiin sen perusteella, minkä puolen hyper tasoa ne ovat. Useita hyper tasoa voidaan piirtää tasoon, jakaten aineiston useisiin luokkiin. Luokittelija yrittää maksimoida etäisyyden erottavan hyper tason ja pisteiden välillä, ja mitä suurempi etäisyys linjan ja pisteiden välillä on, sitä varmempi luokittelija on.
Valvomaton Oppimisalgoritmi
Pääkomponenttianalyysi on tekniikka, jota käytetään ulottuvuuden vähentämiseen, mikä tarkoittaa, että aineiston ulottuvuus tai monimutkaisuus esitetään yksinkertaisemmassa muodossa. Pääkomponenttianalyysialgoritmi löytää uudet ulottuvuudet aineistolle, jotka ovat toisiinsa nähden ortogonaalisia. Vaikka aineiston ulottuvuus vähenee, aineiston välinen varianssi tulisi säilyttää mahdollisimman hyvin. Tämä tarkoittaa käytännössä, että se ottaa aineiston ominaisuudet ja tiivistää ne vähemmän ominaisuuksiin, jotka edustavat suurimman osan datasta.
K-Means -klusterointi on algoritmi, joka ryhmittelee data-pisteet automaattisesti klustereihin samankaltaisten ominaisuuksien perusteella. Aineiston sisäiset malleja analyysoidaan ja data-pisteet jaetaan ryhmiin näiden mallien perusteella. K-Means luo käytännössä omat luokkansa merkinnättömästä datasta. K-Means -algoritmi toimii sijoittamalla keskipisteet klustereihin eli sentroideja ja siirtämällä sentroideja, kunnes sentroideille löydetään optimaalinen sijainti. Optimaalinen sijainti on sellainen, jossa etäisyys sentroideista ympäröivien data-pisteiden kesken on minimisoitu. K-Means -klusteroinnissa “K” viittaa siihen, kuinka monta sentroiota on valittu.
Yhteenveto
Lopuksi katsotaan nopeasti valvotun ja valvomattoman oppimisen väliset keskeiset erot.
Kuten aiemmin käytiin läpi, valvotussa oppimisessa syöte-data on merkitty ja luokkien määrä on tiedossa. Vastaavasti valvomattomassa oppimisessa syöte-data on merkintämätöntä ja luokkien määrä ei ole tiedossa. Valvomaton oppiminen on yleensä vähemmän laskennallisen monimutkainen, kun taas valvottu oppiminen on yleensä enemmän laskennallisen monimutkainen. Vaikka valvotun oppimisen tulokset ovat yleensä erittäin tarkat, valvomattoman oppimisen tulokset ovat yleensä vähemmän tarkat / kohtalaisen tarkat.












