tynkä Mitä on koneoppiminen? - Unite.AI
Liity verkostomme!

AI 101

Mikä on koneoppiminen?

mm
Päivitetty on

Koneoppiminen on yksi nopeimmin kasvavista teknologia-aloista, mutta huolimatta siitä, kuinka usein sanoja "koneoppiminen" heittelevät ympäriinsä, voi olla vaikea ymmärtää, mitä koneoppiminen tarkalleen on.

Koneen oppiminen ei viittaa vain yhteen asiaan, se on kattotermi, jota voidaan soveltaa moniin erilaisiin käsitteisiin ja tekniikoihin. Koneoppimisen ymmärtäminen tarkoittaa erilaisten mallianalyysimuotojen, muuttujien ja algoritmien tuntemista. Tarkastellaan tarkasti koneoppimista ymmärtääksemme paremmin, mitä se sisältää.

Mitä on koneoppiminen?

Vaikka termiä koneoppiminen voidaan soveltaa moniin eri asioihin, termi viittaa yleisesti ottaen siihen, että tietokone voi suorittaa tehtäviä ilman, että se saa nimenomaisia ​​rivikohtaisia ​​ohjeita tehdä niin. Koneoppimisen asiantuntijan ei tarvitse kirjoittaa kaikkia tarvittavia vaiheita ongelman ratkaisemiseksi, koska tietokone pystyy "oppimaan" analysoimalla datan sisältämiä malleja ja yleistämällä nämä mallit uuteen dataan.

Koneoppimisjärjestelmissä on kolme perusosaa:

  • Tulot
  • Algoritmit
  • Lähdöt

Syötteet ovat tietoja, jotka syötetään koneoppimisjärjestelmään, ja syöttödata voidaan jakaa tarroihin ja ominaisuuksiin. Ominaisuudet ovat relevantteja muuttujia, muuttujia, joita analysoidaan kuvioiden oppimiseksi ja johtopäätösten tekemiseksi. Samaan aikaan tunnisteet ovat luokkia/kuvauksia, jotka on annettu datan yksittäisille esiintymille.

Ominaisuuksia ja tunnisteita voidaan käyttää kahdessa erityyppisessä koneoppimisongelmassa: ohjatussa oppimisessa ja ohjaamattomassa oppimisessa.

Ohjaamaton vs. ohjattu oppiminen

In valvottu oppiminen, syöttötietoihin liittyy perustotuus. Valvotuilla oppimisongelmilla on oikeat lähtöarvot osana aineistoa, joten odotetut luokat tiedetään etukäteen. Näin datatieteilijä voi tarkistaa algoritmin suorituskyvyn testaamalla dataa testiaineistolla ja katsomalla, kuinka suuri prosenttiosuus kohteista on luokiteltu oikein.

Verrattuna, ohjaamaton oppiminen ongelmiin ei ole liitetty pohjatotuustarroja. Koneoppimisalgoritmin, joka on koulutettu suorittamaan valvomattomia oppimistehtäviä, on pystyttävä päättelemään datan olennaiset mallit itselleen.

Valvottuja oppimisalgoritmeja käytetään tyypillisesti luokitteluongelmiin, joissa on suuri tietojoukko täynnä esiintymiä, jotka on lajiteltava johonkin useista eri luokista. Toinen ohjatun oppimisen tyyppi on regressiotehtävä, jossa algoritmin antama arvo on luonteeltaan jatkuvaa kategorisen sijaan.

Samaan aikaan valvomattomia oppimisalgoritmeja käytetään tehtäviin, kuten tiheyden arviointiin, klusterointiin ja esitysoppimiseen. Nämä kolme tehtävää tarvitsevat koneoppimismallin päätelläkseen tietojen rakenteen, mallille ei ole annettu ennalta määritettyjä luokkia.

Katsotaanpa lyhyesti joitain yleisimmistä algoritmeista, joita käytetään sekä ohjaamattomassa että ohjatussa oppimisessa.

Ohjatun oppimisen tyypit

Yleisiä valvottuja oppimisalgoritmeja ovat:

  • Naiivi Bayes
  • Tuki vektorikoneille
  • Logistinen regressio
  • Satunnaiset metsät
  • Keinotekoiset hermoverkot

Tuki vektorikoneille ovat algoritmeja, jotka jakavat tietojoukon eri luokkiin. Datapisteet ryhmitellään klustereihin piirtämällä viivoja, jotka erottavat luokat toisistaan. Viivan toiselta puolelta löytyvät pisteet kuuluvat yhteen luokkaan, kun taas viivan toisella puolella olevat pisteet ovat eri luokkaa. Support Vector Machines pyrkii maksimoimaan viivan ja viivan kummallakin puolella olevien pisteiden välisen etäisyyden, ja mitä suurempi etäisyys on, sitä varmempi luokitin on, että piste kuuluu yhteen luokkaan eikä toiseen luokkaan.

Logistinen regressio on algoritmi, jota käytetään binääriluokittelutehtävissä, kun datapisteet on luokiteltava kuuluvaksi johonkin kahdesta luokasta. Logistinen regressio toimii merkitsemällä datapisteen joko 1 tai 0. Jos datapisteen havaittu arvo on 0.49 tai pienempi, se luokitellaan arvoksi 0, kun taas jos se on 0.5 tai suurempi, se luokitellaan 1:ksi.

Päätöspuun algoritmit toimivat jakamalla tietojoukot pienempiin ja pienempiin fragmentteihin. Tarkat kriteerit tietojen jakamiseen ovat koneoppimisinsinöörin päätettävissä, mutta tavoitteena on lopulta jakaa tiedot yksittäisiin tietopisteisiin, jotka sitten luokitellaan avaimella.

Random Forest -algoritmi koostuu pohjimmiltaan useista yksittäisistä päätöspuun luokittelijoista, jotka on yhdistetty tehokkaammaksi luokittelijaksi.

- Naiivi Bayes -luokitin laskee todennäköisyyden, että tietty datapiste on tapahtunut aiemman tapahtuman todennäköisyyden perusteella. Se perustuu Bayesin lauseeseen ja sijoittaa datapisteet luokkiin niiden lasketun todennäköisyyden perusteella. Toteutettaessa Naive Bayes -luokittajaa oletetaan, että kaikilla ennustajilla on sama vaikutus luokan lopputulokseen.

An Keinotekoinen hermoverkko, tai monikerroksinen perceptron, ovat koneoppimisalgoritmeja, jotka ovat saaneet vaikutteita ihmisaivojen rakenteesta ja toiminnasta. Keinotekoiset hermoverkot ovat saaneet nimensä siitä, että ne koostuvat monista toisiinsa linkitetyistä solmuista/neuroneista. Jokainen neuroni käsittelee dataa matemaattisella funktiolla. Keinotekoisissa hermoverkoissa on syöttökerroksia, piilokerroksia ja lähtökerroksia.

Neuraaliverkon piilotettu kerros on paikka, jossa data todella tulkitaan ja analysoidaan kuvioiden varalta. Toisin sanoen siellä algoritmi oppii. Enemmän neuroneja yhdistettynä muodostaa monimutkaisempia verkkoja, jotka kykenevät oppimaan monimutkaisempia malleja.

Ohjaamattoman oppimisen tyypit

Valvomattomia oppimisalgoritmeja ovat:

  • K tarkoittaa ryhmittelyä
  • Autokooderit
  • Pääkomponenttianalyysi

K tarkoittaa ryhmittelyä on valvomaton luokitustekniikka, ja se toimii jakamalla datapisteet klusteriin tai ryhmiin niiden ominaisuuksien perusteella. K-means-klusterointi analysoi datapisteistä löydetyt piirteet ja erottaa niistä kuvioita, jotka tekevät tietystä luokkaklusterista löydetyistä datapisteistä samankaltaisempia toistensa kanssa kuin ne ovat muita datapisteitä sisältävien klustereiden kanssa. Tämä saavutetaan sijoittamalla klusterin mahdolliset keskukset tai sentroidit tietojen kaavioon ja osoittamalla sentroidin sijainti uudelleen, kunnes löydetään sijainti, joka minimoi sentroidin ja sen keskipisteen luokkaan kuuluvien pisteiden välisen etäisyyden. Tutkija voi määrittää halutun määrän klustereita.

Pääkomponenttianalyysi on tekniikka, joka vähentää suuren määrän ominaisuuksia/muuttujia pienemmäksi ominaisuustilaksi/vähemmän ominaisuuksia. Tietopisteiden "pääkomponentit" valitaan säilytettäväksi, kun taas muut ominaisuudet puristetaan pienempään esitykseen. Alkuperäisten datajuomien välinen suhde säilyy, mutta koska datapisteiden monimutkaisuus on yksinkertaisempi, data on helpompi kvantifioida ja kuvata.

Autokooderit ovat hermoverkkojen versioita, joita voidaan soveltaa ohjaamattomiin oppimistehtäviin. Autoenkooderit pystyvät ottamaan leimaamatonta, vapaamuotoista dataa ja muuttamaan ne dataksi, jota hermoverkko pystyy käyttämään, luoden periaatteessa omia merkittyjä harjoitustietoja. Autoenkooderin tavoitteena on muuntaa syötetiedot ja rakentaa se uudelleen mahdollisimman tarkasti, joten verkon kannustimena on määrittää, mitkä ominaisuudet ovat tärkeimmät ja purkaa ne.

Bloggaaja ja ohjelmoija erikoisaloilla Koneen oppiminen ja Deep Learning aiheita. Daniel toivoo voivansa auttaa muita käyttämään tekoälyn voimaa yhteiskunnalliseen hyvään.