škrbina Kaj je strojno učenje? - Združi se.AI
Povežite se z nami

AI 101

Kaj je strojno učenje?

mm
Posodobljeno on

Strojno učenje je eno najhitreje rastočih tehnoloških področij, a kljub temu, kako pogosto se beseda »strojno učenje« premetava, je lahko težko razumeti, kaj točno je strojno učenje.

Strojno učenje se ne nanaša samo na eno stvar, je krovni izraz, ki ga je mogoče uporabiti za veliko različnih konceptov in tehnik. Razumevanje strojnega učenja pomeni poznavanje različnih oblik analize modelov, spremenljivk in algoritmov. Oglejmo si podrobneje strojno učenje, da bomo bolje razumeli, kaj zajema.

Kaj je strojno učenje?

Medtem ko se izraz strojno učenje lahko uporablja za veliko različnih stvari, se na splošno izraz nanaša na omogočanje računalniku, da izvaja naloge, ne da bi za to prejel izrecna navodila vrstica za vrstico. Strokovnjaku za strojno učenje ni treba napisati vseh korakov, ki so potrebni za rešitev problema, saj se je računalnik sposoben »učiti« z analiziranjem vzorcev v podatkih in posploševanjem teh vzorcev na nove podatke.

Sistemi strojnega učenja imajo tri osnovne dele:

  • Vhodi
  • Algoritmi
  • Izhodi

Vhodi so podatki, ki se vnesejo v sistem strojnega učenja, vhodne podatke pa lahko razdelimo na oznake in funkcije. Značilnosti so ustrezne spremenljivke, spremenljivke, ki bodo analizirane, da se naučimo vzorcev in pripravimo sklepe. Medtem so oznake razredi/opisi, podani posameznim primerkom podatkov.

Funkcije in oznake je mogoče uporabiti pri dveh različnih vrstah težav s strojnim učenjem: nadzorovano učenje in nenadzorovano učenje.

Nenadzorovano proti nadzorovanemu učenju

In nadzorovano učenje, vhodne podatke spremlja osnovna resnica. Težave z nadzorovanim učenjem imajo pravilne izhodne vrednosti kot del nabora podatkov, tako da so pričakovani razredi znani vnaprej. To podatkovnemu znanstveniku omogoča, da preveri delovanje algoritma tako, da testira podatke na testnem naboru podatkov in vidi, kolikšen odstotek postavk je bil pravilno razvrščen.

V nasprotju, nenadzorovano učenje problemi nimajo pritrjenih oznak resnice. Algoritem strojnega učenja, usposobljen za izvajanje nenadzorovanih učnih nalog, mora biti sposoben sam sklepati o ustreznih vzorcih v podatkih.

Algoritmi nadzorovanega učenja se običajno uporabljajo za težave s klasifikacijo, kjer imamo velik nabor podatkov, napolnjen s primerki, ki jih je treba razvrstiti v enega od številnih različnih razredov. Druga vrsta nadzorovanega učenja je regresijska naloga, kjer je izhodna vrednost algoritma po naravi neprekinjena in ne kategorična.

Medtem se algoritmi za nenadzorovano učenje uporabljajo za naloge, kot so ocena gostote, združevanje v gruče in učenje predstavitve. Te tri naloge potrebujejo model strojnega učenja za sklepanje strukture podatkov, modelu ni vnaprej določenih razredov.

Oglejmo si na kratko nekaj najpogostejših algoritmov, ki se uporabljajo pri nenadzorovanem in nadzorovanem učenju.

Vrste nadzorovanega učenja

Pogosti algoritmi za nadzorovano učenje vključujejo:

  • Naiven Bayes
  • Podporni vektorski stroji
  • Logistična regresija
  • Naključni gozdovi
  • Umetna nevronska omrežja

Podporni vektorski stroji so algoritmi, ki razdelijo nabor podatkov v različne razrede. Podatkovne točke so združene v skupine z risanjem črt, ki ločujejo razrede drug od drugega. Točke na eni strani črte bodo pripadale enemu razredu, medtem ko so točke na drugi strani črte drugemu razredu. Podporni vektorski stroji si prizadevajo povečati razdaljo med črto in točkami na obeh straneh črte, in večja kot je razdalja, bolj je klasifikator prepričan, da točka pripada enemu razredu in ne drugemu.

Logistična regresija je algoritem, ki se uporablja pri nalogah binarne klasifikacije, ko je treba podatkovne točke razvrstiti v enega od dveh razredov. Logistična regresija deluje tako, da podatkovno točko označi z 1 ali 0. Če je zaznana vrednost podatkovne točke 0.49 ali manj, je razvrščena kot 0, če pa je 0.5 ali več, je razvrščena kot 1.

Algoritmi odločitvenega drevesa delujejo tako, da nabore podatkov delijo na vedno manjše fragmente. Natančna merila, uporabljena za razdelitev podatkov, so odvisna od inženirja strojnega učenja, vendar je cilj končno razdeliti podatke v posamezne podatkovne točke, ki bodo nato razvrščene s pomočjo ključa.

Algoritem Random Forest je v bistvu veliko posameznih klasifikatorjev drevesa odločanja, povezanih v zmogljivejši klasifikator.

O Naivni Bayesov klasifikator izračuna verjetnost, da se je dana podatkovna točka zgodila na podlagi verjetnosti, da se je zgodil prejšnji dogodek. Temelji na Bayesovem izreku in razvršča podatkovne točke v razrede glede na njihovo izračunano verjetnost. Pri izvajanju naivnega Bayesovega klasifikatorja se predpostavlja, da imajo vsi napovedovalci enak vpliv na rezultat razreda.

An Umetna nevronska mrežaali večplastni perceptron so algoritmi strojnega učenja, ki jih navdihuje struktura in delovanje človeških možganov. Umetne nevronske mreže so dobile ime po dejstvu, da so sestavljene iz številnih vozlišč/nevronov, povezanih med seboj. Vsak nevron manipulira s podatki z matematično funkcijo. V umetnih nevronskih mrežah obstajajo vhodne plasti, skrite plasti in izhodne plasti.

Skrita plast nevronske mreže je tam, kjer se podatki dejansko interpretirajo in analizirajo za vzorce. Z drugimi besedami, tam se algoritem uči. Več združenih nevronov tvori bolj zapletena omrežja, ki se lahko naučijo bolj zapletenih vzorcev.

Vrste nenadzorovanega učenja

Algoritmi nenadzorovanega učenja vključujejo:

  • K-pomeni združevanje
  • Samodejni kodirniki
  • Analiza glavnih komponent

K-pomeni združevanje je nenadzorovana tehnika razvrščanja in deluje tako, da točke podatkov ločuje v grozde ali skupine glede na njihove značilnosti. Gručenje K-means analizira značilnosti, ki jih najdemo v podatkovnih točkah, in razlikuje vzorce v njih, zaradi katerih so podatkovne točke, najdene v dani gruči razreda, bolj podobne druga drugi, kot so gručam, ki vsebujejo druge podatkovne točke. To dosežemo tako, da postavimo možna središča za gručo ali centroide v graf podatkov in ponovno dodelimo položaj centroida, dokler ne najdemo položaja, ki zmanjša razdaljo med centroidom in točkami, ki pripadajo razredu tega centroida. Raziskovalec lahko določi želeno število grozdov.

Analiza glavnih komponent je tehnika, ki zmanjša veliko število funkcij/spremenljivk v manjši prostor funkcij/manj funkcij. »Glavne komponente« podatkovnih točk so izbrane za ohranitev, medtem ko so druge značilnosti stisnjene v manjšo predstavitev. Razmerje med izvirnimi podatkovnimi napitki je ohranjeno, a ker je kompleksnost podatkovnih točk enostavnejša, je podatke lažje kvantificirati in opisati.

Samodejni kodirniki so različice nevronskih mrež, ki jih je mogoče uporabiti pri nenadzorovanih učnih nalogah. Avtokodirniki lahko sprejmejo neoznačene podatke v prosti obliki in jih pretvorijo v podatke, ki jih lahko uporabi nevronska mreža, v bistvu ustvarijo lastne označene podatke o usposabljanju. Cilj samodejnega kodirnika je pretvorba vhodnih podatkov in njihova čim natančnejša ponovna izdelava, zato je spodbuda omrežja, da ugotovi, katere lastnosti so najpomembnejše, in jih izlušči.

Bloger in programer s posebnostmi v strojno učenje in Globoko učenje teme. Daniel upa, da bo drugim pomagal uporabiti moč umetne inteligence za družbeno dobro.