stubbur Hvað er vélanám? - Unite.AI
Tengja við okkur

AI 101

Hvað er vélinám?

mm
Uppfært on

Vélanám er eitt af þeim tæknisviðum sem vaxa hraðast, en þrátt fyrir hversu oft orðunum „vélanám“ er kastað í kringum sig getur verið erfitt að skilja hvað vélanám er nákvæmlega.

vél nám vísar ekki aðeins til eins, það er regnhlífarhugtak sem hægt er að nota yfir mörg mismunandi hugtök og tækni. Að skilja vélanám þýðir að vera kunnugur mismunandi gerðum líkanagreiningar, breytum og reikniritum. Við skulum skoða vélrænt nám til að skilja betur hvað það felur í sér.

Hvað er vélanám?

Þó að hægt sé að nota hugtakið vélanám um marga mismunandi hluti, vísar hugtakið almennt til þess að gera tölvu kleift að framkvæma verkefni án þess að fá skýrar línu fyrir línu leiðbeiningar um það. Sérfræðingur í vélanámi þarf ekki að skrifa út öll skrefin sem nauðsynleg eru til að leysa vandamálið vegna þess að tölvan er fær um að „læra“ með því að greina mynstur í gögnunum og alhæfa þessi mynstur yfir í ný gögn.

Vélanámskerfi hafa þrjá grunnhluta:

  • Inntak
  • Reiknirit
  • Framleiðsla

Inntakin eru gögnin sem eru færð inn í vélanámskerfið og hægt er að skipta inntaksgögnunum í merki og eiginleika. Eiginleikar eru viðeigandi breytur, breyturnar sem verða greindar til að læra mynstur og draga ályktanir. Á sama tíma eru merkimiðarnir flokkar/lýsingar sem gefnar eru fyrir einstök tilvik gagna.

Hægt er að nota eiginleika og merki í tvenns konar vélrænni vandamálum: nám undir eftirliti og nám án eftirlits.

Nám án eftirlits vs

In eftirlit með námi, inntaksgögnunum fylgja jarðsannleikur. Námsvandamál undir eftirliti hafa rétt úttaksgildi sem hluti af gagnasafninu, þannig að væntanlegir flokkar eru þekktir fyrirfram. Þetta gerir gagnafræðingnum kleift að athuga frammistöðu reikniritsins með því að prófa gögnin á prófunargagnagrunni og sjá hversu hátt hlutfall hlutanna var rétt flokkað.

Aftur á móti, eftirlit án náms vandamál eru ekki með grunnsannleiksmerki á sér. Vélnámsreiknirit sem er þjálfað til að framkvæma námsverkefni án eftirlits verður að geta ályktað um viðeigandi mynstur í gögnunum fyrir sjálfan sig.

Stýrt nám reiknirit eru venjulega notuð fyrir flokkunarvandamál, þar sem maður er með stórt gagnasafn fyllt með tilvikum sem verður að flokka í einn af mörgum mismunandi flokkum. Önnur tegund eftirlitsnáms er aðhvarfsverkefni, þar sem gildisframleiðsla reikniritsins er samfelld í eðli sínu í stað þess að vera flokkuð.

Á sama tíma eru reiknirit fyrir nám án eftirlits notuð fyrir verkefni eins og þéttleikamat, klasagerð og framsetningarnám. Þessi þrjú verkefni þurfa vélnámslíkanið til að álykta um uppbyggingu gagnanna, það eru engir fyrirfram skilgreindir flokkar gefnir fyrir líkanið.

Við skulum líta stuttlega á nokkur algengustu reiknirit sem notuð eru bæði í námi án eftirlits og eftirliti.

Tegundir eftirlitsnáms

Algengar reiknirit fyrir nám undir eftirliti eru:

  • Barnlaus Bayes
  • Stuðningur Vigur véla
  • Logistic afturför
  • Random Forests
  • Gervi tauganet

Stuðningur Vigur véla eru reiknirit sem skipta upp gagnasafni í mismunandi flokka. Gagnapunktar eru flokkaðir í klasa með því að teikna línur sem skilja flokkana frá hver öðrum. Punktar sem finnast á annarri hlið línunnar munu tilheyra einum flokki, en punktarnir hinum megin við línuna eru annar flokkur. Stuðningsvektorvélar miða að því að hámarka fjarlægðina milli línunnar og punktanna sem finnast hvoru megin við línuna, og því meiri fjarlægð sem er því öruggari er flokkarinn um að punkturinn tilheyri einum flokki en ekki öðrum flokki.

Logistic afturför er reiknirit sem notað er í tvíundarflokkunarverkefnum þegar flokka þarf gagnapunkta sem tilheyra einum af tveimur flokkum. Logistic Regression virkar með því að merkja gagnapunktinn annað hvort 1 eða 0. Ef skynjað gildi gagnapunktsins er 0.49 eða lægra er það flokkað sem 0, en ef það er 0.5 eða hærra flokkast það sem 1.

Decision Tree reiknirit starfa með því að skipta gagnasöfnum upp í smærri og smærri búta. Nákvæm viðmið sem notuð eru til að skipta gögnunum er undir vélanámsverkfræðingnum komið, en markmiðið er að skipta gögnunum að lokum upp í staka gagnapunkta, sem síðan verða flokkaðir með lykli.

Random Forest reiknirit er í rauninni margir stakir Decision Tree flokkarar sem eru tengdir saman í öflugri flokkara.

The Barnlaus Bayes flokkari reiknar út líkurnar á að tiltekinn gagnapunktur hafi átt sér stað byggt á líkunum á að fyrri atburður eigi sér stað. Það er byggt á Bayes setningu og það setur gagnapunktana í flokka út frá reiknuðum líkum þeirra. Þegar barnalegur Bayes flokkari er útfærður er gert ráð fyrir að allir spáþættirnir hafi sömu áhrif á útkomu bekkjarins.

An Gervi taugakerfi, eða fjöllaga skynjari, eru vélrænni reiknirit sem eru innblásin af uppbyggingu og starfsemi mannsheilans. Gervi tauganet fá nafn sitt af því að þau eru gerð úr mörgum hnútum/taugafrumum sem tengjast saman. Sérhver taugafruma vinnur með gögnin með stærðfræðilegri virkni. Í gervi tauganetum eru inntakslög, falin lög og úttakslög.

Falið lag tauganetsins er þar sem gögnin eru í raun túlkuð og greind með tilliti til mynsturs. Með öðrum orðum, það er þar sem reikniritið lærir. Fleiri taugafrumur sem sameinast gera flóknari netkerfi sem geta lært flóknari mynstur.

Tegundir náms án eftirlits

Reiknirit fyrir nám án eftirlits innihalda:

  • K-þýðir þyrping
  • Sjálfkóðunartæki
  • Aðalgreining á aðalhlutum

K-þýðir þyrping er flokkunartækni án eftirlits og virkar með því að aðgreina gagnapunkta í klasa eða hópa út frá eiginleikum þeirra. K-means þyrping greinir eiginleikana sem finnast í gagnapunktunum og greinir mynstur í þeim sem gera gagnapunkta sem finnast í tilteknum klasaklasa líkari hver öðrum en þeir eru klösum sem innihalda hina gagnapunktana. Þetta er gert með því að setja mögulegar miðstöðvar fyrir þyrpinguna, eða miðpunkta, í línurit yfir gögnin og endurúthluta stöðu miðpunktsins þar til staðsetning finnst sem lágmarkar fjarlægðina milli miðpunktsins og punktanna sem tilheyra flokki miðpunktsins. Rannsakandi getur tilgreint þann fjölda klasa sem óskað er eftir.

Aðalgreining á aðalhlutum er tækni sem dregur úr fjölda eiginleika/breyta niður í minna eiginleikarými/færri eiginleika. „Aðalþættir“ gagnapunktanna eru valdir til varðveislu en hinir eiginleikarnir eru kreistir niður í minni framsetningu. Sambandið milli upprunalegu gagnadrykkjanna er varðveitt, en þar sem flókið gagnapunkta er einfaldara er auðveldara að mæla og lýsa gögnunum.

Sjálfkóðunartæki eru útgáfur af tauganetum sem hægt er að beita við eftirlitslaus námsverkefni. Sjálfkóðarar eru færir um að taka ómerkt gögn í frjálsu formi og umbreyta þeim í gögn sem taugakerfi getur notað, í grundvallaratriðum búið til sín eigin merktu þjálfunargögn. Markmið sjálfvirkra kóðara er að umbreyta inntaksgögnunum og endurbyggja þau eins nákvæmlega og mögulegt er, svo það er hvatning netsins til að ákvarða hvaða eiginleikar eru mikilvægastir og draga þá út.

Bloggari og forritari með sérsvið í vél Learning og Deep Learning efni. Daniel vonast til að hjálpa öðrum að nota kraft gervigreindar í félagslegum tilgangi.