stubbur Hvað er djúpt nám? (2024) - Unite.AI
Tengja við okkur

AI 101

Hvað er djúpt nám?

mm
Uppfært on

Djúpnám er eitt áhrifamesta og ört vaxandi svið gervigreindar. Hins vegar getur verið erfitt að fá innsæi skilning á djúpu námi vegna þess að hugtakið djúpnám nær yfir margs konar mismunandi reiknirit og tækni. Djúpnám er líka undirgrein vélanáms almennt, svo það er mikilvægt að skilja hvað vélanám er til að skilja djúpt nám.

Hvað er vélinám?

Djúpt nám er framlenging á sumum hugtökum sem eru upprunnin í vélanámi, svo af þeirri ástæðu skulum við gefa okkur eina mínútu til að útskýra hvað vélanám er.

Einfaldlega sagt, vélanám er aðferð til að gera tölvum kleift að framkvæma ákveðin verkefni án þess að kóða sérstaklega allar línur af reikniritunum sem notaðar eru til að framkvæma þessi verkefni. Það eru til mörg mismunandi reiknirit fyrir vélanám, en eitt algengasta reikniritið er a fjöllaga skynjari. Fjöllaga skynjari er einnig nefnt tauganet og það samanstendur af röð hnúta/tauga sem tengjast saman. Það eru þrjú mismunandi lög í fjöllaga skynjara: inntakslagið, falið lagið og úttakslagið.

Inntakslagið tekur gögnin inn á netið, þar sem hnúðunum í miðju/fala lagi er stjórnað af þeim. Hnútarnir í falda laginu eru stærðfræðilegar aðgerðir sem geta meðhöndlað gögnin sem koma frá inntakslaginu og dregið út viðeigandi mynstur úr inntaksgögnunum. Þetta er hvernig tauganetið „lærir“. Taugakerfi draga nafn sitt af því að þau eru innblásin af uppbyggingu og starfsemi mannsheilans.

Tengingar milli hnúta í netinu hafa gildi sem kallast vægi. Þessi gildi eru í meginatriðum forsendur um hvernig gögnin í einu lagi tengjast gögnunum í næsta lagi. Þegar netið þjálfar eru lóðin aðlöguð og markmiðið er að þyngd/forsendur um gögnin muni að lokum renna saman að gildum sem sýna nákvæmlega mikilvæg mynstur í gögnunum.

Virkjunaraðgerðir eru til staðar í hnútum netsins og þessar virkjunaraðgerðir umbreyta gögnunum á ólínulegan hátt, sem gerir netinu kleift að læra flóknar framsetningar gagna. Virkjunaraðgerðir margfalda inntaksgildin með þyngdargildunum og bæta við hlutdrægni.

Hvað er djúpt nám?

Djúpnám er hugtakið sem gefið er yfir vélanámsarkitektúr sem sameinar marga fjöllaga skynjara saman, þannig að það er ekki bara eitt falið lag heldur mörg falin lög. Því „dýpra“ sem djúpt tauganetið er, því flóknari mynstur getur netið lært.

Djúplagsnetin sem samanstanda af taugafrumum eru stundum nefnd fulltengd net eða fulltengd lög, sem vísar til þess að tiltekin taugafruma heldur tengingu við allar taugafrumurnar í kringum hana. Fulltengd netkerfi er hægt að sameina við aðrar vélanámsaðgerðir til að búa til mismunandi djúpnámsarkitektúr.

Mismunandi gerðir af djúpnámi

Það eru margs konar djúpnámsarkitektúrar sem vísindamenn og verkfræðingar nota og hver hinna mismunandi arkitektúr hefur sitt sérsvið.

Sameiningar taugakerfi

Convolutional tauganet, eða CNN, eru taugakerfisarkitektúrinn sem almennt er notaður við að búa til tölvusjónkerfi. Uppbygging sveiflukenndra tauganeta gerir þeim kleift að túlka myndgögn, umbreyta þeim í tölur sem fulltengt net getur túlkað. CNN hefur fjóra meginþætti:

  • Sveiflulög
  • Undirsýnataka/samþjöppun laga
  • Virkjunaraðgerðir
  • Fulltengd lög

Snúningslögin eru það sem tekur myndirnar sem inntak inn á netið, greina myndirnar og fá gildi punktanna. Undirsýni eða samsöfnun er þar sem myndgildum er breytt/minnkað til að einfalda framsetningu myndanna og draga úr næmni myndsíanna fyrir hávaða. Virkjunaraðgerðirnar stjórna því hvernig gögnin flæða frá einu lagi til næsta lags og fulltengdu lögin eru það sem greina gildin sem tákna myndina og læra mynstrin sem eru í þeim gildum.

RNN/LSTM

Endurtekin taugakerfi, eða RNN, eru vinsælar fyrir verkefni þar sem röð gagnanna skiptir máli, þar sem netið verður að læra um röð gagna. RNN er almennt beitt við vandamál eins og náttúrulega málvinnslu, þar sem röð orða skiptir máli þegar merking setningar er afkóðun. Hinn „endurtekna“ hluti hugtaksins Endurtekið tauganet kemur frá þeirri staðreynd að framleiðsla fyrir tiltekið frumefni í röð er háð fyrri útreikningi sem og núverandi útreikningi. Ólíkt öðrum gerðum djúpra tauganeta hafa RNN „minningar“ og upplýsingarnar sem reiknaðar eru út á mismunandi tímaþrepum í röðinni eru notaðar til að reikna út lokagildin.

Það eru margar gerðir af RNN, þar á meðal tvíátta RNN, sem taka framtíðaratriði í röðinni með í reikninginn, auk fyrri atriða, við útreikning á virði hlutar. Önnur tegund af RNN er a Langtímaminni, eða LSTM, net. LSTM eru tegundir RNN sem geta séð um langar keðjur af gögnum. Venjuleg RNN geta orðið fórnarlamb eitthvað sem kallast „sprengihalli vandamál“. Þetta vandamál kemur upp þegar keðja inntaksgagna verður mjög löng, en LSTM hafa tækni til að berjast gegn þessu vandamáli.

Sjálfkóðunartæki

Flestir djúpnámsarkitektúra sem nefndir eru hingað til eru notaðir á námsvandamál undir eftirliti, frekar en námsverkefnum sem ekki eru undir eftirliti. Sjálfkóðarar geta umbreytt gögnum án eftirlits í snið undir eftirliti, sem gerir kleift að nota taugakerfi við vandamálið.

Sjálfkóðunartæki eru oft notuð til að greina frávik í gagnasöfnum, dæmi um nám án eftirlits þar sem eðli fráviksins er ekki þekkt. Slík dæmi um uppgötvun frávika eru svikauppgötvun fyrir fjármálastofnanir. Í þessu samhengi er tilgangur sjálfkóðara að ákvarða grunnlínu reglulegra mynsturs í gögnunum og bera kennsl á frávik eða frávik.

Uppbygging sjálfkóðara er oft samhverf, með földum lögum raðað þannig að úttak netsins líkist inntakinu. Fjórar gerðir sjálfkóðara sem sjá tíð notkun eru:

  • Venjulegur/venjulegur sjálfkóðari
  • Fjöllaga kóðarar
  • Convolutional encoders
  • Reglulegir kóðarar

Venjulegir/látlausir sjálfkóðarar eru bara tauganet með einu falnu lagi á meðan fjöllaga sjálfkóðarar eru djúp net með fleiri en einu falnu lagi. Sveipnaðir sjálfkóðarar nota sveiflulög í stað, eða til viðbótar við, fulltengd lög. Reglubundnir sjálfkóðarar nota ákveðna tegund tapaðgerða sem gerir tauganetinu kleift að framkvæma flóknari aðgerðir, aðrar aðgerðir en að afrita inntak í úttak.

Generative andstæðingur net

Generative Adversarial Networks (GAN) eru í raun mörg djúp tauganet í stað aðeins eitt net. Tvö djúpnámslíkön eru þjálfuð á sama tíma og afrakstur þeirra er færður í hitt netið. Netin eru í samkeppni sín á milli og þar sem þau fá aðgang að úttaksgögnum hvers annars læra þau bæði af þessum gögnum og bæta sig. Netkerfin tvö eru í rauninni að leika leik um fölsun og uppgötvun, þar sem kynslóða líkanið reynir að búa til ný tilvik sem munu blekkja spæjara líkanið / mismununarmanninn. GAN hafa orðið vinsæl á sviði tölvusjónar.

Samantekt um djúpt nám

Djúpt nám útvíkkar meginreglur tauganeta til að búa til háþróuð líkön sem geta lært flókin mynstur og alhæft þessi mynstur yfir í framtíðargagnasöfn. Sveipnuð tauganet eru notuð til að túlka myndir, en RNN/LSTM eru notuð til að túlka raðgögn. Sjálfkóðarar geta umbreytt námsverkefnum sem eru ekki undir eftirliti í námsverkefni sem eru undir eftirliti. Að lokum eru GAN-net mörg net sem eru sett á móti hvort öðru sem eru sérstaklega gagnleg fyrir tölvusjónverkefni.

Bloggari og forritari með sérsvið í vél Learning og Deep Learning efni. Daniel vonast til að hjálpa öðrum að nota kraft gervigreindar í félagslegum tilgangi.