стуб Шта је дубоко учење? (2024) - Уните.АИ
Повежите се са нама
АИ Мастерцласс:

АИ 101

Шта је дубоко учење?

mm
Ажурирано on

Дубоко учење је једно од најутицајнијих и најбрже растућих области у вештачкој интелигенцији. Међутим, добијање интуитивног разумевања дубоког учења може бити тешко јер термин дубоко учење покрива низ различитих алгоритама и техника. Дубоко учење је такође поддисциплина машинског учења уопште, тако да је важно разумети шта је машинско учење да бисте разумели дубоко учење.

Шта је машинско учење?

Дееп леарнинг је проширење неких концепата који потичу из машинског учења, па из тог разлога, хајде да одвојимо минут да објаснимо шта је машинско учење.

Једноставно речено, машинско учење је метод који омогућава рачунарима да извршавају одређене задатке без експлицитног кодирања сваке линије алгоритама који се користе за постизање тих задатака. Постоји много различитих алгоритама машинског учења, али један од најчешће коришћених алгоритама је а вишеслојни перцептрон. Вишеслојни перцептрон се такође назива неуронском мрежом и састоји се од низа чворова/неурона повезаних заједно. Постоје три различита слоја у вишеслојном перцептрону: улазни слој, скривени слој и излазни слој.

Улазни слој преноси податке у мрежу, где њима манипулишу чворови у средњем/скривеном слоју. Чворови у скривеном слоју су математичке функције које могу да манипулишу подацима који долазе из улазног слоја, издвајајући релевантне обрасце из улазних података. Овако неуронска мрежа „учи“. Неуронске мреже су добиле име по томе што су инспирисане структуром и функцијом људског мозга.

Везе између чворова у мрежи имају вредности које се називају тежине. Ове вредности су у суштини претпоставке о томе како су подаци у једном слоју повезани са подацима у следећем слоју. Како се мрежа тренира, тежине се прилагођавају, а циљ је да се тежине/претпоставке о подацима на крају конвергирају на вредностима које тачно представљају смислене обрасце унутар података.

Функције активације су присутне у чворовима мреже, а ове функције активације трансформишу податке на нелинеаран начин, омогућавајући мрежи да научи сложене репрезентације података. Функције за активирање множе улазне вредности са вредностима тежине и додају термин за пристрасност.

Шта је дубоко учење?

Дубоко учење је термин који се даје архитектурама машинског учења које спајају многе вишеслојне перцептроне заједно, тако да не постоји само један скривени слој већ много скривених слојева. Што је дубока неуронска мрежа „дубља“, то мрежа може научити софистицираније обрасце.

Мреже дубоког слоја које се састоје од неурона понекад се називају потпуно повезаним мрежама или потпуно повезаним слојевима, позивајући се на чињеницу да дати неурон одржава везу са свим неуронима који га окружују. Потпуно повезане мреже могу се комбиновати са другим функцијама машинског учења како би се створиле различите архитектуре дубоког учења.

Различите врсте дубоког учења

Постоје различите архитектуре дубоког учења које користе истраживачи и инжењери, а свака од различитих архитектура има свој посебан случај употребе.

Конволуционарне неуронске мреже

Конволуционе неуронске мреже, или ЦНН, су архитектура неуронске мреже која се обично користи у креирању система компјутерског вида. Структура конволуционих неуронских мрежа им омогућава да интерпретирају податке слике, претварајући их у бројеве које потпуно повезана мрежа може да интерпретира. ЦНН има четири главне компоненте:

  • Конволуцијски слојеви
  • Подузорковање/обједињавање слојева
  • Функције за активирање
  • Потпуно повезани слојеви

Конволуцијски слојеви су оно што узима слике као улазе у мрежу, анализирајући слике и добијајући вредности пиксела. Подузорковање или обједињавање је место где се вредности слике конвертују/смањују да би се поједноставила репрезентација слика и смањила осетљивост филтера слике на шум. Функције за активацију контролишу како подаци теку од једног слоја до следећег, а потпуно повезани слојеви су они који анализирају вредности које представљају слику и уче обрасце који се држе у тим вредностима.

РНН/ЛСТМ

Понављајуће неуронске мреже, или РНН, популарни су за задатке где је редослед података битан, где мрежа мора да научи о низу података. РНН-ови се обично примењују на проблеме као што је обрада природног језика, пошто је редослед речи битан када се декодира значење реченице. „Рекурентни“ део термина Рекурентна неуронска мрежа потиче од чињенице да излаз за дати елемент у низу зависи од претходног израчунавања као и од тренутног израчунавања. За разлику од других облика дубоких неуронских мрежа, РНН имају „сећања“, а информације израчунате у различитим временским корацима у низу се користе за израчунавање коначних вредности.

Постоји више типова РНН-ова, укључујући двосмерне РНН-ове, који узимају у обзир будуће ставке у низу, поред претходних ставки, приликом израчунавања вредности ставке. Друга врста РНН-а је а Дуготрајна краткорочна меморија или ЛСТМ, мрежа. ЛСТМ су типови РНН-а који могу да рукују дугим ланцима података. Редовни РНН-ови могу постати жртва нечега што се зове „проблем експлодирајућег градијента“. Овај проблем се јавља када ланац улазних података постане изузетно дуг, али ЛСТМ-ови имају технике за борбу против овог проблема.

Аутоенцодерс

Већина до сада поменутих архитектура дубоког учења примењује се на проблеме учења под надзором, а не на задатке учења без надзора. Аутоматски кодери су у стању да трансформишу ненадзиране податке у надгледани формат, омогућавајући да се неуронске мреже користе за решавање проблема.

Аутоенцодерс се често користе за откривање аномалија у скуповима података, што је пример ненадгледаног учења јер природа аномалије није позната. Такви примери откривања аномалија укључују откривање превара за финансијске институције. У овом контексту, сврха аутоенкодера је да одреди основну линију регуларних образаца у подацима и идентификује аномалије или одступања.

Структура аутоенкодера је често симетрична, са скривеним слојевима распоређеним тако да излаз мреже подсећа на улаз. Четири типа аутоматских кодера који се често користе су:

  • Обични/обични аутоенкодери
  • Вишеслојни кодери
  • Конволуцијски енкодери
  • Регулисани енкодери

Обични/обични аутоенкодери су само неуронске мреже са једним скривеним слојем, док су вишеслојни аутоенкодери дубоке мреже са више од једног скривеног слоја. Конволуцијски аутоенкодери користе конволуционе слојеве уместо, или као додатак, потпуно повезаних слојева. Регулисани аутоенкодери користе специфичну врсту функције губитка која омогућава неуронској мрежи да обавља сложеније функције, функције које нису само копирање улаза у излазе.

Генеративне Адверсариал Нетворкс

Генеративне адверсаријске мреже (ГАН) су заправо више дубоких неуронских мрежа уместо само једне мреже. Два модела дубоког учења се обучавају у исто време, а њихови резултати се шаљу у другу мрежу. Мреже се међусобно такмиче, а пошто добијају приступ излазним подацима једне друге, обе уче из ових података и побољшавају се. Две мреже у суштини играју игру фалсификата и откривања, где генеративни модел покушава да створи нове инстанце које ће преварити детективски модел/дискриминатора. ГАН-ови су постали популарни у области компјутерског вида.

Резиме дубоког учења

Дубоко учење проширује принципе неуронских мрежа за креирање софистицираних модела који могу научити сложене обрасце и генерализовати те обрасце на будуће скупове података. Конволуционе неуронске мреже се користе за тумачење слика, док се РНН/ЛСТМ користе за тумачење секвенцијалних података. Аутоматски кодери могу да трансформишу задатке учења без надзора у задатке учења под надзором. Коначно, ГАН-ови су вишеструке мреже супротстављене једна другој које су посебно корисне за задатке компјутерског вида.

Блогер и програмер са специјалностима у Машинско учење Дееп Леарнинг теме. Данијел се нада да ће помоћи другима да искористе моћ вештачке интелигенције за друштвено добро.