Вође мисли

Како можемо да користимо дубоко учење са малим подацима? – Вође мисли

Ажурирано on Новембар 16, 2019

Када је у питању праћење нових трендова у сајбер безбедности, процес праћења било каквих недавних дешавања може бити прилично досадан јер постоји много вести које треба пратити. Ових дана, међутим, ситуација се драматично променила, пошто се чини да се области сајбер безбедности врте око две речи – дубоко учење.

Иако смо у почетку били затечени масовним извјештавањем о дубоком учењу, брзо је постало очигледно да је зујање које је изазвало дубоко учење добро заслужено. На начин сличан људском мозгу, дубоко учење омогућава АИ моделу да постигне веома прецизне резултате, извршавањем задатака директно из текста, слика и аудио сигнала.

До ове тачке, било је широко распрострањено веровање да се дубоко учење ослања на огроман скуп података, прилично сличан величини података које чувају гиганти из Силицијумске долине Гугл и Фејсбук да би испунили циљ решавања најкомпликованијих проблема унутар организације. Међутим, супротно популарном веровању, предузећа могу да искористе моћ дубоког учења, чак и са приступом ограниченом скупу података.

У покушају да помогнемо нашим читаоцима да стекну неопходно знање како би своју организацију опремили дубоким учењем, саставили смо чланак који дубоко (без игре речи) урања у неке од начина на које предузећа могу да искористе предности дубоког учења упркос томе да имају приступ ограниченим или 'малим' подацима.

Али пре него што уђемо у суштину чланка, желели бисмо да дамо мали, али веома важан предлог – почните једноставно. Међутим, пре него што почнете да формулишете неуронске мреже довољно сложене да се приказују у научно-фантастичном филму, почните са експериментисањем са неколико једноставних и конвенционалних модела, (нпр. случајна шума) да бисте се упознали са софтвером.

Склонивши то с пута, хајде да пређемо директно на неке од начина на које предузећа могу да споје технологију дубоког учења док имају приступ ограниченим подацима.

#1- Фино обликовање основног модела:

Као што смо већ поменули горе, први корак који предузећа треба да предузму након што су формулисали једноставан основни модел дубоког учења је да их фино подесе за одређени проблем.

Међутим, фино подешавање основног модела звучи много тешко на папиру, онда заправо јесте. Основна идеја која стоји иза финог подешавања великог скупа података како би се задовољиле специфичне потребе предузећа је једноставна – узимате велике податке, који имају неку сличност са доменом у којем функционишете, а затим фино подешавате детаље оригинала скуп података, са вашим ограниченим подацима.

Што се тиче добијања великог скупа података, власници предузећа могу се ослонити на ИмагеНет, који такође омогућава лако решавање било каквих проблема са класификацијом слика. Скуп података који хостује ИмагеНет омогућава организацијама приступ милионима слика, које су подељене на више класа слика, које могу бити корисне предузећима која потичу из широког спектра домена, укључујући, али свакако не ограничавајући се на слике животиња, итд.

Ако вам процес финог подешавања унапред обученог модела да одговара специфичним потребама ваше организације и даље изгледа као превише посла за вас, препоручујемо вам да добијете помоћ са интернета, пошто ће вам једноставна Гоогле претрага пружити стотине упутства о томе како фино подесити скуп података.

#2- Прикупите више података:

Иако би неким од наших циничнијих читалаца друга тачка на нашој листи могла изгледати сувишна, остаје чињеница – када је у питању дубоко учење, што је ваш скуп података већи, већа је вероватноћа да ћете постићи тачније резултате.

Иако сама суштина овог чланка лежи у пружању предузећа са ограниченим скупом података, често смо имали незадовољство да наиђемо на превише „виших“, који третирају улагање у прикупљање података као што је чињење кардиналног греха.

Пречесто је да предузећа превиђају предности које нуди дубоко учење, једноставно зато што нерадо улажу време и труд у прикупљање података. Ако ваше предузеће није сигурно у вези са количином података које треба прикупити, предлажемо да нацртате криве учења, пошто су додатни подаци интегрисани у модел, и посматрате промену у перформансама модела.

Супротно популарном веровању већине ОЦД и ОЦД, понекад је најбољи начин за решавање проблема прикупљањем релевантнијих података. Улога ОЦД и ЦИСО је изузетно важна у овом случају јер увек постоји опасност од сајбер-напада. Утврђено је да је у 2019. укупна глобална потрошња на сајбер безбедност износи 103.1 милијарду долара, а број наставља да расте. Да бисмо ово ставили у перспективу, хајде да размотримо једноставан пример – замислите да покушавате да класификујете ретке дијаманте, али имате приступ веома ограниченом скупу података. Као што најочигледније решење проблема налаже, уместо да имате теренски дан са основним моделом, само прикупите више података!

#3- Повећање података:

Иако су прве две тачке о којима смо горе говорили веома ефикасне у обезбеђивању лаког решења за већину проблема у вези са имплементацијом дубоког учења у предузећа са малим скупом података, оне се у великој мери ослањају на одређени ниво среће да би обавили посао. .

Ако не можете да постигнете успех ни са финим подешавањем већ постојећег скупа података, препоручујемо вам да покушате са повећањем података. Начин на који је повећање података једноставан. Кроз процес увећања података, скуп улазних података се мења, или повећава, на такав начин да даје нови излаз, без стварне промене вредности ознаке.

Да бисмо ставили идеју повећања података у перспективу за наше читаоце, хајде да размотримо слику пса. Када се ротира, посматрач слике ће и даље моћи да каже да је то слика пса. То је управо оно чему се нада да ће постићи добро повећање података, у поређењу са ротираном сликом пута, која мења угао елевације и оставља довољно простора за алгоритам дубоког учења да дође до погрешног закључка, и поништава сврху имплементације дубоко учење на првом месту.

Када је у питању решавање проблема у вези са класификацијом слика, повећање података служи као кључни играч на терену и угошћује разне технике повећања података које помажу моделу дубоког учења да стекне дубинско разумевање различитих класификација слика.

Штавише, када је у питању повећање података - могућности су практично бескрајне. Предузећа могу да имплементирају повећање података на различите начине, који укључују НЛП и експериментисање ГАН-а, што омогућава алгоритму да генерише нове податке.

#4- Имплементација ефекта ансамбла:

Технологија која стоји иза дубоког учења диктира да је мрежа изграђена на више слојева. Међутим, супротно популарном веровању које многи одржавају, уместо да се сваки слој посматра као хијерархија карактеристика која се стално повећава, последњи слој служи сврси да понуди механизам ансамбла.

Уверење да би предузећа која имају приступ ограниченом или мањем скупу података требало да се одлуче да дубоко изграде своје мреже такође је подељена у НИП папир, што је одражавало веровање које смо изразили изнад. Предузећа са малим подацима могу лако да манипулишу ефектом ансамбла у своју корист, једноставно изграђујући своје мреже дубоког учења дубоко, кроз фино подешавање или неку другу алтернативу.

#5- Укључивање аутоматских енкодера:

Иако је пета тачка коју смо узели у обзир постигла само релативан ниво успеха – ми смо још увек у вези са употребом аутоенкодера како бисмо унапред обучили мрежу и правилно иницијализовали мрежу.

Један од највећих разлога, осим сајбер-напада, зашто предузећа не успевају да превазиђу почетне препреке интеграције дубоког учења је лоша иницијализација, а то је и много замки. Претходна обука без надзора често доводи до лошег или нетачног извршавања технологије дубоког учења, у чему могу да заблистају аутоматски кодери.

Основни појам неуронске мреже диктира стварање неуронске мреже која предвиђа природу скупа података који се уносе. Ако нисте сигурни како да користите аутоенкодер, постоји неколико туторијала на мрежи који дају јасна упутства.

Закључак:

На крају чланка, желели бисмо да надокнадимо оно што смо рекли у читавом чланку, са једним додатком – укључивање знања из домена у процес учења! Не само да укључивање вредног увида убрзава процес учења, већ такође омогућава технологији дубоког учења да произведе боље и тачније резултате.