Îstîxbaratê ya sûnî

Ji bo Danûstandinên Navenda Bangê Detektorek Derew a Bingeha AI-ê

Demê on December 9, 2022

Lekolînwanên li Almanya fêrbûna makîneyê bikar anîne da ku pergalek analîza bihîstwerî biafirînin ku di serî de ji bo xerîdar di ragihandina dengî de bi navenda bangê û karmendên piştgirî re wekî detektorek derewîn-based AI-ê tevbigere.

Ew sîstem Di dema nîqaşên li ser mijarên nakok de, di nav de exlaqê cezayê îdamê û xercên xwendinê, danehevek tomarên dengî yên ku bi taybetî hatine çêkirin ji hêla 40 xwendekar û mamosteyan ve bikar tîne. Model li ser mîmariyek ku Tora Neuralî ya Hevbeş (CNN) û Bîra Dem-Kurte ya Dirêj (LSTM) bikar tîne hate perwerde kirin, û rêjeyek rastbûna ragihandinê ya 98% bi dest xist.

Her çend niyeta diyarkirî ya xebatê danûstendinên xerîdar vedibêje, lê lêkolîner qebûl dikin ku ew bi bandor wekî detektorek derewînek gelemperî tevdigere:

'Vedîtin ji bo cûrbecûr pêvajoyên karûbarê têne sepandin û bi taybetî ji bo hemî danûstendinên xerîdar ên ku bi têlefonê pêk tên bikêr in. Algorîtmaya ku hatî pêşkêş kirin dikare di her rewşê de were sepandin ku ji ajansê re arîkar e ku zanibe ka xerîdar bi baweriya wê/wî diaxive.

'Ev dikare, bo nimûne, bibe sedema kêmkirina îdîayên bîmeya gumanbar, an jî daxuyaniyên nerast ên di hevpeyivînên kar de. Ev ê ne tenê windahiyên xebitandinê yên ji bo pargîdaniyên karûbarê kêm bike, dê xerîdar jî teşwîq bike ku bêtir rastdar bin.'

Nifşê Dataset

Di nebûna danehevek guncan a gelemperî ya bi zimanê Almanî de, lêkolîner - ji Zanîngeha Neu-Ulm of Sciences Applied (HNU) - çavkaniya xwe ya çavkaniyan afirandin. Li zanîngeh û dibistanên herêmî belavok hatin belavkirin, bi 40 dilxwazên ku temenê wan herî kêm 16 e hatin hilbijartin. Dilxwazan bi 10 euro fîşeke Amazonê dihatin dayîn.

Danişîn li ser modelek klûbek nîqaşê ku ji bo polarîzekirina ramanê hatî çêkirin û bersivên xurt li dora mijarên şewatandî derdixe, bi bandor modela stresê ya ku dikare di danûstendinên xerîdar ên pirsgirêk ên li ser têlefonê de çêbibe, hate kirin.

Mijarên ku dilxwaz diviyabû sê deqeyan bi serbestî li ser gel biaxivin ev bûn:

– Divê li Almanyayê cezayê îdamê û îdamkirina gel ji nû ve were tetbîqkirin?
- Ma divê li Elmanyayê xercên xwendinê yên lêçûn werin xerckirin?
– Divê li Almanyayê bikaranîna narkotîkên dijwar ên wek eroîn û krîstal metmayê bê qanûnîkirin?
– Ma zincîreyên xwaringehan ku xwarinên bilez ên netendurist pêşkêş dikin, mîna McDonald's an Burger King, divê li Elmanyayê werin qedexe kirin?

Pre-Processing

Projeyê analîzkirina taybetmendiyên axaftina akustîk di nêzîkatiya Naskirina Axaftina Otomatîk (ASR) de li ser nêzîkatiya NLP (ku axaftin di astek zimanî de tê analîz kirin, û 'germahiya' ya axaftinê rasterast ji karanîna ziman tê destnîşan kirin) pejirand.

Nimûneyên derxistina pêş-pêvajoyî di destpêkê de bi navgîniya Mel-frequency Cepstral Coefficients (MFCCs) ve hatin analîz kirin, rêbazek pêbawer, kevntir ku hîn jî di analîza axaftinê de pir populer e. Ji ber ku rêbaz yekem car di sala 1980-an de hate pêşniyar kirin, ew bi taybetî bi çavkaniyên hesabkirinê re di warê naskirina qalibên dubare yên di axaftinê de erzan e, û ji astên cihêreng ên qalîteya girtina deng re berxwedêr e. Ji ber ku danişîn li ser platformên VOIP-ê di şert û mercên girtî de di Kanûna 2020-an de hatin girtin, girîng bû ku çarçoveyek tomarkirinê hebe ku dema ku hewce bike bikaribe dengê kalîteya nebaş hesab bike.

Balkêş e ku were zanîn ku her du tixûbên teknîkî yên jorîn (çavkaniyên CPU yên sînorkirî di destpêka salên 1980-an de û neqeydeyên pêwendiya VOIP-ê di çarçoveyek torê ya tevlihev de) li vir li hev dicivînin da ku modelek "teknîkî kêm" biafirînin ku (xuya ye) bi rengek neasayî bihêz e. di nebûna şert û mercên xebatê yên îdeal û çavkaniyên asta bilind de - ji bo algorîtmaya encamgir qada armancê teqlîd dike.

Piştre Veguherînek Fast Fourier (FFT) algorîtma li hember beşên dengî hate sepandin da ku profîlek spektral ya her 'çarçoveya deng' peyda bike, berî ku nexşeya dawîn li Mel Scale.

Perwerde, Encam û Sînorkirin

Di dema perwerdehiyê de, vektorên taybetmendiyê yên hatine derxistin derbasî qatek torê ya konvokî ya dem-dabeşkirî têne kirin, têne hev kirin û dûv re derbasî qatek LSTM dibin.

Mîmariya pêvajoya perwerdehiyê ya ji bo detektorê rastiyê AI. Çavkanî: https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

Di dawiyê de, hemî neuron bi hevûdu ve girêdayî ne da ku pêşbîniyek binarîkî çêbikin ka gelo axaftvan tiştên ku ew bawer dikin rast in dibêjin an na.

Di îmtîhanên piştî perwerdehiyê de, pergal di warê têgihîştina mebestê de heya 98.91% astek rastbûnê bi dest xist (ku naveroka axaftinê dibe ku niyetê nîşan nede). Lekolînwan dihesibînin ku xebat bi awayekî ampîrîkî li ser bingeha qalibên deng nasnama bawerîyê destnîşan dike, û ku ev dikare bêyî hilweşandina ziman bi şêwaza NLP-ê were bidestxistin.

Di warê sînorkirinan de, lêkolîner qebûl dikin ku nimûneya testê piçûk e. Her çend kaxez bi eşkere wê nabêje, daneyên ceribandinê yên kêm-hejmar dikare serîlêdana paşîn kêm bike di bûyera ku pêşnuma, taybetmendiyên mîmarî û pêvajoya perwerdehiya gelemperî li gorî daneyan zêde ne. Kaxez destnîşan dike ku şeş ji heşt modelên ku li seranserê projeyê hatine çêkirin di hin xalek pêvajoya fêrbûnê de zêde hatine bicîh kirin, û ku ji bo gelemperîkirina sepandina pîvanên ku ji bo modelê hatine destnîşan kirin xebatek din heye ku were kirin.

Wekî din, lêkolîna bi vî rengî divê taybetmendiyên neteweyî hesab bike, û kaxez destnîşan dike ku mijarên Alman ên ku di hilberîna daneyan de cih digirin dibe ku xwediyê şêwazên ragihandinê bin ku rasterast di nav çandan de nayên dubare kirin - rewşek ku dibe ku di lêkolînek weha de derkeve holê. her miletî.