stub AI pagrįstas melo detektorius skambučių centro pokalbiams – Unite.AI
Susisiekti su mumis

Dirbtinis intelektas

Dirbtiniu intelektu pagrįstas melo detektorius skambučių centro pokalbiams

mm
Atnaujinta on

Vokietijos mokslininkai naudojo mašininį mokymąsi, kad sukurtų garso analizės sistemą, skirtą visų pirma dirbti kaip dirbtinio intelekto melo detektorius klientams, palaikantiems garso ryšį su skambučių centru ir pagalbiniais darbuotojais.

Šios sistema naudoja specialiai sukurtą 40 studentų ir dėstytojų garso įrašų duomenų rinkinį diskutuojant ginčytinomis temomis, įskaitant mirties bausmės moralę ir mokesčius už mokslą. Modelis buvo apmokytas architektūroje, kurioje naudojami konvoliuciniai neuroniniai tinklai (CNN) ir ilgalaikė trumpalaikė atmintis (LSTM), ir pasiektas 98% tikslumo rodiklis.

Nors nurodytas darbo tikslas cituojamas klientų bendravimas, tyrėjai pripažįsta, kad jis veiksmingai veikia kaip bendrosios paskirties melo detektorius:

„Išvados pritaikomos įvairiems paslaugų teikimo procesams ir yra ypač naudingos visoms klientų sąveikoms telefonu. Pateiktas algoritmas gali būti taikomas bet kurioje situacijoje, kai agentui naudinga žinoti, ar klientas kalba savo įsitikinimu.

„Dėl to, pavyzdžiui, gali sumažėti abejotinų draudimo išmokų arba melagingų teiginių darbo pokalbiuose. Tai ne tik sumažintų paslaugų įmonių veiklos nuostolius, bet ir paskatintų klientus būti nuoširdesnius.

Duomenų rinkinio generavimas

Nesant tinkamo viešai prieinamo duomenų rinkinio vokiečių kalba, mokslininkai iš Neu-Ulm taikomųjų mokslų universiteto (HNU) sukūrė savo šaltinio medžiagą. Universitete ir vietinėse mokyklose buvo paskelbtos skrajutės, atrinkta 40 savanorių, kurių amžius ne mažesnis nei 16 metų. Savanoriai buvo apmokėti 10 eurų Amazon kuponu.

Užsiėmimai vyko pagal debatų klubo modelį, skirtą suskaidyti nuomonę ir sužadinti stiprius atsakymus uždegančiomis temomis, efektyviai modeliuojant įtampą, kuri gali kilti probleminiuose klientų pokalbiuose telefonu.

Temos, kuriomis savanoriai turėjo laisvai kalbėti tris minutes viešai:

– Ar Vokietijoje reikėtų vėl įvesti mirties bausmę ir viešas egzekucijas?
– Ar Vokietijoje reikėtų mokėti išlaidas už mokslą?
– Ar Vokietijoje turėtų būti įteisintas sunkiųjų narkotikų, tokių kaip heroinas ir kristalinis metamas, vartojimas?
– Ar Vokietijoje reikėtų uždrausti nesveiką greitą maistą tiekiančius restoranų tinklus, tokius kaip „McDonald's“ ar „Burger King“?

Išankstinis apdorojimas

Projekte buvo teikiama pirmenybė akustinių kalbos ypatybių analizei naudojant automatinio kalbos atpažinimo (ASR) metodą, o ne NLP metodą (kai kalba analizuojama lingvistiniu lygmeniu, o diskurso „temperatūra“ nustatoma tiesiogiai iš kalbos vartojimo).

Iš anksto apdoroti ekstrahuoti mėginiai iš pradžių buvo analizuojami naudojant Mel dažnio cepstralinius koeficientus (MFCC), patikimą, senesnį metodą, vis dar labai populiarų kalbos analizėje. Kadangi metodas pirmą kartą buvo pasiūlytas 1980 m., jis ypač taupo skaičiavimo išteklius, nes atpažįsta pasikartojančius kalbos modelius ir yra atsparus įvairiems garso įrašymo kokybės lygiams. Kadangi 2020 m. gruodžio mėn. seansai buvo vykdomi per VOIP platformas užrakinimo sąlygomis, buvo svarbu turėti įrašymo sistemą, kuri prireikus galėtų atsižvelgti į prastos kokybės garsą.

Įdomu pastebėti, kad du pirmiau minėti techniniai apribojimai (riboti procesoriaus ištekliai devintojo dešimtmečio pradžioje ir VOIP ryšio ekscentriškumas perpildyto tinklo kontekste) kartu sukuria „techniškai negausų“ modelį, kuris yra (matyt) neįprastai tvirtas. nesant idealių darbo sąlygų ir aukšto lygio išteklių – imituojant gauto algoritmo tikslinę areną.

Po to greitoji Furjė transformacija (FFT) algoritmas buvo pritaikytas garso segmentams, kad būtų pateiktas kiekvieno „garso kadro“ spektrinis profilis prieš galutinį susiejimą su Mel skale.

Treniruotės, rezultatai ir apribojimai

Mokymo metu išgauti funkcijų vektoriai perduodami į laiko paskirstytą konvoliucinio tinklo sluoksnį, išlyginami ir tada perduodami į LSTM sluoksnį.

AI tiesos detektoriaus mokymo proceso architektūra. Šaltinis: https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

AI tiesos detektoriaus mokymo proceso architektūra. Šaltinis: https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

Galiausiai visi neuronai yra sujungti vienas su kitu, kad būtų sukurta dvejetainė prognozė, ar kalbėtojas sako dalykus, kurie, jų manymu, yra tiesa.

Atliekant testus po treniruotės, sistema pasiekė iki 98.91% tikslumo lygį, kalbant apie ketinimų atpažinimą (kai kalbamasis turinys gali neatspindėti ketinimo). Tyrėjai mano, kad darbas empiriškai parodo įsitikinimų identifikavimą, pagrįstą balso modeliais, ir kad tai galima pasiekti be NLP stiliaus kalbos dekonstrukcijos.

Kalbant apie apribojimus, mokslininkai pripažįsta, kad tiriamoji imtis yra nedidelė. Nors dokumente tai nėra aiškiai nurodyta, mažos apimties bandymų duomenys gali sumažinti vėlesnį pritaikymą tuo atveju, jei prielaidos, architektūrinės savybės ir bendras mokymo procesas per daug tinka duomenims. Straipsnyje pažymima, kad šeši iš aštuonių modelių, sukurtų viso projekto metu, tam tikru mokymosi proceso momentu buvo per daug pritaikyti ir kad reikia toliau dirbti apibendrinant modeliui nustatytų parametrų pritaikomumą.

Be to, tokio pobūdžio tyrimuose turi būti atsižvelgiama į nacionalines ypatybes, o darbe pažymima, kad vokiečių subjektai, dalyvaujantys kuriant duomenis, gali turėti komunikacijos modelius, kurie nėra tiesiogiai atkartojami įvairiose kultūrose – tokia situacija gali susidaryti atliekant bet kokį tokį tyrimą. bet kuri tauta.