Stumm En AI-baséiert Lie Detektor fir Call Center Gespréicher - Unite.AI
Connect mat eis

Kënschtlech Intelligenz

En AI-baséiert Lie Detektor fir Call Center Gespréicher

mm
aktualiséiert on

Fuerscher an Däitschland hunn Maschinnléiere benotzt fir en Audioanalysesystem ze kreéieren deen haaptsächlech als AI-baséiert Ligendetektor fir Clienten an Audiokommunikatioun mam Call Center an Supportpersonal handelt.

d' System benotzt e speziell erstallt Dataset vun Audioopname vu 40 Studenten an Enseignanten wärend Debatten iwwer kontrovers Themen, dorënner d'Moral vun der Doudesstrof a Schoulgeld. De Modell gouf op enger Architektur trainéiert déi Convolutional Neural Networks (CNNs) a Long Short-Term Memory (LSTM) benotzt, an huet eng gemellt Genauegkeet vun 98% erreecht.

Och wann déi uginn Intent vun der Aarbecht Clientkommunikatioun zitéiert, ginn d'Fuerscher zou datt et effektiv als allgemeng Zweck Ligendetektor funktionnéiert:

'D'Resultater sinn applicabel fir eng breet Palette vu Serviceprozesser a speziell nëtzlech fir all Client Interaktiounen déi iwwer Telefon stattfannen. Den presentéierten Algorithmus kann an all Situatioun applizéiert ginn wou et hëllefräich ass fir den Agent ze wëssen ob e Client mat senger Iwwerzeegung schwätzt.

"Dëst kéint zum Beispill zu enger Reduktioun vun zweifelhafte Versécherungsfuerderungen oder onwahrhafte Aussoen an Aarbechtsinterviews féieren. Dëst géif net nëmmen operationell Verloschter fir Déngschtleeschtunge reduzéieren, mä och Clienten encouragéieren méi wouer ze sinn.'

Dataset Generatioun

Beim Fehlen vun engem gëeegent ëffentlech verfügbaren Dataset an der däitscher Sprooch hunn d'Fuerscher - vun der Neu-Ulm University of Applied Sciences (HNU) - hiert eegent Quellmaterial erstallt. Flyer goufen op der Uni an an de lokale Schoulen gepost, mat 40 Fräiwëlleger ausgewielt mat engem Minimumsalter vu 16. Fräiwëlleger goufen mat engem Amazon Bong vun 10 Euro bezuelt.

D'Sessioune goufen op engem Debattclubmodell gehaal, entworf fir d'Meenung ze polariséieren a staark Äntwerte ronderëm brennend Themen z'erwächen, effektiv de Stress ze modelléieren deen a problematesche Clientsgespréicher um Telefon ka geschéien.

D'Themen iwwer déi d'Fräiwëlleger dräi Minutte fräi an der Ëffentlechkeet hu misse schwätzen, waren:

– Soll d’Doudesstrof an d’ëffentlech Hiriichtungen an Däitschland erëm agefouert ginn?
- Sollt d'Käschtendeckend Schoulgeld an Däitschland verrechent ginn?
- Soll d'Benotzung vun haarden Drogen wéi Heroin a Crystal Meth an Däitschland legaliséiert ginn?
– Solle Restaurantketten, déi ongesonde Fastfood zerwéieren, wéi McDonald's oder Burger King, an Däitschland verbuede ginn?

Pre-Veraarbechtung

De Projet favoriséiert d'Analyse vun akustesche Riedfeatures an enger Automatesch Speech Recognition (ASR) Approche iwwer eng NLP Approche (wou Ried op sproochlechem Niveau analyséiert gëtt, an d'"Temperatur" vum Diskurs direkt aus der Sproochgebrauch ofgeleet gëtt).

Déi virveraarbechtte extrahéiert Echantillon goufen am Ufank iwwer Mel-Frequenz Cepstral Coefficients (MFCCs) analyséiert, eng zouverlässeg, eeler Method nach ëmmer ganz populär an der Riedanalyse. Zënter datt d'Methode fir d'éischt am Joer 1980 proposéiert gouf, ass et besonnesch spuersam mat Rechenressourcen wat d'Erkennung vu wiederhuelende Mustere an der Ried ugeet, an ass resistent géint verschidden Niveaue vun der Audio Capture Qualitéit. Well d'Sessiounen iwwer VOIP Plattformen a Sperrbedéngungen am Dezember 2020 duerchgefouert goufen, war et wichteg en Opnamkader ze hunn, dee fir schlecht Qualitéit Audio ausrechne kann wann néideg.

Et ass interessant ze bemierken datt déi zwee uewe genannten technesch Aschränkungen (limitéiert CPU Ressourcen an de fréien 1980er an d'Exzentrizitéite vun der VOIP Konnektivitéit an engem iwwerlaaschte Netzwierk) hei kombinéiere fir ze kreéieren wat effektiv en "technesch sparse" Modell ass deen (anscheinend) ongewéinlech robust ass an der Verontreiung vun ideal Aarbechtskonditiounen an héich-Niveau Ressourcen - Mimicking der Zil- Arena fir déi doraus resultéierend Algorithmus.

Duerno eng Fast Fourier Transform (FFT) Algorithmus gouf géint d'Audio Segmenter applizéiert fir e Spektralprofil vun all 'Audioframe' ze liwweren, ier d'final Kartéierung op d'Mel Skala.

Training, Resultater a Aschränkungen

Wärend der Ausbildung ginn déi extrahéiert Featurevektoren op eng Zäitverdeelt convolutional Netzwierkschicht weidergeleet, verflaacht an dann op eng LSTM Layer weiderginn.

Architektur vum Trainingsprozess fir den AI Wahrheitsdetektor. Source: https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

Architektur vum Trainingsprozess fir den AI Wahrheitsdetektor. Source: https://arxiv.org/ftp/arxiv/papers/2107/2107.11175.pdf

Schlussendlech sinn all Neuronen matenee verbonne fir eng binär Prognose ze generéieren fir ob de Spriecher Saachen seet oder net, déi se gleewen datt se richteg sinn.

An Tester nom Training huet de System e Genauegkeetsniveau vu bis zu 98.91% erreecht wat d'Absichtserkennung ugeet (wou de geschwaten Inhalt d'Intent net reflektéiert). D'Fuerscher mengen datt d'Aarbecht empiresch Iwwerzeegungsidentifikatioun op Basis vu Stëmmmuster weist, an datt dëst ouni NLP-Stil Dekonstruktioun vun der Sprooch erreecht ka ginn.

Wat d'Aschränkungen ugeet, ginn d'Fuerscher zou datt d'Testprobe kleng ass. Och wann de Pabeier et net explizit seet, niddereg-Volumen Testdaten kënne spéider Uwendung reduzéieren am Fall wou d'Vermutungen, architektonéiert Featuren an den allgemenge Trainingsprozess iwwerpasst un d'Daten sinn. De Pabeier stellt fest datt sechs vun den aacht Modeller, déi am ganze Projet gebaut goufen, iergendwann am Léierprozess iwwergepasst goufen, an datt et weider Aarbecht muss gemaach ginn fir d'Uwendbarkeet vun de Parameteren, déi fir de Modell gesat goufen, ze generaliséieren.

Weider, Fuerschung vun dëser Natur muss national Charakteristike berücksichtegen, an de Pabeier bemierkt datt déi däitsch Themen, déi an der Generatioun vun den Donnéeën involvéiert sinn, Kommunikatiounsmuster hunn, déi net direkt iwwer Kulturen replizéiert kënne ginn - eng Situatioun déi méiglecherweis an esou enger Etude optrieden. all Natioun.