Intervjuer

Sharone Ben-Levi, VP for Global Salg og Forretningsutvikling, Kontakt Senter, AudioCodes – Intervju-serie

mm

Sharone Ben-Levi, VP for Global Salg og Forretningsutvikling, Kontakt Senter, AudioCodes, er en erfaren kommunikasjonsteknologi-ekspert med over 25 års erfaring fra salg, markedsføring, forretningsutvikling og kontakt senter-innovasjon. I løpet av en karriere som har inkludert over to tiår hos AudioCodes, har han hatt en rekke ledende stillinger som har fokusert på å drive vekst over hele bedriftskommunikasjon, kundeopplevelse-løsninger og AI-drevne kontakt senter-teknologier. Før AudioCodes, arbeidet han hos NICE Systems, der han fikk verdifull erfaring med kundeengasjement og bedriftsprogramvare. Gjennom hele sin karriere har Ben-Levi fokusert på å hjelpe organisasjoner med å modernisere kundeinteraksjoner gjennom sky-basert kommunikasjon, automatisering og konversasjons-AI, noe som gjør ham til en anerkjent stemme i utviklingen av kontakt senter-teknologi.

AudioCodes er et kommunikasjonsteknologi-selskap som spesialiserer seg på bedrifts-voice, kontakt senter og AI-drevne kundeopplevelse-løsninger. Grunnlagt i 1993, har selskapet utviklet seg fra en leverandør av voice-nettverk og VoIP-infrastruktur til en ledende aktør innen intelligent voice-kommunikasjon, som hjelper organisasjoner med å modernisere kunde- og ansatt-interaksjoner over sky-basert, hybrid og på-sted-miljøer. Deres portefølje inkluderer voice-AI-plattformer, konversasjons-AI-løsninger, session-grensekontrollere, Microsoft Teams-voice-integrasjoner, CPaaS-tilbud og kontakt senter-moderniseringsverktøy. Gjennom plattformer som VoiceAI Connect og Live Hub, gjør AudioCodes det mulig for bedrifter å deployere voice-boter, AI-agenter, agent-støtte-funksjoner, konversasjons-IVR-løsninger og sanntids-kommunikasjonstjenester, samtidig som de integrerer med eksisterende telefoni- og kontakt senter-infrastruktur. Deres teknologier brukes av bedrifter og tjenesteleverandører over hele verden for å forbedre kundeopplevelser, automatisere arbeidsflyter og støtte digitale transformasjonsinitiativer.

Du har tilbragt over to tiår hos AudioCodes, og utviklet deg fra innbygde systemer-ingeniør til å lede produktivitets-applikasjoner. Hvordan har denne reisen formet din perspektiv på hva det tar å gjøre voice-AI pålitelig i bedriftsmiljøer?

Jeg har sett bedriftskommunikasjon fra flere perspektiver, og denne reisen har forsterket en grunnleggende lære: pålitelighet må bygges inn i hvert lag av systemet fra starten.

Arbeid med innbygde systemer lærte meg at detaljene er viktige, små tekniske beslutninger har en stor innvirkning i produksjonsmiljøer. Latens, lydkvalitet, transkripsjonsnøyaktighet, naturlig vending, og hver enkelt annen komponent må være konstruert med pålitelighet i mente, fordi hvis noen av dem svikter, svikter hele systemet. Du kan ikke hevde at et voice-AI-system fungerer hvis det bare fungerer under ideelle forhold.

Å gå over til ledelse gjorde dette enda mer tydelig. Bedrifter støtter tusenvis av brukere over komplekse infrastrukturer med strenge krav til oppetid. Et system som fungerer bra i en pilot, men degraderer under virkelig belastning, har ikke løst problemet.

Dette er ultimate hva min karriere har lært meg: standarden for voice-AI i bedrifter er tillit. Og tillit bygges bare når organisasjoner kan stole på at systemet fungerer pålitelig nok til å bli en del av deres kritiske forretningsprosesser.

Mange organisasjoner har eksperimentert med chat-boter, men voice introduserer en annen kompleksitetsnivå. Hva er de største tekniske utfordringene ved å gå fra tekst-basert AI til fullt konversasjonelle voice-systemer?

Den største utfordringen er kompleksiteten i bedrifts-voice-miljøer, som ofte er fragmentert i separate “øyer” som krever megling mellom SIP-basert telefoni-protokoller og AI-HTTP/SSE-basert API-er. Det handler også om mennesker. Veldig få ingeniører kjenner både SIP og HTTP/SSE. I tillegg, til forskjell fra tekst-basert systemer, krever voice sanntids-prosessering og orkestrering, inkludert konvertering mellom forskjellige protokoller så disse systemene kan kommunisere sammenhengende. Dette øker kravene betraktelig fra et teknisk ståsted. Latens, bakgrunnsstøy, aksent og kors-snakk er nå kastet inn i blandingen. Disse variablene eksisterte ikke med tekst-bare.

AudioCodes fokuserer på å brygge over tradisjonelle telefoni-systemer med moderne AI-plattformer. Kan du forklare hvordan løsninger som VoiceAI Connect integrerer legacy-infrastruktur med avanserte AI-modeller?

VoiceAI Connect er broen som kobler tradisjonelle kunde-kontakt-punkter (telefonnumre, SIP-trunker og kontakt senter-telefoni) direkte til tredjeparts konversasjons-AI-plattformer som Google CX Agent Studio, Amazon Lex, Microsoft Copilot og over 30 andre. Det håndterer kompleks sanntids-voice-orkestrering, inkludert tale-til-tekst og tekst-til-tale og bot-rammeverk-ruting, som gjør det mulig for bedrifter å blande og matche og enkelt voice-aktivere deres valgte AI-boter uten å forlate deres legacy-telefoni-oppsettinger. Legacy-plattformer mangler vanligvis API-integrasjoner fra deres media-servere til de nye Voice AI-tilbudene. Vi omgår dette ved å koble til dem gjennom deres SIP-telefoni-grensesnitt og koble til moderne AI-grensesnitt.

Bedrifter har ofte vanskelig for å gå utover pilot-prosjekter. Hva er de viktigste arkitektoniske eller operative barrierene som forhindrer voice-AI fra å skaleres over hele organisasjoner?

Voice-AI er fremdeles i utvikling. Når en bedrift tester en AI-teknologi, kommer en ny og bedre en langs. Siden Audiocodes konstant integrerer med de nyeste voice-AI-løsningene, gjør det det mulig for bedriften å blande og matche og enkelt fremtidssikre deres miljø. Audiocodes-orkestrering gjør det mulig for dem å prøve forskjellige bot-rammeverk for forskjellige formål, med tanke på ytelse, kostnad, språk og overholdelse. Dette øker sjansen for en vellykket overgang til produksjon.

Andre produksjons-orkestrerings-Overveielser er relatert til skalerbarhet, forretningskontinuitet og kobling til multiple kontakt senter-miljøer over hele verden.

I virkelige deployeringer, hva ser en vellykket AI-drevet oppringnings-erfaring ut som fra slutbrukerens perspektiv, og hvor nær er vi å oppnå menneske-lignende interaksjoner i skala?

Vi har flere svært store kunder som startet med oss rundt 2020 og 2021. De er bevis på at menneske-lignende interaksjoner i skala allerede fungerer bra. Reelle brukstilfeller inkluderer kunde-orienterte oppgaver som oppringnings-styring, avtale-booking og penger-overføring, samt agent-orienterte verktøy som AI-opprings-summering, sanntids-kunnskaps-veiledning og live-voice-oversettelse.

For slutbrukeren føles en AI-drevet oppringnings-erfaring uten friksjon. I stedet for å navigere i stive meny-trær (trykk 1 for dette, trykk 2 for det), kan ringere naturlig snakke i sine egne ord gjennom konversasjons-IVR-systemer som forstår intensjon og responderer på en passende måte. Dette skaper en mer intuitiv og effektiv interaksjon fra det aller første punktet.

Mens industrien ikke ennå er på helt menneske-lignende komplekse interaksjoner i skala, bringer disse funksjonene bedrifter betydelig nærmere. Ved å blande AI og automatisering med menneskelig støtte, kan bedrifter levere mer nøyaktige og mer personlige erfaringer.

Voice-AI avhenger av tale-gjenkjenning, naturlig språk-forståelse og sanntids-prosessering. Hvor ser du de største flaskenekkene i dag, og hvordan håndteres de?

En stor bedriftsflaskehals i å adoptere Voice-AI kartlegger tilbake til integrasjon. Ifølge en nylig rapport fra Opus Research sier bare 38% av bedriftene at kostnad er en barriere for å adoptere voice-AI. Imidlertid sier 65% at integrasjon innen eksisterende systemer og 60% sier integrasjons-kompleksitet.

CCaaS-leverandører øker stadig barrierer for en “bring-your-own-bot”-modell ved å blokkere integrasjoner eller gjøre dem finansielt ikke viable. Eldre systemer har bare ikke oppdaterte API-integrasjoner. Løsninger som AudioCodes’ Voice AI Connect kobler til eksisterende kontakt senter-miljøer over standard-SIP og har AIP-integrasjoner til over 30 voice-AI-bot-rammeverk og over 20 tale-til-tekst- og tekst-til-tale-motorer, og eliminerer behovet for å skrive disse API-ene manuelt.

Den samme rapporten understreker generell ytelses-kvalitet (lydkvalitet, samtale-flyt, osv.) som den største grunnen (72%) som bremser adopsjonen. Hva Voice AI Connect tillater er å blande og matche bot-rammeverk, STT-er og TTS-er for å optimere implementeringer siden ikke hver AI passer hver brukstilfelle og variasjoner er også nødvendige for jargon og språk. I tillegg er AI-industrien raskt utviklende, og krever enkelt switching til en ny AI-leverandør når teknologien forbedres.

Integrasjon bør være lav-forsinkelse, rimelig og enkel å deployere. Den bør også forbedre sikkerhet og feilsøking, sikre forretningskontinuitet og tilby en på-sted-opsjon.

AudioCodes fremmer en fleksibel tilnærming som kobler multiple AI- og tale-leverandører. Hvor viktig er leverandør-fleksibilitet når det gjelder å bygge robuste og fremtidssikrede voice-AI-systemer?

Leverandør-fleksibilitet er kritisk fordi bedrifter sjelden opererer i en enkelt-leverandør-miljø, og det finnes mange forskjellige AI-, tale-, telefoni- og kommunikasjonsløsninger på markedet. For å skape en virkelig samlet voice-AI-strategi, må organisasjoner kunne bringe disse forskjellige løsningene sammen og sikre samarbeid over alle av dem samtidig som de optimaliserer kostnad, forsinkelse, brukstilfeller, språk-støtte og jargon.

En fleksibel tilnærming tillater bedrifter å integrere med multiple leverandører, velge riktige teknologier for forskjellige brukstilfeller og tilpasse seg når markedet utvikler seg.

I regulerte industrier som finansielle eller helsetjenester, hvordan er det å samle inn og analysere voice-interaksjons-data forskjellig fra typiske sky-basert AI-arbeidsflyter?

Voice-data-håndtering er styrt av strenge personvern- og overholdelseskrav som betydelig begrenser bruken av sky-basert AI-verktøy. For å håndtere dette, adopterer mange regulerte organisasjoner på-sted-deployeringer for å sikre at følsomme data forblir innen kontrollerte miljøer og aldri forlater deres infrastruktur.

Overholdelses-standarder krever også at voice-interaksjoner blir innspilt og lagret i bestemte formater i årevis, med høy nøyaktighet, ord-til-ord-transkript strukturert for granskning. For eksempel, i finans, må en handelsfirma lagre hver innspilt samtale og transkript nøyaktig som det ble sagt for regulering-granskninger – data kan ikke endres eller summeres. I helsetjenester, må en tjenesteleverandør som håndterer pasient-samtaler holde innspillinger og transkript fullstendig sikre og HIPAA-kompatible. Over hele linjen, må data ofte prosesseres på-sted for å forhindre beskyttet informasjon fra å bli eksponert for eksterne sky-tjenester.

Som bedrifter begynner å deployere AI-agenter som kan utføre handlinger i stedet for bare å respondere, hvordan endrer dette rollen til voice-grensesnitt i kunde-tjenester og interne operasjoner?

Voice-grensesnitt utvikler seg fra passive verktøy til proaktive, intelligente systemer som kan analysere og handle i sanntid. I stedet for bare å innspille eller routere samtaler, kan AI-drevne voice-systemer nå forstå intensjon og utføre umiddelbare handlinger, som å løse kunde-problemer, utløse bak-end-prosesser eller hjelpe en ansatt med å løse et IT-problem. Dette skiftet er spesielt kraftig fordi voice ofte er det første og mest naturlige kontaktpunktet.

AI-agenter kan nå proaktivt nå ut til en menneskelig overordnet – for eksempel, for å godkjenne en rabatt for en kunde. De kan også utføre direkte handlinger, som å legge til varer i en kundes nettbutikk-vogn. Og de kan samarbeide med andre boter som har spesialiserte ferdigheter, som å analysere bilder delt av kunder for å bedre forstå konteksten. Hver av disse representerer et nivå av sofistikasjon som ikke eksisterte tidligere. 

Ser du fremover, ser du voice bli et primært grensesnitt for bedrifts-AI-systemer, eller vil det forbli en del av en bredere multimodal erfaring?

La meg bruke et personlig eksempel for å understreke min poeng. Jeg har to tenåringer. De ville foretrekke å ikke interagere med en menneskelig kunde-tjenesterepresentant hvis mulig. Imidlertid ville de mye heller snakke med en bot enn tekst med det. Voice har vært det naturlige kommunikasjonsmidlet for mennesker i millioner av år. Det er foretrukket over et tastatur eller en mus, i alle fall til mindre lesing blir virkelighet.

Takk for det flotte intervjuet, lesere som ønsker å lære mer bør besøke AudioCodes.

Antoine er en visjonær leder og medstifter av Unite.AI, drevet av en urokkelig lidenskap for å forme og fremme fremtiden for AI og robotikk. En serial entrepreneur, han tror at AI vil være like disruptiv for samfunnet som elektrisitet, og blir ofte fanget i å prise potensialet for disruptive teknologier og AGI.

Som en futurist, er han dedikert til å utforske hvordan disse innovasjonene vil forme vår verden. I tillegg er han grunnlegger av Securities.io, en plattform fokusert på å investere i banebrytende teknologier som omdefinerer fremtiden og omformer hele sektorer.