Interviste

Sharone Ben-Levi, VP di Vendite e Sviluppo Aziendale Globale, Contact Center, AudioCodes – Serie di Interviste

Pubblicato il 11 giugno 2026

Antoine Tardif, Amministratore Delegato e Fondatore di Unite.AI

Sharone Ben-Levi, VP di Vendite e Sviluppo Aziendale Globale, Contact Center, AudioCodes, è un esperto di tecnologia delle comunicazioni con oltre 25 anni di esperienza in vendite, marketing, sviluppo aziendale e innovazione nel contact center. Nel corso della sua carriera, che include oltre due decenni in AudioCodes, ha ricoperto diverse posizioni di leadership senior focalizzate sul driving della crescita nelle comunicazioni aziendali, soluzioni di customer experience e tecnologie di contact center alimentate da intelligenza artificiale. Prima di unirsi ad AudioCodes, ha lavorato in NICE Systems, dove ha acquisito esperienza preziosa nel customer engagement e nel software aziendale. Durante la sua carriera, Ben-Levi si è concentrato sull’aiutare le organizzazioni a modernizzare le interazioni con i clienti attraverso le comunicazioni cloud, l’automazione e l’intelligenza artificiale conversazionale, diventando una voce riconosciuta nell’evoluzione della tecnologia del contact center.

AudioCodes è un’azienda di tecnologia delle comunicazioni specializzata in soluzioni di voice aziendale, contact center e customer experience alimentate da intelligenza artificiale. Fondata nel 1993, l’azienda è evoluta da un fornitore di infrastrutture di voice e VoIP a un leader nelle comunicazioni vocali intelligenti, aiutando le organizzazioni a modernizzare le interazioni con i clienti e i dipendenti attraverso ambienti cloud, ibridi e on-premises. Il suo portfolio include piattaforme di voice AI, soluzioni di intelligenza artificiale conversazionale, controller di sessione di bordo, integrazioni di Microsoft Teams, offerte di CPaaS e strumenti di modernizzazione del contact center. Attraverso piattaforme come VoiceAI Connect e Live Hub, AudioCodes consente alle aziende di distribuire bot vocali, agenti di intelligenza artificiale, capacità di assistenza degli agenti, soluzioni di IVR conversazionale e servizi di comunicazione in tempo reale, integrando con le infrastrutture di telefonia e contact center esistenti. Le sue tecnologie sono utilizzate da aziende e provider di servizi di tutto il mondo per migliorare le esperienze dei clienti, automatizzare i flussi di lavoro e supportare le iniziative di trasformazione digitale.

Ha trascorso oltre due decenni in AudioCodes, evolvendo da ingegnere di sistemi embedded a leader di applicazioni di produttività. Come ha influenzato il suo percorso la prospettiva su cosa serve per rendere l’intelligenza artificiale vocale affidabile negli ambienti aziendali?

Ho visto le comunicazioni aziendali da molteplici prospettive, e questo percorso ha rafforzato una lezione fondamentale: l’affidabilità deve essere costruita in ogni livello del sistema fin dall’inizio.

Lavorare su sistemi embedded mi ha insegnato che il diavolo è nei dettagli, le piccole decisioni tecniche hanno un impatto sproporzionato negli ambienti di produzione. La latenza, la qualità audio, l’accuratezza della trascrizione, il turn-taking naturale e ogni altro elemento devono essere progettati con l’affidabilità in mente, perché se uno di essi fallisce, l’intero sistema fallisce. Non puoi affermare che un sistema di intelligenza artificiale vocale funziona se funziona solo in condizioni ideali.

Passare a ruoli di leadership ha reso questo ancora più chiaro. Le aziende supportano migliaia di utenti attraverso infrastrutture complesse con requisiti di uptime severi. Un sistema che funziona bene in un progetto pilota ma si degrada sotto carichi reali non ha risolto il problema.

Questo è essenzialmente ciò che la mia carriera mi ha insegnato: la barra per l’intelligenza artificiale vocale nell’ambito aziendale è la fiducia. E la fiducia si costruisce solo quando le organizzazioni possono fare affidamento sul sistema per eseguire in modo affidabile abbastanza da diventare parte dei processi aziendali critici.

Molte organizzazioni hanno sperimentato chatbot, ma la voce introduce un livello di complessità diverso. Quali sono le sfide tecniche più grandi nel passare da sistemi di intelligenza artificiale basati su testo a sistemi di voce completamente conversazionali?

La sfida più grande è la complessità degli ambienti vocali aziendali, che sono spesso frammentati in “isole” separate che richiedono mediazione tra i protocolli di telefonia SIP e le API HTTP/SSE basate su intelligenza artificiale. Arriva addirittura alle persone. Molti ingegneri conoscono sia SIP che HTTP/SSE. Inoltre, a differenza dei sistemi basati su testo, la voce richiede l’elaborazione e l’orchestrazione in tempo reale, compresa la conversione tra diversi protocolli in modo che questi sistemi possano comunicare in modo fluido. Questa urgenza e interoperabilità rendono notevolmente più impegnativo fornire un’esperienza conversazionale fluida dal punto di vista tecnologico. La latenza, il rumore di fondo, l’accento e il crosstalk sono ora gettati nel mix. Queste variabili non esistevano con il testo solo.

AudioCodes si concentra sul collegamento dei sistemi di telefonia tradizionali con piattaforme di intelligenza artificiale moderne. Può spiegare come soluzioni come VoiceAI Connect integrino l’infrastruttura legacy con modelli di intelligenza artificiale avanzati?

VoiceAI Connect è il ponte che collega i punti di contatto del cliente tradizionali (numeri di telefono, trunk SIP e telefonia del contact center) direttamente a piattaforme di intelligenza artificiale conversazionale di terze parti come Google CX Agent Studio, Amazon Lex, Microsoft Copilot e oltre 30 altre. Gestisce l’orchestrazione vocale in tempo reale complessa, inclusa la trascrizione vocale e la sintesi vocale, e il routing del framework del bot, consentendo alle aziende di mescolare e abbinare facilmente la voce ai loro bot AI scelti senza abbandonare le loro configurazioni di telefonia legacy. Le piattaforme legacy mancano tipicamente di integrazioni API dai loro server multimediali alle nuove offerte di intelligenza artificiale vocale. Noi aggiriamo questo problema connettendoci a loro attraverso le interfacce di telefonia SIP e connettendoci alle interfacce di intelligenza artificiale moderne.

Le aziende spesso lottano per andare oltre i progetti pilota. Quali sono le barriere architettoniche o operative chiave che impediscono all’intelligenza artificiale vocale di scalare in tutta l’organizzazione?

L’intelligenza artificiale vocale è ancora in evoluzione. Nel momento in cui un’azienda pilota una tecnologia di intelligenza artificiale, ne arriva una nuova e migliore. Dal momento che AudioCodes integra costantemente le nuove soluzioni di intelligenza artificiale vocale, ciò consente all’azienda di mescolare e abbinare e di proteggere il proprio ambiente per il futuro. L’orchestrazione di AudioCodes consente loro di provare diversi bot per diversi scopi, tenendo conto delle prestazioni, dei costi, della lingua e della conformità. Ciò aumenta le possibilità di un passaggio di successo alla produzione.

Altre considerazioni sull’orchestrazione della produzione sono relative alla scalabilità, alla continuità aziendale e alla connessione a più ambienti di contact center in tutto il mondo.

Nelle implementazioni reali, cosa assomiglia a un’esperienza di chiamata alimentata da intelligenza artificiale di successo dal punto di vista dell’utente finale, e quanto siamo vicini a raggiungere interazioni simili a quelle umane su larga scala?

Abbiamo diversi clienti molto grandi che hanno iniziato con noi intorno al 2020 e 2021. Sono la prova che le interazioni simili a quelle umane su larga scala funzionano già bene. I casi d’uso reali includono attività di customer-facing come il routing delle chiamate, la pianificazione degli appuntamenti e il trasferimento di denaro, nonché strumenti di agent-facing come la riassunto delle chiamate di intelligenza artificiale, la guida della conoscenza in tempo reale e la traduzione vocale live.

Per l’utente finale, un’esperienza di chiamata alimentata da intelligenza artificiale sembra priva di attrito. Invece di navigare alberi di menu rigidi (premere 1 per questo, premere 2 per quello), i chiamanti possono parlare naturalmente con le proprie parole attraverso sistemi di risposta vocale interattiva (IVR) conversazionali che comprendono l’intento e rispondono di conseguenza. Ciò crea un’interazione più intuitiva e più efficiente fin dal primo punto di contatto.

Sebbene l’industria non sia ancora a interazioni complesse simili a quelle umane su larga scala, queste capacità stanno portando le aziende notevolmente più vicine. Mescolando l’intelligenza artificiale e l’automazione con il supporto umano, le aziende possono offrire esperienze più accurate e più personalizzate.

L’intelligenza artificiale vocale dipende dal riconoscimento vocale, dalla comprensione del linguaggio naturale e dall’elaborazione in tempo reale. Dove vede le maggiori bottiglie oggi, e come vengono affrontate?

Un grande collo di bottiglia aziendale nell’adozione dell’intelligenza artificiale vocale si collega all’integrazione. Secondo un rapporto recente di Opus Research solo il 38% delle aziende afferma che il costo è un ostacolo all’adozione dell’intelligenza artificiale vocale. Tuttavia, il 65% afferma che l’integrazione all’interno dei sistemi esistenti e il 60% afferma che la complessità dell’integrazione.

I fornitori di CCaaS stanno aumentando sempre più le barriere per un modello di porta-il-tuo-bot bloccando le integrazioni o rendendole finanziariamente non sostenibili. I sistemi più vecchi semplicemente non hanno integrazioni API aggiornate. Soluzioni come Voice AI Connect di AudioCodes si connette ai ambienti di contact center esistenti tramite SIP standard e ha integrazioni API con oltre 30 framework di bot di intelligenza artificiale vocale e oltre 20 motori di trascrizione vocale e sintesi vocale, eliminando la necessità di scrivere manualmente queste API.

Lo stesso rapporto evidenzia la qualità generale delle prestazioni (qualità della voce, flusso della conversazione, ecc.) come il motivo più grande (72%) che ha rallentato l’adozione. Ciò che Voice AI Connect consente è la possibilità di mescolare e abbinare framework di bot, STT e TTS per ottimizzare le implementazioni, poiché non ogni AI si adatta a ogni caso d’uso e variazioni sono necessarie anche per gergo e lingue. Inoltre, l’industria dell’intelligenza artificiale sta evolvendo rapidamente, richiedendo un facile passaggio a un nuovo fornitore di intelligenza artificiale man mano che la tecnologia migliora.

L’integrazione dovrebbe essere a bassa latenza, conveniente e facile da distribuire. Dovrebbe anche migliorare la sicurezza e il debugging, garantire la continuità aziendale e offrire un’opzione on-premises.

AudioCodes promuove un approccio flessibile che collega più fornitori di intelligenza artificiale e di parlato. Quanto è importante la flessibilità del fornitore quando si costruiscono sistemi di intelligenza artificiale vocale resilienti e a prova di futuro?

La flessibilità del fornitore è critica perché le aziende raramente operano in un ambiente a fornitore singolo, e ci sono molte soluzioni di intelligenza artificiale, parlato, telefonia e comunicazioni diverse sul mercato. Per creare una strategia di intelligenza artificiale vocale veramente unificata, le organizzazioni devono essere in grado di combinare queste diverse soluzioni e garantire l’interoperabilità tra tutte loro, ottimizzando i costi, la latenza, le prestazioni dei casi d’uso, il supporto linguistico e il gergo.

Un approccio flessibile consente alle aziende di integrarsi con più fornitori, scegliere le tecnologie giuste per diversi casi d’uso e adattarsi man mano che il mercato evolve.

Nelle industrie regolamentate come finanza o sanità, come differisce la raccolta e l’analisi dei dati di interazione vocale rispetto ai flussi di lavoro di intelligenza artificiale basati su cloud tipici?

La gestione dei dati vocali è governata da rigorosi requisiti di privacy e conformità che limitano notevolmente l’uso di strumenti di intelligenza artificiale basati su cloud. Per gestire questo, molte organizzazioni regolamentate adottano distribuzioni on-premises per garantire che i dati sensibili rimangano all’interno di ambienti controllati e non lascino mai la loro infrastruttura.

Gli standard di conformità richiedono anche che le interazioni vocali vengano registrate e archiviate in formati specifici per anni, con trascrizioni verbatim estremamente accurate strutturate per l’auditabilità. Ad esempio, nel settore finanziario, una società di trading deve archiviare ogni registrazione di chiamata e trascrizione esattamente come parlata per gli audit regolamentari – i dati non possono essere alterati o riassunti. Nel settore sanitario, un fornitore di servizi sanitari che gestisce le chiamate dei pazienti deve mantenere registrazioni e trascrizioni completamente sicure e conformi alla normativa HIPAA. In generale, i dati spesso devono essere elaborati on-premises per evitare di esporre informazioni protette a servizi cloud esterni.

Man mano che le aziende iniziano a distribuire agenti di intelligenza artificiale che possono agire invece di semplicemente rispondere, come cambia il ruolo delle interfacce vocali nel servizio clienti e nelle operazioni interne?

Le interfacce vocali stanno evolvendo da strumenti passivi a sistemi intelligenti e proattivi che possono analizzare e agire in tempo reale. Piuttosto che semplicemente registrare o instradare le conversazioni, i sistemi di intelligenza artificiale vocale alimentati da intelligenza artificiale possono ora comprendere l’intento e agire immediatamente, come risolvere problemi dei clienti, attivare processi backend o aiutare un dipendente a risolvere un problema IT. Questo cambio di paradigma è particolarmente potente perché la voce è spesso il primo e più naturale punto di contatto.

Gli agenti di intelligenza artificiale possono ora contattare proattivamente un supervisore umano – ad esempio, per approvare uno sconto per un cliente. Possono anche agire direttamente, come aggiungere articoli al carrello web di un cliente. E possono collaborare con altri bot che hanno competenze specializzate, come analizzare le foto condivise dai clienti per comprendere meglio il contesto. Ognuno di questi rappresenta un livello di sofisticazione che semplicemente non esisteva prima.

Guardando avanti, vede la voce come un’interfaccia primaria per i sistemi di intelligenza artificiale aziendale, o rimarrà parte di un’esperienza multimodale più ampia?

Posso usare un esempio personale per sottolineare il mio punto. Ho due figli adolescenti. Preferirebbero non interagire con un rappresentante del servizio clienti umano, se possibile. Tuttavia, preferirebbero parlare con un bot piuttosto che scrivergli. La voce è stata il mezzo di comunicazione naturale per gli esseri umani per milioni di anni. È preferita rispetto a una tastiera o a un mouse, almeno fino a quando la lettura della mente non diventerà realtà.

Grazie per la grande intervista, i lettori che desiderano saperne di più possono visitare AudioCodes.

Antoine Tardif, Amministratore Delegato e Fondatore di Unite.AI

Antoine è un leader visionario e socio fondatore di Unite.AI, guidato da una passione incrollabile per plasmare e promuovere il futuro dell'AI e della robotica. Un imprenditore seriale, crede che l'AI sarà altrettanto rivoluzionario per la società quanto l'elettricità, e spesso si lascia trasportare dall'entusiasmo per il potenziale delle tecnologie innovative e dell'AGI.

Come futurista, è dedicato a esplorare come queste innovazioni plasmeranno il nostro mondo. Inoltre, è il fondatore di Securities.io, una piattaforma focalizzata sugli investimenti in tecnologie all'avanguardia che stanno ridefinendo il futuro e riplasmando interi settori.

Unite.AI

Sharone Ben-Levi, VP di Vendite e Sviluppo Aziendale Globale, Contact Center, AudioCodes – Serie di Interviste

You may like