Интервью

Шарон Бен-Леви, Вице-президент по глобальным продажам и бизнес-развитию, Contact Center, AudioCodes – Интервью

mm

Шарон Бен-Леви, Вице-президент по глобальным продажам и бизнес-развитию, Contact Center, AudioCodes, является опытным руководителем в области коммуникационных технологий с более чем 25-летним опытом работы в области продаж, маркетинга, бизнес-развития и инноваций в сфере контакт-центров. На протяжении своей карьеры, включая более двух десятилетий работы в AudioCodes, он занимал ряд руководящих должностей, ориентированных на стимулирование роста в области корпоративных коммуникаций, решений для улучшения опыта клиентов и технологий контакт-центров, основанных на искусственном интеллекте. До прихода в AudioCodes он работал в компании NICE Systems, где приобрел ценный опыт в области взаимодействия с клиентами и корпоративного программного обеспечения. На протяжении всей своей карьеры Бен-Леви сосредоточился на помощи организациям в модернизации взаимодействия с клиентами посредством облачных коммуникаций, автоматизации и разговорного ИИ, что сделало его признанным экспертом в области эволюции технологий контакт-центров.

AudioCodes – это компания, специализирующаяся на коммуникационных технологиях, в частности, на корпоративной голосовой связи, контакт-центрах и решениях для улучшения опыта клиентов на основе ИИ. Основанная в 1993 году, компания эволюционировала от поставщика голосовых сетей и инфраструктуры VoIP в лидера в области интеллектуальных голосовых коммуникаций, помогая организациям модернизировать взаимодействие с клиентами и сотрудниками в облачных, гибридных и локальных средах. В ее портфолио входят платформы голосового ИИ, решения для разговорного ИИ, контроллеры сеансов, интеграции голоса Microsoft Teams, предложения CPaaS и инструменты для модернизации контакт-центров. С помощью платформ, таких как VoiceAI Connect и Live Hub, AudioCodes позволяет предприятиям развертывать голосовых ботов, агентов ИИ, возможности помощи агентам, решения для разговорного ИВР и услуги реального времени, интегрируя их с существующей телефонной и контакт-центровой инфраструктурой. Ее технологии используются предприятиями и провайдерами услуг во всем мире для улучшения опыта клиентов, автоматизации рабочих процессов и поддержки инициатив цифровой трансформации.

Вы провели более двух десятилетий в AudioCodes, эволюционируя от инженерии встроенных систем к руководству приложениями для повышения производительности. Как это путешествие сформировало ваше представление о том, что необходимо для обеспечения надежности голосового ИИ в корпоративных средах?

Я видел корпоративные коммуникации с разных сторон, и это путешествие укрепило одно основное урок: надежность должна быть встроена в каждый слой системы с самого начала.

Работа над встроенными системами научила меня, что дьявол кроется в деталях, небольшие технические решения имеют непропорциональное влияние в производственных средах. Задержка, качество аудио, точность транскрипции, естественная передача и каждый другой элемент должны быть спроектированы с учетом надежности, поскольку если любой из них выйдет из строя, вся система выйдет из строя. Вы не можете утверждать, что система голосового ИИ работает, если она работает только в идеальных условиях.

Переход на руководящую должность сделал это еще яснее. Предприятия поддерживают тысячи пользователей в сложных инфраструктурах с жесткими требованиями к времени безотказной работы. Система, которая работает хорошо в пилотном проекте, но ухудшается под реальной нагрузкой, не решила проблему.

Это в конечном итоге то, чему моя карьера меня научила: планка для голосового ИИ в корпоративной среде – это доверие. И доверие строится только тогда, когда организации могут полагаться на систему, чтобы она работала надежно enough, чтобы стать частью их критических бизнес-процессов.

Многие организации экспериментировали с чат-ботами, но голос вводит другой уровень сложности. Каковы самые большие технические проблемы при переходе от текстовых ИИ к полностью разговорным голосовым системам?

Самой большой проблемой является сложность корпоративных голосовых сред, которые часто фрагментированы в отдельные “острова”, требующие посредничества между протоколами телефонии SIP и API ИИ на основе HTTP/SSE. Это даже сводится к людям. Очень немногие инженеры знают и SIP, и HTTP/SSE. Кроме того, в отличие от текстовых систем, голос требует обработки и оркестровки в реальном времени, включая преобразование между разными протоколами, чтобы эти системы могли общаться без проблем. Эта добавленная срочность и взаимодействие делают предоставление плавного, разговорного опыта значительно более требовательным с технологической точки зрения. Задержка, фоновый шум, акцент и перекрестная связь теперь брошены в смесь. Эти переменные не существовали с текстом.

AudioCodes фокусируется на мостах между традиционными системами телефонии и современными платформами ИИ. Можете ли вы объяснить, как решения, такие как VoiceAI Connect, интегрируют наследственную инфраструктуру с передовыми моделями ИИ?

VoiceAI Connect – это мост, который напрямую связывает традиционные точки контакта с клиентами (номера телефонов, SIP-шлюзы и телефония контакт-центра) с платформами разговорного ИИ третьих сторон, такими как Google CX Agent Studio, Amazon Lex, Microsoft Copilot и более 30 других. Он обрабатывает сложную оркестровку голоса в реальном времени, включая речь в текст и текст в речь, а также маршрутизацию фреймворка ботов, что позволяет предприятиям смешивать и сочетать и легко голосовать свои выбранные боты ИИ без отказа от своих наследственных телефонных настроек. Наследственные платформы обычно не имеют API-интеграций от своих серверов мультимедиа до новых предложений ИИ. Мы обходим это, подключаясь к ним через их интерфейсы телефонии SIP и подключаясь к современным интерфейсам ИИ.

Предприятия часто сталкиваются с трудностями при переходе за пределы пилотных проектов. Каковы ключевые архитектурные или эксплуатационные барьеры, которые препятствуют масштабированию голосового ИИ во всем предприятии?

Голосовой ИИ все еще меняется. К моменту, когда предприятие протестирует одну технологию ИИ, появляется новая и лучшая. Поскольку AudioCodes постоянно интегрируется с новейшими решениями голосового ИИ, это позволяет предприятиям смешивать и сочетать и легко будущее свою среду. Оркестровка AudioCodes позволяет им пробовать разные боты для разных целей, учитывая производительность, стоимость, язык и соблюдение требований. Это увеличивает шансы на успешный переход в производство.

Другие соображения по оркестровке в производстве связаны с масштабируемостью, бизнес-континуитетом и подключением к нескольким средам контакт-центра по всему миру.

В реальных развертываниях, какой выглядит успешный опыт голосового взаимодействия с ИИ с точки зрения конечного пользователя, и насколько близко мы находимся к достижению человеческих взаимодействий в масштабе?

У нас есть несколько очень крупных клиентов, которые начали работать с нами около 2020 и 2021 годов. Они являются доказательством того, что человеческие взаимодействия в масштабе уже работают хорошо. Реальные примеры использования включают задачи, ориентированные на клиентов, такие как управление вызовами, планирование встреч и перевод денег, а также инструменты, ориентированные на агентов, такие как суммирование вызовов ИИ, руководство знаниями в реальном времени и живой перевод голоса.

Для конечного пользователя опыт голосового взаимодействия с ИИ кажется бесшовным. Вместо навигации по жестким меню (нажмите 1 для этого, нажмите 2 для того), звонящие могут естественно говорить на своих собственных словах через системы разговорного ИВР (Интерактивная голосовая реакция), которые понимают намерение и реагируют соответствующим образом. Это создает более интуитивный и эффективный взаимодействие с самого первого контакта.

Хотя отрасль еще не достигла полностью человеческих сложных взаимодействий в масштабе, эти возможности приближают предприятия значительно. Объединяя ИИ и автоматизацию с поддержкой человека, предприятия могут предоставлять более точные и персонализированные trải nghiệm.

Голосовой ИИ зависит от распознавания речи, понимания естественного языка и обработки в реальном времени. Где вы видите самые большие瓶кеобразные проблемы сегодня, и как они решаются?

Большой корпоративный барьер для внедрения голосового ИИ восходит к интеграции. Согласно недавнему отчету Opus Research только 38% предприятий говорят, что стоимость является барьером для внедрения голосового ИИ. Однако 65% говорят, что интеграция в существующие системы и 60% говорят, что сложность интеграции.

Поставщики CCaaS все чаще создают барьеры для модели “принеси своего бота”, блокируя интеграции или делая их финансово невыгодными. Старые системы просто не имеют обновленных API-интеграций. Решения, такие как Voice AI Connect от AudioCodes, подключаются к существующим средам контакт-центра через стандартный SIP и имеют API-интеграции с более чем 30 фреймворками ботов голосового ИИ и более 20 движками распознавания речи и синтеза речи, устраняя необходимость писать эти API вручную.

Тот же отчет подчеркивает общее качество производительности (качество голоса, поток разговора и т. д.) как основную причину (72%), которая замедляет внедрение. То, что позволяет Voice AI Connect, – это возможность смешивать и сочетать фреймворки ботов, движки распознавания речи и синтеза речи для оптимизации реализации, поскольку не каждый ИИ подходит для каждого случая использования, и вариации также необходимы для жаргона и языков. Кроме того, отрасль ИИ быстро развивается, требуя легкого перехода на нового поставщика ИИ, поскольку технология улучшается.

Интеграция должна быть низкозадержной, доступной и бесшовной для развертывания. Она также должна улучшать безопасность и отладку, обеспечивать бизнес-континуитет и предлагать вариант на месте.

AudioCodes продвигает гибкий подход, который соединяет несколько поставщиков ИИ и речи. Насколько важно гибкость поставщика при построении устойчивых и будущих систем голосового ИИ?

Гибкость поставщика имеет решающее значение, поскольку предприятия редко работают в среде с одним поставщиком, и существует множество разных решений ИИ, речи, телефонии и коммуникаций на рынке. Чтобы создать действительно унифицированную стратегию голосового ИИ, организации должны быть в состоянии объединить эти разные решения и обеспечить взаимодействие между всеми ними, оптимизируя стоимость, задержку, производительность, языковую поддержку и жаргон.

Гибкий подход позволяет предприятиям интегрироваться с несколькими поставщиками, выбирать правильные технологии для разных случаев использования и адаптироваться, как рынок развивается.

В регулируемых отраслях, таких как финансы или здравоохранение, как сбор и анализ данных голосовых взаимодействий отличаются от типичных облачных рабочих процессов ИИ?

Обработка голосовых данных регулируется строгими требованиями конфиденциальности и соблюдения, которые значительно ограничивают использование облачных инструментов ИИ. Чтобы управлять этим, многие регулируемые организации принимают развертывания на месте, чтобы обеспечить, что чувствительные данные остаются в контролируемых средах и никогда не покидают их инфраструктуру.

Стандарты соблюдения также требуют, чтобы голосовые взаимодействия записывались и хранились в определенных форматах в течение лет, с высокоточными, дословными транскриптами, структурированными для аудитности. Например, в финансах торговая фирма должна хранить каждую записанную звонок и транскрипт точно так, как они были произнесены для регулирующих аудитов – данные не могут быть изменены или суммированы. В здравоохранении поставщик, обрабатывающий звонки пациентов, должен хранить записи и транскрипты полностью безопасно и в соответствии с HIPAA. Во всем диапазоне данных часто необходимо обрабатывать на месте, чтобы предотвратить раскрытие защищенной информации внешним облачным службам.

Когда предприятия начинают развертывать агентов ИИ, которые могут выполнять действия, а не просто реагировать, как это меняет роль голосовых интерфейсов в обслуживании клиентов и внутренних операциях?

Голосовые интерфейсы эволюционируют от пассивных инструментов в активные, интеллектуальные системы, которые могут анализировать и действовать в реальном времени. Вместо того, чтобы просто записывать или маршрутизировать разговоры, системы голосового ИИ могут теперь понимать намерение и принимать немедленные действия, такие как решение проблем клиентов, запуск задних процессов или помощь сотруднику в решении проблемы ИТ. Этот сдвиг особенно мощный, поскольку голос часто является первым и наиболее естественным пунктом контакта.

Агенты ИИ могут теперь активно обращаться к человеческому руководителю – например, для утверждения скидки для клиента. Они также могут выполнять прямые действия, такие как добавление предметов в корзину клиента. И они могут сотрудничать с другими ботами, имеющими специализированные навыки, такие как анализ фотографий, поделенных клиентами, для лучшего понимания контекста. Каждый из этих представляет уровень сложности, который просто не существовал раньше. 

Глядя вперед, видите ли вы голос как основной интерфейс для корпоративных систем ИИ или он останется частью более широкого многомодального опыта?

Дайте мне использовать личный пример, чтобы сделать мою точку зрения ясной. У меня есть двое подростков. Они предпочли бы не взаимодействовать с человеческим представителем обслуживания клиентов, если это возможно. Однако они предпочли бы говорить с ботом, чем писать с ним. Голос был естественным средством общения для людей миллионы лет. Он предпочитается над клавиатурой или мышью, по крайней мере, до тех пор, пока чтение мыслей не станет реальностью.

Спасибо за отличное интервью, читатели, которые хотят узнать больше, должны посетить AudioCodes.

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлеченно рассказывает о потенциале разрушительных технологий и ИИ.

Как футуролог, он посвящает себя изучению того, как эти инновации будут формировать наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.