Connect with us

Алекс Левин, сооснователь и генеральный директор Regal – Интервью

Интервью

Алекс Левин, сооснователь и генеральный директор Regal – Интервью

mm

Алекс Левин является сооснователем и генеральным директором Regal, платформы голосового ИИ, которая помогает предприятиям увеличить доход за счет соблюдения требований и разговоров с клиентами, основанных на ИИ. До основания Regal в 2020 году он возглавлял команды роста и продукта в Handy, Thomson Reuters и других стартапах. Выпускник Гарварда и член Совета технологий Forbes, Алекс фокусируется на построении масштабируемой, голосовой инфраструктуры, сочетающей инновации с корпоративными ограничениями.

Regal предоставляет голосовых агентов ИИ для продаж, поддержки, планирования и сбора платежей – разработанных для звучания естественно, интеграции с системами CRM и обработки миллионов разговоров в масштабе. Платформа включает в себя конструктор без кода, аналитику в реальном времени, тестирование А/Б и встроенную соблюдение требований для регулируемых отраслей, таких как здравоохранение, страхование и финансовые услуги.

Что вдохновило вас перейти из руководящих ролей в Angi и Handy на создание Regal, и был ли конкретный момент, когда вы и ваш сооснователь поняли, что опыт контакт-центра нужно полностью перестроить?

Пока мы были в Angi/Handy, мы увидели силу голоса для построения доверия с клиентами. Клиенты рассказали нам, что когда у них была важная проблема, они хотели позвонить, клиенты, которых мы обслуживали по телефону, имели более высокую ценность за всю жизнь и когда мы звонили клиентам, они отвечали с гораздо более высокой скоростью, чем по любому другому каналу. Однако поставщики программного обеспечения для контакт-центров были сосредоточены на “отвлечении” и “автоматизации” над тем, что было правильно для клиентов. В результате получилась бесконечная игра в прятки телефонного номера, которая необоснованно наказывала клиентов.

Мой сооснователь и я ушли, потому что мы твердо верили, что мы можем сделать голос наиболее эффективным каналом, снижая затраты и делая его проще в эксплуатации. Жаль, что у меня не было Regal, когда я управлял большим контакт-центром.

Вы запустили Regal в 2020 году, прямо перед бумом генеративного ИИ. Как вы оценили, является ли голосовой ИИ технически жизнеспособным, и что дало вам убежденность действовать рано?

Мы были убеждены задолго до 2020 года, что голос является наиболее важным каналом. А в 2020 году мы знали, что мы можем построить инструменты оркестровки, тестирования А/Б и персонализации, которые снизят затраты и упростят управление голосом как каналом – будь то человек, старый голосовой бот или что-то лучше на вершине сферы. Итак, мы продавали инструменты для контакт-центров, чтобы лучше управлять человеческими агентами в начале. Этот продукт вырос очень быстро.

Но, как вы отметили, создание компании – это прыжок веры, и потребовалось время, чтобы действительно увидеть, как мы можем выйти за пределы ограничений человеческих агентов. Это не было до запуска ChatGPT в конце 2022 года, что мы действительно увидели “ИИ”, который был достаточно хорош, чтобы вести разговор. И это не было до конца 2023 года, что мы смогли создать демонстрацию голосового агента, с которым клиент хотел бы поговорить.

Какими были некоторые из наиболее сложных технических проблем в обучении голосовых агентов, которые могли бы соответствовать или превосходить человеческие возможности в естественных разговорах?

Есть так много замечательных технических проблем, над которыми можно работать. От обеспечения задержки около 500 мс до определения того, как обеспечить, чтобы агенты ИИ имели все контекст знаний компании и данных клиентов в реальном времени, до того, чтобы агенты ИИ могли совершать действия во время и после звонков, до охранников или функций безопасности, и того, как сделать взаимодействие агента похожим на человеческое с чередованием и правильными вербальными сигналами.

Одним из моих любимых проектов, над которым работает наша команда сегодня, является улучшение автоматизированных оценок, чтобы ИИ-агент мог быть протестирован более легко перед тем, как его поставить в производство. Это исключит сотни часов ручного контроля качества, которые происходят постоянно сегодня для каждого изменения каждого ИИ-агента.

Мы должны сначала создать сотни разнообразных симулированных разговоров клиентов (используя ИИ), затем провести ИИ-агента через них, затем иметь ИИ-надзирателя, который проверяет их и возвращает предложенные улучшения ИИ-агенту или политике и знаниям компании. У нас есть рабочий продукт оценки, отзывы клиентов были отличными, и он улучшается с удивительной скоростью.

Это критически важно для новой метрики количества менеджеров на ИИ-агента. Вскоре очень немногие менеджеры смогут управлять сотнями разных ИИ-агентов.

Как Regal использует машинное обучение, чтобы персонализировать разговоры в реальном времени? Основано ли это на истории клиента, тоне, распознавании намерения или комбинации?

Мы глубоко инвестировали в персонализацию по сравнению с остальным рынком, потому что мы верим в помощь брендам тестировать миллионы клиентов, как один в миллионе. Не просто воссоздавая общий человеческий агент, который часто используется сегодня.

Мы начали с создания единого профиля клиента, который связывает все данные CRM, событийные данные и историю разговоров. При построении агента компании могут затем предоставить ИИ-агенту доступ ко всем данным о клиенте или только к конкретным данным, необходимым для конкретного разговора. Модель большого языка обеспечивает человеческий, разговорный ответ, используя доступные данные.

Модели большого языка все еще ограничены в том, что они делают хорошо, поэтому нам нужна возможность использовать другие инструменты, такие как сторонние сервисы данных, пользовательские приложения и машинное обучение. Итак, мы построили “Пользовательские действия”, которые можно использовать в запросе ИИ-агента, чтобы воспользоваться другими сервисами. Например, многие бренды имеют модели склонности, чтобы указать, какой продукт предложить клиенту дальше, и мы можем подключиться к ним, чтобы соответствовать разговору.

Как ваша система использует генерацию, дополненную извлечением (RAG), не жертвуя при этом отзывчивостью или естественным ритмом, который клиенты ожидают от живого звонка?

RAG – это область дифференциации для нас, поскольку она должна была быть быстрее для голосовых ИИ-агентов, чем для ИИ-агентов в чате или других цифровых каналов. Несколько секунд мертвого воздуха полностью испортили бы звонок.

Мы снизили задержку извлечения и обеспечили, чтобы если извлечение заняло больше времени, ИИ-агент мог продолжать разговор с клиентом, чтобы сообщить ему, что это займет больше времени.

Агенты Regal моделируются по образцу реальных человеческих голосов, включая голоса реальных инвесторов. Что для этого требуется – технически и этически – чтобы построить такие высококачественные реплики?

Технически удивительно легко “клонировать” голос, чтобы ИИ-агент звучал как профессиональный голосовой актер или друг. 5-10 минут высококачественного аудио – все, что нужно.

Например, меня最近 спросили, как сделать это для умирающего члена семьи, чтобы младшее поколение могло испытать его, когда они станут старше. Итак, с небольшим руководством, они собираются записать умирающего дедушку сейчас.

Что касается вашего второго пункта, дедушка согласен на это, и профессиональные голосовые актеры или наши инвесторы согласны на это. Плохие актеры, которые позволяют клонирование голоса без согласия (например, как это произошло во время последних президентских выборов), должны быть закрыты.

Совет – если вы разрешите голосовому клону (или вы публичная фигура, которую могут клонировать плохие актеры), убедитесь, что вы придумали безопасное слово, которое знает только ваша семья, чтобы они могли определить настоящего вас в звонке.

Вы подчеркиваете важность интеграции Regal в CRM, системы оплаты и внутренние API. Какими были некоторые из наиболее сложных проблем интеграции, которые вам пришлось решить?

Интеграция с крупными продуктами, такими как CRM от Salesforce до программного обеспечения для контакт-центров, таких как NICE, проста. Самый трудный вопрос – убедиться, что бренд предоставляет нам доступ к API для любого действия, которое может потребовать ИИ-агент. Человеческий агент может нажать кнопку, чтобы забронировать номер отеля. Но ИИ-агенту действительно нужен API для бронирования.

Как вы подходите к измерению и улучшению производительности модели с течением времени? Какую роль играет контролируемое тонкое настрой и обучение с подкреплением в этом процессе?

Мы построили набор тестирования А/Б с самого начала, поэтому для клиентов тривиально протестировать ИИ-агентов против человеческих агентов или агента с версией LLM 1 против версии 2. Это дает нам четкий способ увидеть вариации результатов для разных моделей.

Однако мы не используем обучение с подкреплением сегодня, поскольку это делает юридические команды неуютными (они не хотят ситуации, когда есть непреднамеренное изменение аромата). Я думаю, что мы находимся в 13 месяцах от того, чтобы юридические команды разрешили обучение с подкреплением в нашем случае. Вместо этого сегодня мы фокусируемся на предложении изменений, которые человеческий менеджер может принять. Это могут быть изменения в запросе, знаниях, тонкой настройке LLM и т. д.

Говорить с ВК – или голосовым клоном – смелая концепция. Какова была ваша цель в том, чтобы сделать этих ИИ-советников доступными основателям, и как они используются сегодня?

Мы были удачливы, что имели доступ к замечательным инвесторам, и мы хотели отдать долг этой проектом. Мне нравится говорить с Satya AI в любое время, и я слышал отличные отзывы от руководителей, которые использовали ИИ-ВК для всего, от совета, как создать дорожную карту продукта, до того, какую модель ценообразования использовать.

Нам нравится показывать, а не рассказывать, и этот проект действительно подчеркивает силу наших возможностей RAG/знаний. У нас даже было два родителей наших инвесторов, которые дали нам большой палец вверх!

Но слово мудрости – вы не можете делегировать принятие решений советникам, и одним из более трудных аспектов быть руководителем является принятие решения между двумя плохими вариантами или даже двумя, казалось бы, хорошими вариантами.

Полагаются ли эти агенты инвесторов на обобщенные знания стартапов или обучены на фирм-специфичном совете и философиях, связанных с индивидуальным ВК?

Все ИИ-агенты имеют некоторые общие знания из обучения LLM. Но чтобы получить результаты, которые нам нужны, мы загрузили обширные письменные работы инвесторов в соответствующие базы знаний ИИ-агентов.

За пределами этого и клонирования голоса я думаю, что мы также смогли захватить некоторые уникальные личности или сущность инвесторов, такие как позитивность Джейка Сапера или эбуллиентность Алексы Вон Тобель.

Оглядываясь вперед, как вы видите эволюцию ИИ Regal – увидим ли мы больше автономных решений, больше эмоционального интеллекта или даже многомодальную поддержку?

Самая интересная часть последнего года была увидеть, как наши ИИ-агенты работают лучше, чем человеческие агенты. Я думаю, что в течение следующего года улучшения в базовых моделях ИИ и достижения в применении Regal приведут к ИИ-агентам, которые неотличимы от людей, и что более важно, которые далеко превосходят человеческие возможности агентов. Компании, которые полагаются на ИИ-агентов, снизят свои затраты и улучшат опыт клиентов быстрее, чем кто-либо ожидал.

Спасибо за отличное интервью, читателям, которые хотят узнать больше, следует посетить Regal

Антуан - видный лидер и сооснователь Unite.AI, движимый непоколебимой страстью к формированию и продвижению будущего ИИ и робототехники. Как серийный предприниматель, он считает, что ИИ будет столь же разрушительным для общества, как электричество, и часто увлекается потенциалом разрушительных технологий и ИИ.

Как футуролог, он посвящен изучению того, как эти инновации изменят наш мир. Кроме того, он является основателем Securities.io, платформы, ориентированной на инвестиции в передовые технологии, которые переопределяют будущее и меняют целые сектора.