Connect with us

Alex Levin, Regal์˜ ๊ณต๋™ ์ฐฝ๋ฆฝ์ž ๋ฐ CEO – ์ธํ„ฐ๋ทฐ ์‹œ๋ฆฌ์ฆˆ

์ธํ„ฐ๋ทฐ

Alex Levin, Regal์˜ ๊ณต๋™ ์ฐฝ๋ฆฝ์ž ๋ฐ CEO – ์ธํ„ฐ๋ทฐ ์‹œ๋ฆฌ์ฆˆ

mm

Alex Levin은 Regal의 공동 창립자 및 CEO로, 기업들이 규제 준수 및 AI 기반 고객 대화로 통해 수익을 창출하도록 도와주는 음성 AI 플랫폼입니다. Regal을 2020년에 창립하기 전에, 그는 Handy, Thomson Reuters, 및 다른 스타트업에서 성장 및 제품 팀을 이끌었습니다. 하버드 대학을 졸업하고 Forbes Technology Council의 회원인 Alex는 혁신과 기업급 가드레일을 결합한 확장 가능한 음성 우선 인프라를 구축하는 데 중점을 두고 있습니다.

Regal은 판매, 지원, 예약, 수금을 위한 AI 음성 에이전트를 제공하며, 자연스럽게 들리고 CRM 시스템과 통합되며 대규모로 수백만 개의 대화를 처리하도록 설계되었습니다. 이 플랫폼은 노코드 빌더, 실시간 분석, A/B 테스트, 및 규제 산업에서 규정 준수를 위한 내장된 규정 준수 기능을 제공합니다.

Angi와 Handy의 리더십 역할에서 Regal을 창립하기로 결정한 것은 무엇인가? 그리고 연락처 센터 경험을 완전히 재건해야 한다는 것을 깨달은 특정한 순간이 있었는가?

Angi/Handy에서 우리는 고객과 신뢰를 구축하는 데 음성의 힘을 보았습니다. 고객들은 중요한 문제가 있을 때 전화하고 싶어했으며, 전화로 서비스를 받은 고객은 더 높은 수명 가치를 가지고 있었으며, 고객에게 전화했을 때 다른 채널보다 훨씬 더 높은 속도로 응답했습니다. 그러나 연락처 센터 소프트웨어 벤더들은 고객에게 적합한 것보다 “회피”와 “자동화”에 집중했습니다. 결과는 고객을 불필요하게 처벌하는 전화 번호를 숨기는 끝없는 게임이었습니다.

나는 강력하게 믿었기 때문에 나와 공동 창립자는 음성을 가장 효과적인 채널로 만들 수 있다고 생각했습니다. 나는 Regal을 가지고 있었다면 큰 연락처 센터를 운영하는 데 도움이 되었을 것입니다.

Regal을 2020년에 출시했습니다. 생성적 AI 붐 직전에 어떻게 음성 AI가 기술적으로 실현 가능하다고 평가했으며, 조기行動에 대한 확신은 무엇입니까?

우리는 2020년 이전에 이미 음성이 가장 중요한 채널이라고 확信했습니다. 그리고 2020년에 우리는 오케스트레이션, A/B 테스트, 개인화 도구를 구축하여 음성을 채널로 운영하는 비용을 낮추고 관리를 간소화할 수 있다고 생각했습니다. 따라서 우리는 처음에 연락처 센터에 대한 도구를 판매했습니다. 그 제품은 매우 빠르게 성장했습니다.

그러나 당신의 지적처럼, 회사를 시작하는 것은 믿음의 도약입니다. 실제로 우리는 인간 에이전트의 제한을 넘어갈 수 있는 방법을 보지 못했습니다. 그것은 2022년 말에 ChatGPT가 출시될 때까지였습니다. 그리고 2023년 말까지 우리는 고객이 대화하고 싶어할 음성 에이전트를 위한 데모를 만들 수 있었습니다.

자연스러운 대화에서 인간의 성능을 따라가거나 초과하는 음성 에이전트를 훈련하는 데 가장 어려운 기술적인 도전은 무엇입니까?

훌륭한 기술적인 도전이 많습니다. 500ms 이내의 지연 시간을 보장하는 것부터, AI 에이전트가 회사 지식 베이스와 고객 데이터를 실시간으로 모두 가지고 있는지 확인하는 것까지, 호출 중 및 이후에 AI 에이전트가 행동을 취할 수 있도록 하는 것까지, 가디언 또는 안전 기능, 및 에이전트 상호작용이 인간처럼 느껴지도록 하는 것까지입니다.

제가 가장 좋아하는 프로젝트 중 하나는 자동 평가를 개선하여 AI 에이전트를 프로덕션에 넣기 전에 더 쉽게 테스트할 수 있도록 하는 것입니다. 이것은 현재마다 발생하는 수백 시간의 수동 QA를 제거할 것입니다.

우리는 먼저 수백 개의 다양한 시뮬레이션 고객 대화를 생성해야 합니다(사용 AI). 그런 다음 AI 에이전트가 그것들을 거치고, AI 감독이 QA를 수행하고, AI 에이전트 또는 회사의 정책 및 지식 베이스에 대한 제안된 개선을 반환합니다. 우리는 현재 작동하는 평가 제품을 가지고 있으며, 고객의 피드백은 훌륭했습니다. 그리고 그것은 놀라운 속도로 개선되고 있습니다.

이것은 AI 에이전트당 관리자 수의 새로운 지표에 중요합니다. 곧 매우 적은 수의 관리자가 수백 개의 다른 AI 에이전트를 관리할 수 있을 것입니다.

Regal은 실시간으로 대화를 개인화하기 위해 기계 학습을 어떻게 활용합니까? 고객 기록, 음调, 의도 인식, 또는 조합입니까?

우리는 시장의 다른 회사보다 개인화를 깊이 투자했습니다. 왜냐하면 우리는 1백만 명의 고객을 1명씩 테스트하는 것을 믿기 때문입니다. 현재 사용되는 일반적인 인간 에이전트 처리를 재창조하는 것이 아닙니다.

우리는 모든 CRM 데이터, 이벤트 데이터, 대화 기록을 연결하는 통합 고객 프로필을 구축하기 시작했습니다. 에이전트를 구축할 때, 회사는 AI 에이전트에게 모든 고객 정보 또는 특정 대화에 필요한 특정 데이터 포인트에 대한 액세스를 제공할 수 있습니다. LLM은 사용 가능한 데이터를 사용하여 인간 같은 대화 응답을 제공합니다.

LLM은 여전히 제한적이므로 다른 도구를 활용할 수 있는 기능이 필요했습니다. 예를 들어, 3차_party 데이터 서비스, 사용자 정의 애플리케이션, ML 등입니다. 따라서 우리는 AI 에이전트 프롬프트에서 다른 서비스를 활용할 수 있는 “사용자 정의 동작”을 구축했습니다.

Regal의 시스템은 고객이 라이브 호출에서 기대하는 응답성 또는 자연스러운 카덴스를 희생하지 않고 회수-증강 생성(RAG)을 어떻게 사용합니까?

RAG는 우리에게 차별화된 영역입니다. 음성 AI 에이전트에게는 채팅이나 다른 디지털 채널의 AI 에이전트보다 더 빠른 회수가 필요했습니다. 몇 초의 죽은 공기는 호출을 완전히 망칠 것입니다.

우리는 회수를 더 빠르게 하였으며, 회수가 더 오래 걸리면 AI 에이전트가 고객에게 더 오래 걸릴 수 있다고 알려줄 수 있습니다.

Regal의 에이전트는 실제 투자자의 음성 포함 실제 인간의 음성을 모델링합니다. 이러한 높은 신뢰도 복제를 구축하는 데 기술적 및 윤리적으로 무엇이 필요합니까?

실제 전문 음성 배우나 친구와 같은 음성을 “클론”하는 것은 기술적으로 놀라울 정도로 쉽습니다. 높은 품질의 오디오 5-10분이면 충분합니다.

예를 들어, 최근에 죽어가는 가족 구성원으로부터 음성을 클론하여 더 молод한 세대가 나중에 경험할 수 있도록 요청받았습니다. 따라서 조금의 지침으로, 그들은 죽어가는 할아버지의 음성을 지금 녹음할 것입니다.

두 번째로, 할아버지는 이에 동의하고, 전문 음성 배우나 우리의 투자자도 동의합니다. 음성 클론을 허가하지 않는 나쁜 행위자(마지막 대통령 선거에서 발생한 것과 같은)는 폐쇄되어야 합니다.

조언입니다 – 음성 클론(또는 공중 인물이 나쁜 행위자에 의해 클론될 수 있는 경우)을 허용하는 경우, 가족만이 알고 있는 안전한 단어가 있도록 하십시오. 그래서 그들은 호출에서 실제 것을 식별할 수 있습니다.

CRM, 결제 시스템, 내부 API에 Regal을 통합하는 데 어떤 어려운 통합 도전을 해결해야 했습니까?

Salesforce와 같은 CRM 및 NICE와 같은 연락처 센터 소프트웨어와 같은 주요 제품과 통합하는 것은 간단합니다. 가장 어려운 것은 브랜드가 AI 에이전트가 취할 수 있는 모든 행동에 대한 API를 사용할 수 있도록 하는 것입니다. 인간 에이전트는 호텔 방을 예약하기 위해 버튼을 클릭할 수 있지만, AI 에이전트는 실제로 예약 API가 필요합니다.

모델의 성능을 시간이 지남에 따라 측정하고 개선하는 데 어떻게 접근합니까? 이 과정에서 감독된 미세 조정 또는 강화 학습의 역할은 무엇입니까?

우리는 처음부터 A/B 테스트 스위트를 구축했으므로 고객이 AI 에이전트와 인간 에이전트 또는 에이전트의 LLM 버전 1과 버전 2를 테스트하는 것이 매우 쉽습니다. 이것은 다른 모델에 대한 결과의 차이를 명확하게 볼 수 있는 방법을 제공합니다.

그러나 우리는 현재 강화 학습을 사용하지 않습니다. 왜냐하면 법률 팀이 불편해하기 때문입니다(의도하지 않은 변경이 발생할 수 있는 상황을 원하지 않습니다). 나는 법률 팀이 우리의 사용 사례에서 강화 학습을 허용하기까지 13개월이 걸릴 것으로 생각합니다. 대신에, 오늘날 우리는 인간 관리자가 수락할 수 있는 변경 사항을 제안하는 데 중점을 두고 있습니다. 이것은 프롬프트, 지식 베이스, LLM 미세 조정 등에 대한 변경 사항일 수 있습니다.

VC 또는 VC의 음성 클론과 대화하는 것은 대담한 개념입니다. AI 고문을 창립자에게 사용할 수 있도록 하는 의도는 무엇입니까? 그리고 오늘날 어떻게 사용되고 있습니까?

우리는 훌륭한 투자자들에게 접근할 수 있는幸運을 가지고 있으며, 이 프로젝트로 보답하고 싶었습니다. 나는 Satya AI와 대화하는 것을 즐기고 있으며, 이 프로젝트는 우리의 RAG/지식 베이스 기능의 힘을 강조합니다. 우리는 даже 두 명의 투자자의 부모로부터도 승인을 받았습니다!

그러나 조언입니다 – 의사 결정은 고문에게 위임할 수 없습니다. 그리고 실행하는 더 어려운 부분 중 하나는 두 가지 나쁨 선택이나 두 가지 좋은 선택 사이에서 결정하는 것입니다.

투자자 에이전트는 일반적인 스타트업 지식, 또는 개별 VC와 관련된 회사 특정 조언 및 철학에 따라 훈련됩니까?

모든 AI 에이전트는 LLM 훈련에서 일부 일반적인 지식을 가지고 있습니다. 그러나 필요한 결과를 얻으려면, 우리는 투자자의 다작을 각 AI 에이전트의 지식 베이스에 업로드했습니다.

그 외에도 음성 클론닝과, 나는 투자자의 고유한 성격이나 본질을 포착할 수 있다고 생각합니다. 예를 들어, Jake Saper의 긍정성 또는 Alexa Von Tobel의 열정입니다.

앞으로 Regal의 AI가 어떻게 진화할 것이라고 생각합니까? 더 많은 자율적 의사 결정, 더 많은 감정 지능, 또는 심지어 멀티모달 지원을 볼 수 있을까요?

지난 1년 동안 가장 흥미로운 부분은 우리의 AI 에이전트가 인간 에이전트를 능가하는 것을 보는 것이었습니다. 나는 내년 동안, 기본 AI 모델의 개선과 Regal의 응용 프로그램 및 진보로 인해, 인간과 구별할 수 없을 정도로 AI 에이전트가 나타날 것으로 생각합니다. 그리고 더 중요한 것은, 인간 에이전트의 능력을 훨씬 초과할 것입니다. AI 에이전트를 활용하는 회사는 비용을 줄이고 고객 경험을 더 빠르게 개선할 것입니다.

이 훌륭한 인터뷰에 감사드립니다. 더 많은 정보를 원하는 독자는 Regal을 방문할 수 있습니다.

์•™ํˆฌ์•ˆ์€ Unite.AI์˜ ๋น„์ „์žˆ๋Š” ๋ฆฌ๋”์ด์ž ๊ณต๋™ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, AI์™€ ๋กœ๋ด‡๊ณตํ•™์˜ ๋ฏธ๋ž˜๋ฅผ ํ˜•์„ฑํ•˜๊ณ  ์ด‰์ง„ํ•˜๋Š” ๋ฐ ๋Œ€ํ•œ ๋ถˆ๋ณ€์˜ ์—ด์ •์— ์˜ํ•ด ์ถ”๋™๋ฉ๋‹ˆ๋‹ค. ์—ฐ์‡„์ ์ธ ๊ธฐ์—…๊ฐ€๋กœ์„œ, ๊ทธ๋Š” AI๊ฐ€ ์‚ฌํšŒ์— ๋Œ€ํ•œ ์ „๊ธฐ์™€ ๊ฐ™์€ ํŒŒ๊ดด๋ ฅ์„ ๊ฐ€์งˆ ๊ฒƒ์ด๋ผ๊ณ  ๋ฏฟ์œผ๋ฉฐ, ์ข…์ข… ํŒŒ๊ดด์ ์ธ ๊ธฐ์ˆ ๊ณผ AGI์˜ ์ž ์žฌ๋ ฅ์— ๋Œ€ํ•ด ์—ด๊ด‘ํ•ฉ๋‹ˆ๋‹ค.

ไฝœไธบ futurist, ๊ทธ๋Š” ์ด๋Ÿฌํ•œ ํ˜์‹ ์ด ์šฐ๋ฆฌ์˜ ์„ธ๊ณ„๋ฅผ ์–ด๋–ป๊ฒŒ ํ˜•์„ฑํ• ์ง€ ํƒ๊ตฌํ•˜๋Š” ๋ฐ ์ „๋…ํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ทธ๋Š” Securities.io์˜ ์ฐฝ๋ฆฝ์ž๋กœ์„œ, ๋ฏธ๋ž˜๋ฅผ ์žฌ์ •์˜ํ•˜๊ณ  ์ „์ฒด ๋ถ€๋ฌธ์„ ์žฌํ˜•์„ฑํ•˜๋Š” ์ตœ์ฒจ๋‹จ ๊ธฐ์ˆ ์— ํˆฌ์žํ•˜๋Š” ํ”Œ๋žซํผ์ž…๋‹ˆ๋‹ค.