인터뷰
이사야 N. 그라넷, Bland의 공동 창립자 및 CEO – 인터뷰 시리즈

이사야 N. 그라넷, Bland의 공동 창립자 및 CEO는 기술적 실행과 초기 기업가 경험 및 사회적 영향 작업을 결합한 배경을 가진 스타트업 창립자이자 엔지니어입니다. 현재 벤처를 시작하기 전에, 그는 Z Fellows와 Y Combinator에 참여했으며, Lantern에서 엔지니어링 경험을 쌓았으며, San Diego Chill을 공동 창립하여 발달 장애가 있는 어린이들이 스포츠에 접근할 수 있도록 250만 달러 이상을 모금하여 전국적인 인정을 받았고, 현재 이사회에서 활동하고 있습니다.
Bland는 기업들이 고객 지원, 판매, 및 운영 워크플로우를 대규모로 처리할 수 있는 음성 에이전트를 구축할 수 있는 인프라를 구축하는 데 중점을 두고 있습니다. 이 플랫폼은 전통적인 콜 센터를 대체하거나 보완하기 위해 프로그래밍 가능한 음성 상호작용, 실시간 반응성, 및 비즈니스 시스템과의 깊은 통합을 제공함으로써 고객과의 자동화된 통신의 핵심 계층으로 자리 잡고 있습니다.
산디에고 칠을 청소년으로 창립하여 발달 장애가 있는 어린이들이 스포츠에 접근할 수 있도록 하기 전에, Y Combinator에 참여하거나 Bland를 창립하기 전에, 당신은 어떻게 그 경험을 통해 음성 우선 AI 회사인 Bland를 창립하게 되었나요?
내 인생과 일은 항상 무언가를 구축하는 데 중점을 두었습니다. 어린 시절부터 나는 항상 무언가를 창조하고 실행하고 싶었습니다. 한번 아이디어가 떠오르면, 그것을 무시할 수 없습니다. 산디에고 칠을 구축하는 것은 단지 조직을 창립하고 운영하는 방법을 배우는 것뿐만 아니라, 우리의 행동이 다른 사람에게 미치는 영향을 배우는 것이었습니다. 존재하지 않았던 조직을 창립하여 되돌아가는 것은 매우 보람있는 일입니다. 산디에고 칠에서 배운 교훈과 가치들은 매일 나와 함께 있습니다.
2023년에 YC를 거친 후, 기업 음성 인프라가 여전히 근본적으로 고장나서 레거시 IVR 도구 위에 LLM을 계층화하는 대신 종단 간 시스템을 구축하는 것을 정당화할 만큼 충분히 고장났다고 생각한 이유는 무엇입니까?
은행 채팅봇을 사용한 마지막 경험이 어떻게 되었는지 생각해 보십시오. 당신은 필요한 것보다 더 오래 기다렸을 것입니다. 그리고 당신이 실제로ถาม한 것에 대한 답변을 얻지 못했을 것입니다. 그리고 결국에는 전화했습니다. 그리고 로봇 음성이 당신을 원하지 않는 옵션 메뉴로 안내했을 것입니다. 그리고 0번을 누르면 아무런 소용이 없었습니다.
은행들은 그 경험을 가능하게 하기 위해 수십억을 투자했습니다. 그리고 채팅봇은 여전히 고객 만족도에서 29%로 가장 낮습니다. 이메일보다 낮습니다. 이미 불평하는 콜 센터보다도 낮습니다.
그것이 20년 동안의 역동이었습니다. 기업들은 고객이 직원과 통화하지 않도록 유지하려고 했습니다. 고객들은 사람과 통화하려고 했습니다. 어느 쪽도 승리하지 못했습니다.
문제는 기업들이 그것을 고칠 수 없다는 것입니다. 그들은 좋은 경험을 제공하기 위해 직원을 늘릴 수 없습니다. 월 100만 건의 통화를 처리하는 콜 센터는 비싼 운영입니다. 그리고 품질은 거의 정의에 따라 일관성이 없습니다.
변화는 AI가终于 호출을 해결할 수 있게 되었다는 것입니다. 호출을 라우팅하거나 방향을 틀지 않고, 에이전트가 고객이 요청하는 것을 이해하고 처리합니다.
그러나 그것은 시스템이 처음부터 실시간 음성으로 구축된 경우에만 가능합니다. 레거시 IVR 도구 위에 LLM을 계층화하거나 서드파티 서비스를 조합하면 지연이 발생하고 신뢰성이 떨어집니다. 대화가 중단됩니다.
그것이 우리가 종단 간 인프라를 구축하는 이유입니다. 음성은 즉각적이고 자연스러워야 합니다. 그렇지 않으면 고객은 전화를 끊습니다.
Bland는 내부적으로 자체 TTS, 추론, 및 전사 스택을 구축하고 호스팅하는 비정상적인 단계를 밟았습니다. 서드파티 API에 의존하는 것의 트레이드오프는 무엇이었나요?
아웃소싱하는 각 계층마다 지연과 위험이 추가됩니다.
대부분의 음성 AI 플랫폼은 재판매자입니다. 그들은 서드파티 전사를 사용하고, 서드파티 모델을 추가하고, 서드파티 TTS를 통해 결과를 전달합니다. 그것은 제어된 데모에서 작동할 수 있습니다. 그러나 호출량이 증가하거나 체인 중 하나가 잘못되면 거의 작동하지 않습니다.
또한 데이터 문제가 있습니다. 기본 모델 제공업체, 즉 OpenAI는 고객 데이터를 사용하여 모델을 훈련했습니다. 그들은 기업 라이선스는 다르다고 말합니다. 아마 그렇습니다. 그러나 그 불확실성은 많은 보안 및 규정 준수 팀을 불편하게 만듭니다.
전체 스택 — 전사, 추론, TTS, 오케스트레이션 —을 자체 호스팅하면 모든 밀리초와 모든 모델 업데이트를 제어할 수 있습니다. 고객 데이터는 고객의 에코시스템 내에 유지됩니다. 서드파티 훈련 파이프라인에 닿지 않으며, 감사할 수 없는 인프라를 통과하지 않으며, 고객이 결정할 때까지 이동하지 않습니다.
각 기업 고객에게 전용 인프라를 제공할 수 있으므로 다른 회사의 스파이크가 그들의 성능에 영향을 미치지 않습니다. 그리고何か가 잘못되면, 실제로 고칠 수 있습니다. 벤더의 벤더를 기다리지 않습니다.
규제 산업의 경우, 일부 고객은 전체 스택을 자체 VPC 또는 온프레미스에서 필요로 합니다. 그것은 벤더가 실제로 배포하는 것을 소유하고 있는 경우에만 가능합니다.
전통적인 연락 센터 자동화는 단순한 지원 호출을 방향으로 중점을 두었습니다. 왜 복잡한 고객 상호작용을优先으로 하였나요?
전통적인 연락 센터 자동화는 주로 단순한 지원 호출을 방향으로 중점을 두었습니다. 왜 복잡한 상호작용을优先으로 하였나요?
우리는 반대 접근 방식을 취했습니다. 만약 우리가 가장 복잡하고 민감한 호출을 надеж하게 처리할 수 있다면, 모든 것이 간단해집니다. 목표는 데모를 구축하는 것이 아니라, 규모에 따라 전체 에이전트 호출 해결을 제공하는 것입니다. 그것은 저지연, 고신뢰성 시스템이 실제 고객 대화에서 발생하는 에지 케이스를 관리할 수 있음을 요구합니다.
음성 에이전트가 CRM 및 운영 데이터베이스와 통합되어 호출을 종료하기 위해 어떻게 기업 워크플로우의 아키텍처를 변경합니까?
레거시 시스템은 종종 서로 통신하지 않습니다. CRM, 스케줄링 도구, 및 청구 플랫폼은 시洛화되어 있습니다. 이러한 시스템에 접근하지 못하면, 음성 에이전트는 일반적인 질문에 답변할 수 있지만, 그 이상은 할 수 없습니다.
계정 정보를 조회하거나, 기록을 업데이트하거나, 예약을 잡을 수 없습니다. 정보를 수집하여 넘깁니다. 인간 대표들은 호출 노트를 기록하거나, 수동으로 예약을 잡거나, 후속 조치를 위해 보고서를 가져오는 등의 사람이 할 필요가 없는 작업에 시간을 보냅니다.
깊은 통합은 종단 간 해결을 가능하게 합니다. 그것이 없으면, 당신은 호출을 자동화하지 못했습니다.
최근 Soulja Boy 음성 클론 데모는 대화 에이전트가 내부 운영을 넘어 브랜드를 대면하는 경험으로 확장할 수 있음을 강조했습니다. 기업 음성 에이전트가 고객 지원, 판매, 및 마케팅 채널에서 지속적으로 운영하는 고객을 대면하는 디지털 대표로 발전할 수 있나요?
绝对적으로. 우리는 고객이 좋아하는 비즈니스와 개인적인 관계를 맺을 수 있는 세상을 보습니다. 중요的是, AI는 단지 “재미”가 아니라, 실제로 고객의 가장 복잡한 문제를 해결할 수 있어야 합니다.
실시간 음성은 텍스트 기반 AI 배포에서 존재하지 않는 지연, 환각, 및 身分 문제를 도입합니다. 음성 에이전트를 구축할 때, 1초 미만으로 반응해야 하며, 대화 정확성을 유지해야 하는 가장 어려운 기술적 제약은 무엇입니까?
지연. 그것이 대부분의 데모가 죽는 곳입니다.
채팅봇이 3초 후에 반응하면, 사용자는 기다립니다. 음성 에이전트가 말끝을 잡고 나서 어색하게 멈추면, 대화는 이미 중단됩니다. 반응은 400밀리초 이내에 돌아와야 합니다. 대부분의 플랫폼은 여러 서드파티 서비스를 조합하여 지연을 추가하기 때문에, 그곳에 도달할 수 없습니다.
그러나 지연은 부분입니다. 실제 고객 호출은 데모에서 कभ도 포착하지 못하는 방식으로 지저분합니다. 사람들은 중간에 말을 끊습니다. 배경 소음이 끼어듭니다. 호출자는 언어를 전환합니다. 요청은 모호합니다. 생산에서 지탱하는 음성 AI는 중단 없이 문맥을 잃지 않고, 대화가 스크립트에서 벗어날 때 적응하며, 버퍼링하는 것처럼 들리지 않습니다.
고객들은 음성 AI를 다른 봇과 비교하지 않습니다. 사람과 대화하는 것과 비교합니다. 그것이 기준입니다.
인간과 거의 구별할 수 없는 인간 같은 AI 시스템이 상호작용 중에 자신을 어떻게 대표해야 하는지에 대한 검토가 증가하고 있습니다. 기업은 대화 에이전트를 배포할 때 투명성에 대해 어떻게 생각해야 합니까?
우리는 최종 사용자에게 대한誠實さ와 투명성을 믿습니다. 일부 규제는 방해가 되고, 억제적입니다. 그러나, 어떤 형태의 欺瞞도 받아들여질 수 없습니다. 우리는 고객을 위한 信頼을 기반으로 하는無缝な體驗을 개발하기 위해 기업과 협력합니다.
AI 에이전트가 수백만 개의 고객 상호작용을 동시에 처리하기 시작할 때, 기업은 파일럿 배포에서 생산 규모로 확장할 때, 어떤 운영적課題가 먼저 발생하는 경향이 있나요?
실제로 중요한 몇 가지 사항이 있습니다. 첫 번째는 모듈러 프롬프트 아키텍처입니다. 단일 프롬프트는 거의 디버깅할 수 없습니다. 호출이 잘못되면, 정확히 어디서, 왜 발생했는지 분리하여 찾아야 합니다. 지침의 벽을 보고 어떤 줄이 문제를 일으켰는지 알 수 없습니다.
전체 관찰 가능성이 중요합니다. 호출 후 요약은 충분하지 않습니다. 호출 중에 에이전트가 하는 모든 것을 실시간으로 볼 수 있어야 합니다.
가드레일도 필수입니다. 특히 규제 산업에서, 에이전트는 정책을 따라야 합니다. 그것은 선택이 아닙니다. 그리고, 그것이 그렇지 않은 경우, 우아한 폴백이 필요합니다.
마지막으로, 지식 관리가 있습니다. 에이전트는 제품, 정책, 절차와 같은 사유 데이터에 접근해야 합니다. 플랫폼은 실제 호출에서 나타나는 지식 격차를 자동으로 표면화해야 합니다. 고객이 불평하기 전에, 몇 주 후에가 아닙니다.
앞으로, 기업 음성 에이전트는 작업 특정 도구로 남아 있나요, 아니면 전체 비즈니스 프로세스를 대화로 시작하여 자율적으로 관리할 수 있는 일반화된 AI 에이전트로 발전할까요?
만약에 내가 答을 수 있다면! 음성 에이전트가 비즈니스 스택 전체에 걸쳐 발전할 것이라고 생각합니다. 그러나, 전체 비즈니스를 음성 에이전트로 운영할 수 있을지는 불확실합니다. 그러나, 나는 인간이 오늘날보다 더 즉각적이고, 정확하고, 포괄적인 서비스를 AI 에이전트로부터 받을 수 있을 것이라고 믿습니다. 실제로, 우리는 이러한 일이 발생하면 더 많은 전화가 있을 것이라고 믿습니다. 적은 것이 아닙니다.
감사합니다. 더 많은 정보를 원하는 독자는 Bland를 방문하십시오.












