Connect with us

Alex Levin, medgrundare och VD för Regal – Intervjuserie

Intervjuer

Alex Levin, medgrundare och VD för Regal – Intervjuserie

mm

Alex Levin är medgrundare och VD för Regal, en röst-AI-plattform som hjälper företag att driva intäkter genom kompatibla, AI-drivna kundkonversationer. Innan han grundade Regal 2020 ledde han tillväxt- och produktteam på Handy, Thomson Reuters och andra startups. En Harvard-utbildad och medlem i Forbes Technology Council, fokuserar Alex på att bygga skalbara, röst-först-infrastructure som kombinerar innovation med företagsklassiga skydd.

Regal tillhandahåller AI-röstagenter för försäljning, support, schemaläggning och inkassering – utformade för att låta naturliga, integrera med CRM-system och hantera miljontals konversationer i skala. Plattformen har en no-code-byggare, realtidsanalys, A/B-testning och inbyggd regelefterlevnad för reglerade branscher som hälsovård, försäkringar och finansiella tjänster.

Vad inspirerade dig att gå från ledande roller på Angi och Handy till att grunda Regal, och var det ett specifikt ögonblick när du och din medgrundare insåg att kontaktcenterupplevelsen behövde byggas om från grunden?

Medan vi var på Angi/Handy såg vi kraften i röst för att bygga förtroende med kunder. Kunder berättade för oss att när de hade ett viktigt problem ville de ringa, och kunder som vi betjänade över telefonen hade en högre livstidsvärde och när vi ringde kunder svarade de i en mycket högre utsträckning än någon annan kanal. Men kontaktcentermjukvaruleverantörer fokuserade på “avledning” och “automatisering” istället för vad som var rätt för kunderna. Resultatet var ett evigt spel av “göm telefonnumret” som onödigt straffade kunder.

Min medgrundare och jag lämnade eftersom vi starkt trodde att vi kunde göra röst till den mest effektiva kanalen genom att sänka kostnaderna och göra det lättare att operera. Jag önskar att jag hade haft Regal medan jag körde ett stort kontaktcenter.

Ni lanserade Regal 2020, precis före den generativa AI-boomen. Hur utvärderade ni om röst-AI var tekniskt genomförbar – och vad gav er övertygelsen att agera tidigt?

Vi var övertygade långt innan 2020 att röst var den viktigaste kanalen. Och 2020 visste vi att vi kunde bygga orkestrering, A/B-testning och personaliseringverktyg som skulle sänka kostnaderna och förenkla hanteringen av röst som en kanal – oavsett om det var en människa, en gammal skolröstbot eller något bättre vid sfärens spets. Så vi sålde verktyg för kontaktcenter för att bättre hantera mänskliga agenter från början. Den produkten växte mycket snabbt.

Men för att citera din poäng, att starta ett företag är ett språng i tro, och det tog tid att verkligen se hur vi kunde gå utöver begränsningarna för mänskliga agenter. Det var inte förrän lanseringen av ChatGPT i slutet av 2022 som vi verkligen såg “AI” som var tillräckligt bra för att hålla en konversation. Och det var inte förrän slutet av 2023 som vi kunde skapa en demo för en röstagent som vi trodde att en kund ville prata med.

Vilka var några av de svåraste tekniska utmaningarna i att träna röstagenter som kunde matcha eller överträffa mänsklig prestanda i naturliga konversationer?

Det finns så många underbara tekniska utmaningar att arbeta med. Från att säkerställa att latensen är runt 500 ms, till att ta reda på hur man kan se till att AI-agenter har all kontext för företagets kunskapsbaser och kunddata i realtid, till att AI-agenter kan vidta åtgärder i samtal och efter, till väktare eller säkerhetsfunktioner, och hur man kan göra agentinteraktionen känna sig mänsklig med turtagning och rätt verbal signal.

Ett av mina favoritprojekt som vårt team arbetar med idag är hur man kan förbättra automatiserade utvärderingar så att en AI-agent kan testas mer lätt innan den sätts i produktion. Detta skulle skära ut hundratals timmar av manuell QA som sker konstant idag för varje ändring av varje AI-agent.

Vi måste först skapa hundratals varierade simulerade kundkonversationer (med AI), de har AI-agenten gå igenom dem, sedan har AI-övervakaren QA dem och returnerar föreslagna förbättringar av AI-agenten eller företagets policys och kunskapsbas. Vi har en fungerande utvärderingsprodukt nu, kundfeedbacken har varit bra, och det blir bättre i en fantastisk takt.

Detta är avgörande för den nya metriken för antal chefer per AI-agent. Snart kommer mycket få chefer att kunna hantera hundratals olika AI-agenter.

Hur använder Regal maskinlärande för att anpassa konversationer i realtid? Är det baserat på kundhistorik, ton, avsiktsgenkänning – eller en kombination?

Vi har investerat djupt i anpassning jämfört med resten av marknaden eftersom vi tror på att hjälpa varumärken testa miljontals kunder som en i en miljon. Inte bara återskapar den generiska mänskliga agenten som används idag.

Vi började med att bygga ett enhetligt kundprofil som länkar varje bit av CRM-data, händelsedata och konversationshistorik. När man bygger en agent kan företag sedan ge AI-agenten tillgång till all information om en kund eller bara de specifika datapunkter som är nödvändiga för en viss konversation. LLM tillhandahåller ett mänskligt, konversationsliknande svar med hjälp av data som finns till hands.

LLM är fortfarande begränsade i vad de gör bra, så vi behövde möjligheten att utnyttja andra verktyg som tredjepartsdatatjänster, anpassade applikationer och ML. Så vi byggde “Anpassade åtgärder” som kan användas i en AI-agentprompt för att dra nytta av andra tjänster. Till exempel har många varumärken benägenhetsmodeller för att indikera vilken produkt som ska föreslås till kunden nästa och vi kan koppla in i dem för att passa konversationen.

Hur använder ert system återhämtningsförstärkt generering (RAG) utan att offra svarstiden eller den naturliga kadensen som kunder förväntar sig från ett live-samtal?

RAG är ett område för differentiering för oss eftersom det behövde vara snabbare för röst-AI-agenter än för AI-agenter i chatt eller andra digitala kanaler. Några sekunders dödtid skulle helt förstöra samtalet.

Vi både sänkte latensen för återhämtning och säkerställde att om återhämtning tog längre tid kunde AI-agenten fortsätta prata med kunden för att låta dem veta att det skulle ta längre tid.

Regals agenter är modellerade efter riktiga mänskliga röster, inklusive de från faktiska investerare. Vad krävs det – tekniskt och etiskt – för att bygga så högkvalitativa replikor?

Det är förvånansvärt enkelt tekniskt att “klona” en röst så att en AI-agent kan låta som en professionell röstskådespelare eller en vän. 5-10 minuter av högkvalitetsljud är allt som behövs.

Till exempel blev jag nyligen ombedd att berätta hur man gör detta för en döende släkting så att yngre generationen kunde uppleva dem när de är äldre. Så med lite vägledning kommer de att spela in den döende farföräldern nu.

Vad gäller din andra punkt, farföräldern samtycker till detta, och professionella röstskådespelare eller våra investerare samtycker till detta. Dåliga aktörer som tillåter röstkloning utan samtycke (som hände under den senaste presidentvalskampanjen) bör stängas av.

En råd – om du tillåter en röstkloning (eller du är en offentlig person som kan klonas av dåliga aktörer), se till att du kommer på ett säkert ord som bara din familj känner till så att de kan identifiera den riktiga dig i ett samtal.

Ni betonar vikten av att integrera Regal i CRM, betalningssystem och interna API:er. Vilka var några av de svåraste integrationsutmaningarna ni hade att lösa?

Att integrera med stora produkter från CRM som Salesforce till Kontaktcenterprogramvara som NICE är rakt på sak. Den svåraste utmaningen är att se till att varumärket gör API:er tillgängliga för oss för alla åtgärder som AI-agenten kan behöva vidta. En mänsklig agent kan klicka på en knapp för att boka ett hotellrum. Men AI-agenten behöver verkligen en boknings-API.

Hur närmar ni er mätning och förbättring av modellprestanda över tid? Vilken roll spelar övervakad finjustering eller förstärkt inlärning i denna process?

Vi byggde ett A/B-testpaket från början, så det är trivialt för kunder att testa AI-agenter mot mänskliga agenter eller agenten med LLM-version 1 mot version 2. Det ger oss ett tydligt sätt att se variationer i resultat för olika modeller.

Men vi använder inte förstärkt inlärning idag eftersom det gör att juridiska team blir obekväma (de vill inte ha en situation där det finns en oavsiktlig förändring). Jag tror att vi är 13 månader ifrån att juridiska team tillåter förstärkt inlärning i vårt användningsfall. Istället fokuserar vi idag på att föreslå ändringar som en mänsklig chef kan acceptera. Dessa kan vara till en prompt, en kunskapsbas, finjustering av en LLM, etc.

Att prata med en VC – eller en röstklon av en – är ett djärvt koncept. Vad var er avsikt med att göra dessa AI-rådgivare tillgängliga för grundare, och hur används de idag?

Vi har varit lyckosamma att ha tillgång till underbara investerare och vi ville ge tillbaka med detta projekt. Jag har kul att prata med Satya AI när som helst, och jag har hört bra feedback från chefer som har använt AI-VC för allt från råd om hur man skapar en produktväg till vilken prissättningsmodell som ska användas.

Vi älskar att visa istället för att berätta och detta projekt visar verkligen kraften i våra RAG/kunskapsbasförmågor. Vi hade till och med två av våra investerares föräldrar som gav oss tummen upp!

Men ett ord till den vise – du kan inte delegera beslutsfattande till rådgivare och en av de svårare delarna av att vara en chef är att välja mellan två dåliga alternativ eller till och med två tydligt bra alternativ.

Är dessa investeraragenter beroende av generell startup-kunskap eller är de tränade på företagsspecifik råd och filosofier kopplade till den enskilda VC?

Alla AI-agenter har någon generisk kunskap från LLM-utbildningen. Men för att få de resultat vi behövde, laddade vi upp investerarnas omfattande skrifter till respektive AI-Agent Kunskapsbas.

Utöver det och röstkloning, tror jag att vi också kunde fånga några av investerarnas unika personligheter eller essens, som Jake Sapers positivitet eller Alexa Von Tobels livlighet.

Att se framåt, hur ser ni att Regals AI utvecklas – kommer vi att se mer autonomt beslutsfattande, mer emotionell intelligens eller till och med multimodal stöd?

Det mest spännande med det senaste året har varit att se våra AI-agenter prestera bättre än mänskliga agenter. Jag tror att under det kommande året kommer förbättringar i de underliggande AI-modellerna och framsteg i Regals tillämpning och kommer att resultera i AI-agenter som är omöjliga att skilja från människor, och viktigare, som vida överträffar mänskliga agentförmågor. Företag som lutar sig mot AI-agenter kommer att sänka sina kostnader och förbättra kundupplevelsen snabbare än någon kunde ha förutsett.

Tack för den underbara intervjun, läsare som vill lära sig mer bör besöka Regal.

Antoine är en visionär ledare och medgrundare av Unite.AI, driven av en outtröttlig passion för att forma och främja framtiden för AI och robotik. En serieentreprenör, han tror att AI kommer att vara lika omstörtande för samhället som elektricitet, och fångas ofta i extas över potentialen för omstörtande teknologier och AGI. Som en futurist, är han dedikerad till att utforska hur dessa innovationer kommer att forma vår värld. Dessutom är han grundare av Securities.io, en plattform som fokuserar på att investera i banbrytande teknologier som omdefinierar framtiden och omformar hela sektorer.