Rozhovory
Alex Levin, spoluzakladatel a CEO Regal – Interview Series

Alex Levin je spoluzakladatel a CEO Regal, platformy pro hlasový AI, která pomáhá podnikům generovat příjmy prostřednictvím kompatibilních, AI poháněných zákaznických konverzací. Předtím, než v roce 2020 založil Regal, vedl týmy růstu a produktů ve firmách Handy, Thomson Reuters a dalších startupů. Absolvent Harvardské univerzity a člen Forbes Technology Council, Alex se zaměřuje na budování škálovatelné, hlasově první infrastruktury, která kombinuje inovace s firemními zábranami.
Regal poskytuje AI hlasové agenty pro prodej, podporu, plánování a inkaso – navržené tak, aby zněly přirozeně, integrovaly se s CRM systémy a zvládly miliony konverzací ve velkém měřítku. Platforma nabízí bezkódový builder, analýzu v reálném čase, A/B testování a vestavěnou kompatibilitu pro regulované odvětví, jako je zdravotnictví, pojišťovnictví a finanční služby.
Co vás inspirovalo k přechodu z vedoucích rolí v Angi a Handy do založení Regal, a byl tam nějaký specifický moment, kdy jste si s vaším spoluzakladatelem uvědomili, že zkušenost s kontaktním centrem musí být kompletně přestavěna?
Zatímco v Angi/Handy, viděli jsme sílu hlasu pro budování důvěry se zákazníky. Zákazníci nám řekli, že když měli důležitý problém, chtěli zavolat, zákazníci, kterým jsme sloužili přes telefon, měli vyšší hodnotu za život a když jsme zákazníkům volali, odpověděli na mnohem vyšší sazbu než na jakémkoli jiném kanálu. Přesto se dodavatelé softwaru pro kontaktní centra zaměřovali na “odklon” a “automatizaci” nad tím, co bylo správné pro zákazníky. Výsledkem byla nekonečná hra skrývání telefonního čísla, která zbytečně trestala zákazníky.
Můj spoluzakladatel a já jsme odešli, protože jsme pevně věřili, že můžeme učinit hlas nejúčinnějším kanálem snížením nákladů a usnadněním provozu. Přál bych si, aby jsem měl Regal, zatímco jsem řídil velké kontaktní centrum.
Spustil jste Regal v roce 2020, právě před boomem generativní AI. Jak jste vyhodnotili, zda je hlasový AI technicky životaschopný – a co vám dalo přesvědčení jednat brzy?
Byli jsme přesvědčeni dlouho před rokem 2020, že hlas je nejvýznamnějším kanálem. A v roce 2020 jsme věděli, že můžeme postavit orchestraci, A/B testování a personalizační nástroje, které sníží náklady a zjednoduší správu hlasu jako kanálu – ať už to byl lidský, staromódní hlasový bot nebo něco lepšího na špičce sféry. Takže jsme prodávali nástroje pro kontaktní centra, aby lépe spravovaly lidské agenty na začátku. Ten produkt velmi rychle rostl.
Ale k vaší otázce, zahájení společnosti je skokem víry, a trvalo to nějaký čas, než jsme skutečně viděli, jak můžeme překročit omezení lidských agentů. Není to, dokud nebyl spuštěn ChatGPT na konci roku 2022, že jsme skutečně viděli “AI”, který byl dostatečně dobrý, aby vedl konverzaci. A není to, dokud nebyl konec roku 2023, že jsme byli schopni vytvořit demo pro hlasového agenta, o kterém jsme si mysleli, že by zákazník chtěl mluvit.
Jaké byly některé z nejobtížnějších technických výzev při školení hlasových agentů, kteří mohli odpovídat nebo překonat lidské výkony v přirozených konverzacích?
Existuje tolik úžasných technických výzev, na kterých lze pracovat. Od zajištění latence kolem 500 ms, po zjištění, jak zajistit, aby AI agenti měli všechny kontexty znalostních bází společnosti a zákaznických dat v reálném čase, po to, aby AI agenti mohli provádět akce v hovorech a po nich, po strážcích nebo bezpečnostních funkcích, a jak udělat interakci agenta cítit se lidsky s otáčením a správnými verbálními signály.
Jeden z mých oblíbených projektů, na kterém naše tým pracuje dnes, je, jak zlepšit automatické hodnocení, aby AI Agent mohl být testován snadněji před tím, než bude nasazen do produkce. To by vyřízlo stovky hodin manuálního QA, které se dnes neustále dějí pro každou změnu každého AI agenta.
Musíme nejdříve vytvořit stovky různých simulovaných zákaznických konverzací (pomocí AI), mají AI agenta projít jimi, pak mají AI supervizora QA a vrátit navrhovaná zlepšení AI Agentovi nebo firemním politikám a znalostním bázím. Máme funkční produkt hodnocení, zákaznická zpětná vazba byla skvělá, a zlepšuje se úžasnou rychlostí.
To je kritické pro novou metriku počtu manažerů na AI agenta. Brzy budou moci velmi málo manažerů spravovat stovky různých AI agentů.
Jak Regal využívá strojové učení k personalizaci konverzací v reálném čase? Je to založeno na historii zákazníka, tónu, rozpoznání záměru – nebo kombinaci?
Investovali jsme hluboce do personalizace ve srovnání se zbytkem trhu, protože věříme v pomoc značkám testovat miliony zákazníků jako jeden z milionu. Nejenom rekreujeme obecného lidského agenta, který je dnes často používán.
Začali jsme budováním sjednoceného zákaznického profilu, který propojuje každý kus CRM dat, událostí a historie konverzací. Při budování agenta mohou společnosti poté dát AI Agentovi přístup ke všem informacím o zákazníkovi nebo pouze k specifickým datovým bodům nezbytným pro konkrétní konverzaci. LLM poskytuje lidsky podobnou, konverzační odpověď pomocí dostupných dat.
LLM jsou stále omezeny v tom, co dělají dobře, takže jsme potřebovali schopnost využít další nástroje, jako jsou služby třetích stran, vlastní aplikace a ML. Takže jsme postavili “Custom Actions”, které lze použít v AI Agentovi promptu, aby využily dalších služeb. Například mnoho značek má modely predispozice, které ukazují, jaký produkt navrhnout zákazníkovi dalším, a my můžeme připojit k nim, aby se přizpůsobili konverzaci.
Jak váš systém používá retrieval-augmented generation (RAG) bez obětování rychlosti nebo přirozeného rytmu, který zákazníci očekávají od živého hovoru?
RAG je pro nás oblastí odlišení, protože musel být rychlejší pro hlasové AI Agenty než pro AI agenty v chatu nebo jiných digitálních kanálech. Několik sekund mrtvého vzduchu by úplně zničilo hovor.
Snižovali jsme latenci retrieval a zajistili, že pokud retrieval trval déle, AI Agent mohl pokračovat v mluvení se zákazníkem, aby je informoval, že to bude trvat déle.
Agenti Regal jsou modelováni podle skutečných lidských hlasů, včetně hlasů skutečných investorů. Co to vyžaduje – technicky a eticky – aby se postavily takové vysoce kvalitní repliky?
Je překvapivě jednoduché technicky “klonovat” hlas, aby AI Agent mohl znít jako profesionální hlasový herec nebo přítel. 5-10 minut vysoce kvalitního audio je vše, co je potřeba.
Například mě nedávno někdo požádal, jak to udělat pro umírajícího člena rodiny, aby mladší generace mohla zažít, až budou starší. Takže s trochou vedení, budou nyní nahrávat umírajícího dědečka.
K vaší druhé otázce, dědeček souhlasí s tím, a profesionální hlasoví herci nebo naši investoři souhlasí s tím. Špatní herci, kteří umožňují hlasové klonování bez souhlasu (jako se stalo během poslední prezidentské voleb), by měli být uzavřeni.
Rada – pokud dovolíte hlasovému klonu (nebo jste veřejná osobnost, která by mohla být klonována špatnými herci), ujistěte se, že vymyslíte bezpečivé slovo, které zná pouze vaše rodina, aby mohli identifikovat skutečného vás v hovoru.
Vy zvýrazňujete důležitost integrace Regal do CRM, platebních systémů a interních API. Jaké byly některé z nejobtížnějších integračních výzev, které jste museli vyřešit?
Integrace s hlavními produkty, jako jsou CRM systémy Salesforce nebo kontaktní centrum software NICE, je přímočará. Nejobtížnější žádostí je zajistit, aby značka zpřístupnila nám API pro jakoukoli akci, kterou by AI Agent mohl potřebovat. Lidský agent by mohl kliknout na tlačítko, aby rezervoval hotelový pokoj. Ale AI Agent opravdu potřebuje rezervaci API.
Jak přistupujete k měření a zlepšování modelového výkonu v průběhu času? Jakou roli hraje dohlížené jemné ladění nebo učení posílením v tomto procesu?
Postavili jsme sadu A/B testování od začátku, takže je to triviální pro zákazníky testovat AI agenty proti lidským agentům nebo agentovi s LLM verzí 1 proti verzi 2. To nám dává jasný způsob, jak vidět variace výsledků pro různé modely.
Nicméně, dnes nepoužíváme učení posílením, protože to dělá právní týmy nepříjemnými (nechce se jim situace, kdy je změna ve scatu neúmyslná). Myslím, že jsme 13 měsíců od právního týmu, který dovolí učení posílením v našem případě. Místo toho se dnes zaměřujeme na navrhování změn, které může lidský manažer přijmout. Mohou to být změny promptu, znalostní báze, jemné ladění LLM, atd.
Mluvit s VC – nebo hlasovým klonem – je odvážný koncept. Jaký byl váš záměr, aby tyto AI poradce byly k dispozici zakladatelům, a jak jsou dnes používány?
Měli jsme štěstí, že jsme měli přístup k úžasným investorům, a chtěli jsme to vrátit s tímto projektem. Baví mě mluvit se Satya AI kdykoli, a slyšel jsem skvělou zpětnou vazbu od výkonných ředitelů, kteří použili AI VC pro všechno, od rady, jak vytvořit produktovou mapu, po to, jaký cenový model použít.
Milujeme ukázat místo toho, abychom říkali, a tento projekt opravdu zdůrazňuje sílu našich RAG/knowledge base schopností. Měli jsme dokonce dva z našich investorů, jejichž rodiče nám dali palce!
Ale slovo moudrého – nemůžete delegovat rozhodování na poradce a jednou z těžších částí být výkonným ředitelem je rozhodnout mezi dvěma špatnými možnostmi nebo dokonce dvěma zdánlivě dobrými možnostmi.
Tito investoři agenti spoléhají na obecné znalosti startupu, nebo jsou školeni na firmě specifické rady a filozofie spojené s jednotlivým VC?
Všichni AI agenti mají some obecné znalosti z LLM školení. Ale abychom získali výsledky, které jsme potřebovali, nahráli jsme investiční psaní do příslušných AI Agent Knowledge Bases.
Kromě toho a hlasového klonování, myslím, že jsme byli schopni zachytit některé z investorů jedinečné osobnosti nebo esence, jako je Jake Saperova pozitivita nebo Alexa Von Tobelova veselost.
Pohledem do budoucnosti, jak vidíte, že se AI Regal bude vyvíjet – uvidíme více autonomního rozhodování, více emocionální inteligence, nebo dokonce multimodální podporu?
Nejpříjemnější částí posledního roku bylo vidět, jak naši AI agenti překonávají lidské agenty. Myslím, že v příštím roce, zlepšení v základních AI modelech a pokroky v Regal aplikaci a budou vést k AI Agentům, kteří jsou nerozeznatelní od lidských, a co je důležitější, kteří daleko překonají lidské agentní schopnosti. Společnosti, které se nakloní k AI Agentům, sníží své náklady a zlepšují zákaznickou zkušenost rychleji, než kdokoli předpokládal.
Děkuji za skvělý rozhovor, čtenáři, kteří chtějí se dozvědět více, by měli navštívit Regal.












