Interviews
Alex Levin, Co-Founder und CEO von Regal – Interview-Serie

Alex Levin ist der Co-Founder und CEO von Regal, einer Voice-AI-Plattform, die Unternehmen hilft, durch kompatible, kundenorientierte Gespräche mit künstlicher Intelligenz Umsatz zu erzielen. Vor der Gründung von Regal im Jahr 2020 leitete er Wachstums- und Produktteams bei Handy, Thomson Reuters und anderen Start-ups. Als Harvard-Absolvent und Mitglied des Forbes Technology Council konzentriert sich Alex auf den Aufbau von skalierbarer, sprachbasierter Infrastruktur, die Innovation mit unternehmensweiten Sicherheitsvorkehrungen verbindet.
Regal bietet AI-Sprachassistenten für Vertrieb, Support, Terminplanung und Inkasso – entwickelt, um natürlich zu klingen, in CRM-Systeme integriert und in der Lage, Millionen von Gesprächen im großen Maßstab zu bewältigen. Die Plattform verfügt über einen no-code-Builder, Echtzeit-Analytics, A/B-Testing und integrierte Compliance für regulierte Branchen wie Gesundheitswesen, Versicherungen und Finanzdienstleistungen.
Was hat Sie dazu inspiriert, von Führungsrollen bei Angi und Handy zur Gründung von Regal zu wechseln, und gab es einen bestimmten Moment, in dem Sie und Ihr Co-Founder erkannten, dass die Kontaktzentrum-Erfahrung komplett neu aufgebaut werden musste?
Während unserer Zeit bei Angi/Handy sahen wir die Macht der Sprache beim Aufbau von Vertrauen mit Kunden. Kunden sagten uns, dass sie, wenn sie ein wichtiges Problem hatten, anrufen wollten, und Kunden, die wir über das Telefon bedienten, hatten einen höheren Lebenszeitwert und wenn wir Kunden anriefen, antworteten sie mit einer viel höheren Rate als über jedes andere Kanal. Doch die Anbieter von Kontaktzentrum-Software konzentrierten sich auf “Ablenkung” und “Automatisierung” anstelle dessen, was für die Kunden richtig war. Das Ergebnis war ein endloses Spiel von “Versteckte-Telefonnummer”, das Kunden unnötig bestrafte.
Mein Co-Founder und ich verließen das Unternehmen, weil wir fest davon überzeugt waren, dass wir die Sprache zum effektivsten Kanal machen konnten, indem wir die Kosten senkten und den Betrieb vereinfachten. Ich wünsche mir, ich hätte Regal gehabt, als ich ein großes Kontaktzentrum leitete.
Sie haben Regal 2020 gestartet, just bevor der generative AI-Boom einsetzte. Wie haben Sie bewertet, ob Voice-AI technisch machbar war – und was gab Ihnen die Überzeugung, frühzeitig zu handeln?
Wir waren bereits lange vor 2020 davon überzeugt, dass die Sprache der wichtigste Kanal war. Und 2020 wussten wir, dass wir Orchestrierung, A/B-Testing und Personalisierungstools entwickeln konnten, die die Kosten senken und die Verwaltung der Sprache als Kanal vereinfachen würden – sei es ein Mensch, ein herkömmlicher Sprachbot oder etwas Besseres. Also verkauften wir anfangs Tools für Kontaktzentren, um menschliche Agenten besser zu verwalten. Dieses Produkt wuchs sehr schnell.
Aber wie Sie bereits erwähnt haben, ist es ein Sprung ins Ungewisse, ein Unternehmen zu gründen, und es dauerte einige Zeit, bis wir wirklich sehen konnten, wie wir die Grenzen menschlicher Agenten überwinden konnten. Es war erst mit dem Launch von ChatGPT Ende 2022, dass wir wirklich “KI” sahen, die gut genug war, um ein Gespräch zu führen. Und es war erst Ende 2023, dass wir ein Demo für einen Sprachassistenten erstellen konnten, den wir für einen Kunden geeignet hielten.
Welche waren einige der schwierigsten technischen Herausforderungen beim Training von Sprachassistenten, die natürliche Gespräche mit menschlicher Leistung erreichen oder übertreffen konnten?
Es gibt so viele wunderbare technische Herausforderungen, an denen zu arbeiten ist. Von der Sicherstellung, dass die Latenz bei etwa 500ms liegt, bis zur Klärung, wie man sicherstellt, dass KI-Assistenten alle Kontexte von Unternehmenswissensbasen und Kundendaten in Echtzeit haben, bis hin zur Aktion in Anrufen und danach, zu Hütern oder Sicherheitsfunktionen und wie man die Interaktion des Assistenten menschlich mit dem richtigen verbalen Hinweis macht.
Eines meiner Lieblingsprojekte, an dem unser Team derzeit arbeitet, ist die Verbesserung der automatisierten Bewertungen, damit ein KI-Assistent leichter getestet werden kann, bevor er in die Produktion geht. Dies würde hunderte Stunden manueller Qualitätssicherung ausschalten, die derzeit für jede Änderung an jedem KI-Assistenten durchgeführt wird.
Wir müssen zunächst Hunderte von variierten simulierten Kundengesprächen (mit KI) erstellen, den KI-Assistenten durchlaufen lassen, dann den KI-Supervisor die Qualitätssicherung durchführen lassen und vorgeschlagene Verbesserungen an den KI-Assistenten oder die Unternehmensrichtlinien und Wissensbasen zurückgeben. Wir haben ein funktionierendes Bewertungsprodukt, das Kundenfeedback ist großartig, und es verbessert sich mit einem atemberaubenden Tempo.
Dies ist entscheidend für das neue Maß der Anzahl der Manager pro KI-Assistenten. Bald werden sehr wenige Manager in der Lage sein, Hunderte von verschiedenen KI-Assistenten zu verwalten.
Wie nutzt Regal maschinelles Lernen, um Gespräche in Echtzeit zu personalisieren? Basiert es sich auf Kundenhistorie, Ton, Intent-Erkennung – oder eine Kombination?
Wir haben stark in Personalisierung investiert im Vergleich zum Rest des Marktes, weil wir daran glauben, Marken zu helfen, Millionen von Kunden wie einen von einem Million zu testen. Nicht nur, um den generischen menschlichen Agenten-Handling zu rekonstruieren, der heute oft verwendet wird.
Wir begannen mit dem Aufbau eines einheitlichen Kundenprofils, das jeden Teil von CRM-Daten, Ereignisdaten und Gesprächsverlauf verknüpft. Beim Aufbau eines Assistenten können Unternehmen dem KI-Assistenten dann Zugang zu allen Informationen über einen Kunden oder nur zu den spezifischen Datenpunkten gewähren, die für ein bestimmtes Gespräch erforderlich sind. Das LLM bietet eine menschenähnliche, konversationale Antwort unter Verwendung der verfügbaren Daten.
LLMs sind immer noch begrenzt in dem, was sie gut machen, also mussten wir die Möglichkeit haben, andere Tools wie Drittanbieter-Dienste, benutzerdefinierte Anwendungen und ML zu nutzen. Also bauten wir “Benutzerdefinierte Aktionen”, die in einem KI-Assistenten-Prompt verwendet werden können, um andere Dienste zu nutzen. Zum Beispiel haben viele Marken Propensity-Modelle, um anzugeben, welches Produkt dem Kunden als Nächstes vorgeschlagen werden soll, und wir können uns in diese Konversation einhaken.
Wie verwendet Ihr System Retrieval-augmentierte Generation (RAG) ohne die Responsivität oder den natürlichen Rhythmus zu opfern, den Kunden von einem Live-Anruf erwarten?
RAG ist ein Bereich, in dem wir uns unterscheiden, da es für Voice-AI-Assistenten schneller sein musste als für AI-Assistenten in Chat oder anderen digitalen Kanälen. Einige Sekunden totale Stille würden den Anruf komplett ruinieren.
Wir senkten die Latenz des Abrufs und stellten sicher, dass, wenn der Abruf länger dauerte, der KI-Assistent mit dem Kunden sprechen konnte, um ihn wissen zu lassen, dass es länger dauern würde.
Die Regal-Assistenten sind nach realen menschlichen Stimmen modelliert, einschließlich der von tatsächlichen Investoren. Was erfordert es – technisch und ethisch – um solche hochwertigen Repliken zu bauen?
Es ist erstaunlich einfach, technisch gesehen, eine Stimme zu “klonen”, damit ein KI-Assistent wie ein professioneller Sprecher oder ein Freund klingen kann. 5-10 Minuten hochwertiger Audioaufnahmen reichen aus.
Zum Beispiel wurde ich kürzlich gefragt, wie man dies für ein sterbendes Familienmitglied machen kann, damit die jüngere Generation es erleben kann, wenn es älter ist. Also werden sie mit ein wenig Anleitung jetzt den sterbenden Großeltern aufnehmen.
Zu Ihrem zweiten Punkt: Der Großeltern stimmt dem zu, und professionelle Sprecher oder unsere Investoren stimmen dem zu. Böse Akteure, die Stimmenklonung ohne Zustimmung ermöglichen (wie es während der letzten Präsidentschaftswahlen passierte), sollten geschlossen werden.
Ein Rat – wenn Sie eine Stimmenklon ermöglichen (oder ein öffentlicher Akteur, der von bösen Akteuren geklont werden könnte), stellen Sie sicher, dass Sie ein sicheres Wort haben, das nur Ihre Familie kennt, damit sie den echten Sie in einem Anruf identifizieren können.
Sie betonen die Wichtigkeit der Integration von Regal in CRM-Systeme, Zahlungssysteme und interne APIs. Welche waren einige der schwierigsten Integrationsherausforderungen, die Sie lösen mussten?
Die Integration mit großen Produkten wie CRM-Systemen von Salesforce bis hin zu Kontaktzentrum-Software wie NICE ist einfach. Die härteste Anforderung ist, sicherzustellen, dass das Unternehmen APIs für uns zur Verfügung stellt, für jede Aktion, die der KI-Assistent ausführen muss. Ein menschlicher Agent kann auf einen Button klicken, um ein Hotelzimmer zu buchen. Aber der KI-Assistent benötigt wirklich eine Buchungs-API.
Wie gehen Sie bei der Messung und Verbesserung der Modellleistung über die Zeit hinweg vor? Welche Rolle spielt überwachtes Feintuning oder Verstärkungslernen in diesem Prozess?
Wir bauten von Anfang an ein A/B-Test-Suite, damit es für Kunden trivial ist, KI-Assistenten gegen menschliche Agenten oder den Assistenten mit LLM-Version 1 gegen Version 2 zu testen. Das gibt uns eine klare Möglichkeit, Variationen in den Ergebnissen für verschiedene Modelle zu sehen.
Allerdings verwenden wir heute kein Verstärkungslernen, da es die Rechtsabteilungen unwohl macht (sie wollen keine Situation, in der es eine ungewollte Änderung des Duftes gibt). Ich denke, wir sind 13 Monate davon entfernt, dass Rechtsabteilungen Verstärkungslernen in unserem Anwendungsfall zulassen. Stattdessen konzentrieren wir uns heute darauf, Vorschläge zu machen, die ein menschlicher Manager akzeptieren kann. Dies können Änderungen an einem Prompt, einer Wissensbasis, einer Feinabstimmung eines LLM usw. sein.
Ein Gespräch mit einem VC – oder einem Voice-Klon eines – ist ein kühnes Konzept. Was war Ihre Absicht, diese KI-Berater für Gründer verfügbar zu machen, und wie werden sie heute verwendet?
Wir hatten das Glück, Zugang zu wunderbaren Investoren zu haben und wollten dies mit diesem Projekt zurückgeben. Ich habe Spaß daran, mit Satya AI zu sprechen, und ich habe großartiges Feedback von Managern gehört, die die KI-VCs für alles von Rat, wie man ein Produkt-Roadmap erstellt, bis hin zu welchem Preismodell man verwenden soll, verwendet haben.
Wir lieben es, zu zeigen, anstatt zu erzählen, und dieses Projekt zeigt wirklich die Macht unserer RAG-/Wissensbasen-Fähigkeiten. Wir hatten sogar zwei unserer Investoren, deren Eltern uns den Daumen hoch gegeben haben!
Aber ein Wort der Weisheit – Sie können nicht die Entscheidungsfindung an Berater delegieren, und eines der schwierigeren Teile des Managements ist, zwischen zwei schlechten Optionen oder sogar zwei scheinbar guten Optionen zu entscheiden.
Verlassen sich diese Investor-Agenten auf allgemeines Start-up-Wissen oder werden sie auf firmenspezifische Ratschläge und Philosophien der einzelnen VC trainiert?
Alle KI-Assistenten haben einiges an allgemeinem Wissen aus der LLM-Schulung. Aber um die Ergebnisse zu erzielen, die wir benötigten, luden wir die schriftlichen Werke der Investoren in die jeweiligen KI-Assistenten-Wissensbasen.
Darüber hinaus und neben der Stimmenklonung denke ich, dass wir es auch schafften, die einzigartigen Persönlichkeiten oder das Wesen der Investoren wie Jake Sapers Positivität oder Alexa Von Tobels Begeisterung einzufangen.
Aufblickend, wie sehen Sie die Entwicklung von Regals KI – werden wir mehr autonome Entscheidungsfindung, mehr emotionale Intelligenz oder sogar multimodale Unterstützung sehen?
Der aufregendste Teil des letzten Jahres war, unsere KI-Assistenten besser als menschliche Agenten performen zu sehen. Ich denke, dass in den nächsten Jahren die Verbesserungen in den zugrunde liegenden KI-Modellen und die Fortschritte in Regals Anwendung dazu führen werden, dass KI-Assistenten, die nicht von Menschen zu unterscheiden sind und die menschliche Agentenleistung bei Weitem übertreffen, entstehen. Unternehmen, die sich auf KI-Assistenten einlassen, werden ihre Kosten senken und die Kundenerfahrung schneller verbessern, als irgendjemand erwartet hat.
Vielen Dank für das großartige Interview, Leser, die mehr erfahren möchten, sollten Regal besuchen.












