Entrevistas
Alex Levin, Co-Fundador y CEO de Regal – Serie de Entrevistas

Alex Levin es el Co-Fundador y CEO de Regal, una plataforma de voz AI que ayuda a las empresas a impulsar los ingresos a través de conversaciones de clientes impulsadas por AI y cumplimiento. Antes de fundar Regal en 2020, lideró equipos de crecimiento y producto en Handy, Thomson Reuters y otras startups. Graduado de Harvard y miembro del Consejo de Tecnología de Forbes, Alex se enfoca en construir infraestructuras escalables y de voz que combinan innovación con guardias de empresa.
Regal proporciona agentes de voz AI para ventas, soporte, programación y cobros—diseñados para sonar naturales, integrarse con sistemas CRM y manejar millones de conversaciones a escala. La plataforma cuenta con un constructor sin código, análisis en tiempo real, pruebas A/B y cumplimiento integrado para industrias reguladas como la atención médica, seguros y servicios financieros.
¿Qué te inspiró a dejar puestos de liderazgo en Angi y Handy para fundar Regal, y ¿hubo un momento específico en el que tú y tu co-fundador se dieron cuenta de que la experiencia del centro de contacto necesitaba ser reconstruida por completo?
Mientras estuve en Angi/Handy, vimos el poder de la voz para construir confianza con los clientes. Los clientes nos dijeron que cuando tenían un problema importante, querían llamar, y los clientes a los que servimos por teléfono tenían un valor de cliente más alto y respondían a un ritmo mucho más alto que cualquier otro canal. Sin embargo, los proveedores de software de centros de contacto se centraban en la “desviación” y la “automatización” en lugar de lo que era correcto para los clientes. El resultado fue un juego interminable de esconder el número de teléfono que castigaba injustamente a los clientes.
Mi co-fundador y yo nos fuimos porque creíamos firmemente que podríamos hacer que la voz fuera el canal más efectivo al reducir el costo y hacer que fuera más fácil de operar. Desearía haber tenido Regal mientras estaba dirigiendo un gran centro de contacto.
Lanzaste Regal en 2020, justo antes del auge de la IA generativa. ¿Cómo evaluaste si la IA de voz era técnicamente viable, y qué te dio la convicción para actuar temprano?
Estábamos convencidos desde mucho antes de 2020 de que la voz era el canal más importante. Y en 2020, sabíamos que podríamos construir orquestación, pruebas A/B y herramientas de personalización que reducirían los costos y simplificarían la gestión de la voz como un canal—ya sea que fuera un agente humano, un bot de voz antiguo o algo mejor en la punta de la esfera. Así que vendimos herramientas para que los centros de contacto gestionaran mejor a los agentes humanos al principio. Ese producto creció muy rápidamente.
Pero, como mencionaste, iniciar una empresa es un salto de fe, y tomó tiempo ver realmente cómo podríamos ir más allá de las limitaciones de los agentes humanos. No fue hasta el lanzamiento de ChatGPT a fines de 2022 que realmente vimos “IA” que era lo suficientemente buena como para sostener una conversación. Y no fue hasta fines de 2023 que pudimos crear una demo para un agente de voz que pensamos que un cliente querría hablar.
¿Cuáles fueron algunos de los desafíos técnicos más difíciles en la capacitación de agentes de voz que podrían igualar o superar el rendimiento humano en conversaciones naturales?
Hay muchos desafíos técnicos maravillosos en los que trabajar. Desde asegurarse de que la latencia sea de alrededor de 500 ms, hasta descubrir cómo asegurarse de que los agentes de IA tengan todo el contexto de las bases de conocimiento de la empresa y los datos del cliente en tiempo real, hasta tener agentes de IA que tomen medidas en las llamadas y después, hasta guardianes o características de seguridad, y cómo hacer que la interacción del agente se sienta humana con turnos y señales verbales adecuadas.
Uno de mis proyectos favoritos en los que trabaja nuestro equipo hoy es cómo mejorar las evaluaciones automatizadas para que un agente de IA pueda ser probado más fácilmente antes de ponerlo en producción. Esto cortaría cientos de horas de QA manual que ocurren constantemente hoy para cada cambio en cada agente de IA.
Tenemos que crear primero cientos de conversaciones de clientes simuladas variadas (usando IA), les hacemos que el agente de IA las atraviese, luego tenemos un supervisor de IA que las evalúa y devuelve sugerencias de mejora al agente de IA o a las políticas y bases de conocimiento de la empresa. Tenemos un producto de evaluación funcionando ahora, la retroalimentación del cliente ha sido excelente, y está mejorando a un ritmo asombroso.
Esto es fundamental para la nueva métrica de recuento de administradores por agente de IA. Pronto, muy pocos administradores podrán gestionar cientos de agentes de IA diferentes.
¿Cómo aprovecha Regal el aprendizaje automático para personalizar conversaciones en tiempo real? ¿Se basa en la historia del cliente, el reconocimiento de intención, el tono o una combinación?
Hemos invertido profundamente en personalización en comparación con el resto del mercado porque creemos en ayudar a las marcas a probar a millones de clientes como si fueran uno en un millón. No solo recreando el manejo genérico del agente humano que se utiliza hoy en día.
Comenzamos construyendo un perfil de cliente unificado que vincula todos los datos de CRM, eventos y historial de conversaciones. Al construir un agente, las empresas pueden darle al agente de IA acceso a todo sobre un cliente o solo a los puntos de datos específicos necesarios para una conversación particular. El LLM proporciona una respuesta conversacional similar a la humana utilizando los datos disponibles.
Los LLM todavía están limitados en lo que hacen bien, así que necesitamos la capacidad de aprovechar otras herramientas como servicios de datos de terceros, aplicaciones personalizadas y ML. Así que construimos “Acciones personalizadas” que se pueden utilizar en una llamada de agente de IA para aprovechar otros servicios. Por ejemplo, muchas marcas tienen modelos de propensión para indicar qué producto sugerir al cliente a continuación, y podemos conectarnos a esos que se ajustan a la conversación.
¿Cómo utiliza su sistema la generación mejorada de recuperación (RAG) sin sacrificar la respuesta o el ritmo natural que los clientes esperan de una llamada en vivo?
RAG es un área de diferenciación para nosotros, ya que necesitaba ser más rápida para los agentes de IA de voz que para los agentes de IA en chat o canales digitales. Unos pocos segundos de aire muerto arruinarían completamente la llamada.
Bajamos la latencia de recuperación y nos aseguramos de que si la recuperación tomara más tiempo, el agente de IA podría seguir hablando con el cliente para hacerle saber que tomaría más tiempo.
Los agentes de Regal están modelados según voces humanas reales, incluyendo las de inversores reales. ¿Qué se necesita—técnicamente y éticamente—para construir réplicas de alta fidelidad?
Es sorprendentemente fácil técnicamente “clonar” una voz para que un agente de IA suene como un actor de voz profesional o un amigo. 5-10 minutos de audio de alta calidad es todo lo que se necesita.
Por ejemplo, me pidieron recientemente cómo hacer esto para un miembro de la familia que se está muriendo, para que la generación más joven pueda experimentarlo cuando sean mayores. Así que, con un poco de orientación, van a grabar al abuelo moribundo ahora.
En cuanto a tu segundo punto, el abuelo consiente en esto, y los actores de voz profesionales o nuestros inversores consienten en esto. Los actores malvados que permiten el clonado de voz sin consentimiento (como lo que sucedió en las últimas elecciones presidenciales) deben ser cerrados.
Un consejo: si permites un clon de voz (o eres una figura pública que podría ser clonada por actores malvados), asegúrate de crear una palabra segura que solo tu familia conozca para que puedan identificar al verdadero tú en una llamada.
Destacas la importancia de integrar Regal en CRM, sistemas de pago y API internas. ¿Cuáles fueron algunos de los desafíos de integración más difíciles que tuviste que resolver?
Integrar con productos importantes de CRM como Salesforce hasta software de centro de contacto como NICE es directo. La solicitud más difícil es asegurarse de que la marca haga que las API estén disponibles para nosotros para cualquier acción que el agente de IA pueda necesitar. Un agente humano puede hacer clic en un botón para reservar una habitación de hotel. Pero el agente de IA realmente necesita una API de reserva.
¿Cómo abordas la medición y mejora del rendimiento del modelo con el tiempo? ¿Qué papel juega el ajuste fino supervisado o el aprendizaje por refuerzo en este proceso?
Construímos una suite de pruebas A/B desde el principio, así que es trivial para los clientes probar agentes de IA versus agentes humanos o el agente con la versión 1 de LLM versus la versión 2. Eso nos da una forma clara de ver variaciones en el resultado para diferentes modelos.
Sin embargo, no usamos aprendizaje por refuerzo hoy en día, ya que hace que los equipos legales se sientan incómodos (no quieren una situación en la que haya un cambio en el olor que no es intencionado). Creo que estamos a 13 meses de que los equipos legales permitan el aprendizaje por refuerzo en nuestro caso de uso. En lugar de eso, nos enfocamos hoy en sugerir cambios que un gerente humano pueda aceptar. Estos podrían ser un prompt, una base de conocimiento, un ajuste fino de LLM, etc.
Hablar con un VC—o un clon de voz de uno—es un concepto audaz. ¿Cuál fue tu intención al hacer que estos asesores de IA estuvieran disponibles para los fundadores, y cómo se están utilizando hoy en día?
Hemos tenido suerte de tener acceso a inversores maravillosos y queríamos devolver el favor con este proyecto. Me divierto hablando con Satya AI en cualquier momento, y he escuchado comentarios excelentes de ejecutivos que han utilizado los VC de IA para todo, desde consejos sobre cómo hacer una hoja de ruta de producto hasta qué modelo de precios utilizar.
Nos encanta mostrar en lugar de contar, y este proyecto realmente destaca el poder de nuestras capacidades de RAG/conocimiento base. Incluso tuvimos a dos de nuestros inversores que dieron a sus padres el visto bueno.
Pero una palabra de sabiduría: no puedes delegar la toma de decisiones a asesores, y una de las partes más difíciles de ser un ejecutivo es decidir entre dos opciones malas o incluso demasiadas opciones buenas.
¿Dependen estos agentes de inversores de conocimiento de startup generalizado, o están entrenados en consejos y filosofías específicas de la empresa vinculados al VC individual?
Todos los agentes de IA tienen algún conocimiento genérico del entrenamiento de LLM. Pero para obtener los resultados que necesitábamos, subimos los escritos prolíficos de los inversores a las bases de conocimiento de los agentes de IA respectivos.
Más allá de eso y el clonado de voces, creo que también logramos capturar algo de la personalidad o esencia única de los inversores, como la positividad de Jake Saper o la ebullición de Alexa Von Tobel.
Mirando hacia adelante, ¿cómo ves que evoluciona la IA de Regal—¿veremos más toma de decisiones autónoma, más inteligencia emocional o incluso soporte multimodal?
La parte más emocionante del último año ha sido ver que nuestros agentes de IA funcionan mejor que los agentes humanos. Creo que en el próximo año, las mejoras en los modelos de IA subyacentes y los avances en la aplicación de Regal darán como resultado agentes de IA que son indistinguibles de los humanos, y más importante aún, que superan las capacidades de los agentes humanos. Las empresas que se inclinan hacia los agentes de IA reducirán sus costos y mejorarán la experiencia del cliente más rápido de lo que nadie anticipó.
Gracias por la gran entrevista, los lectores que deseen aprender más pueden visitar Regal.












