Entrevistas
Richard White, Fundador y CEO de Fathom – Serie de Entrevistas

Richard White, Fundador y CEO de Fathom, es un empresario repetido y enfocado en productos que se conoce por convertir frustraciones personales en software que define categorías. Antes de Fathom, fundó y dirigió UserVoice durante casi 13 años, convirtiéndolo en una plataforma de gestión de comentarios rentable utilizada por miles de empresas que van desde startups hasta empresas como Microsoft, y también pionero en la ahora ubicua pestaña “Comentarios” del sitio web. Al comienzo de su carrera, construyó y ejecutó SlimTimer completamente solo durante más de una década, lideró proyectos de código abierto influyentes como AjaxScaffold en el ecosistema Ruby on Rails, y trabajó como Líder de Diseño de Producto en Kiko (YC S05), experiencias que colectivamente dieron forma a su filosofía sobre usabilidad, empatía del cliente y construcción de herramientas que mejoran silenciosamente pero de manera significativa cómo trabajan los equipos.
Fathom, fundada en 2020, refleja la misma ética al abordar un punto de dolor universal: la sobrecarga cognitiva de tomar notas mientras se intenta tener conversaciones reales. La plataforma graba, transcribe y resume automáticamente las reuniones, lo más notable en Zoom, lo que permite a los usuarios resaltar momentos en tiempo real, compartir clips cortos en lugar de notas crudas y preservar la sutileza que a menudo se pierde en resúmenes escritos. A medida que Fathom ha madurado, ha evolucionado más allá de la simple transcripción hacia un sistema de registro ligero para conversaciones, diseñado para ayudar a los equipos a retener el contexto, aprender de las llamadas de los clientes y colaborar de forma asíncrona sin agregar fricción a la reunión en sí.
Has pasado los últimos 15 años construyendo empresas que cambian la forma en que las personas se comunican, desde UserVoice hasta Fathom. ¿Cuál fue el momento que te llevó a fundar Fathom, y cómo tus raíces en ingeniería y diseño de productos dieron forma a la empresa desde el primer día?
Mi inspiración para fundar Fathom surgió a principios de 2020. Era pre-pandémico, pero estaba realizando una investigación de usuarios extensiva para un producto y de repente me encontré sentado en 15 o 20 reuniones de Zoom seguidas al día. Seis semanas de eso me hicieron consciente de lo doloroso que era la experiencia. No puedo hablar y teclear al mismo tiempo, miraba mis notas dos semanas después y no recordaba qué conversación era cuál. El problema más grande era que haría toda esta investigación y luego compartiría unos puntos con mi equipo y no aterrizaría. Todo se perdía en la traducción. Fue un momento de “golpearme el dedo del pie” para mí: algo que, si sucede una vez al mes, lo ignoras. Te golpeas el dedo del pie con algo todos los días, múltiples veces al día, muy rápidamente tratas de arreglarlo.
Mi fondo en ingeniería y diseño ambos informaron las decisiones que tomé mientras construía Fathom. Siempre me he acercado a los problemas tomando conceptos que ya existen y haciéndolos radicalmente más utilizables para una audiencia mucho más grande. Con Fathom, tuve esta idea de que la tecnología de transcripción se estaba volviendo comoditizada, había una proliferación de soluciones de estantería que no existían cinco años antes. Así que la transcripción fue parte de la solución, pero no era la solución en sí.
Desde una perspectiva de diseño de productos, me di cuenta de que las transcripciones pueden ser valiosas para las personas que estaban en la llamada. Pero no son muy útiles para las personas que no estaban allí. Lo que encontramos mucho más impactante fue mostrarles el clip de video de 30 segundos del cliente objetando sobre el precio o haciendo esa pregunta técnica. Usamos la transcripción casi como un índice para encontrar el clip de audio-vídeo real. Ese pensamiento de producto, entender los trabajos que se deben hacer, no solo la tecnología, vino directamente de mis raíces en diseño.
Fathom se creó en 2020, mucho antes de que la mayoría de las empresas estuvieran pensando seriamente en flujos de trabajo nativos de IA. ¿Qué ventajas te dio construir con IA en el núcleo, en lugar de volver a equiparla?
La ventaja clave fue la libertad arquitectónica. Podíamos diseñar cada sistema, desde las tuberías de datos hasta la experiencia del usuario, asumiendo que la IA sería una capa fundamental y no una característica agregada. La mayoría de los competidores en 2020 y 2021 estaban contratando a expertos en lingüística y especialistas en ML para construir sus propios modelos. Tomamos el enfoque opuesto porque creíamos que los ganadores en el espacio serían aquellos que podrían aplicar la IA de manera efectiva para resolver problemas reales, no aquellos que construyeron los modelos ellos mismos. Esa visión contraria nos permitió permanecer ágiles con un equipo más pequeño y enfocar nuestros recursos de ingeniería en los problemas de infraestructura difíciles, como la grabación confiable en varias plataformas, la mecánica de distribución viral y el procesamiento en tiempo real a escala.
Aquí está la cosa sobre comenzar en 2020: la IA no era lo suficientemente buena todavía. Sabíamos eso. Pero también sabíamos que si esperábamos a que la IA madurara antes de construir la empresa, estaríamos dos o tres años demasiado tarde. La puerta estaría muy abierta, y todos se precipitarían. Así que construimos todo lo demás primero, la infraestructura, los canales de distribución, la experiencia del usuario, con la expectativa explícita de que cuando la IA estuviera allí, la podríamos integrar como un nuevo motor en un coche. Esa decisión pagó masivamente. Cuando GPT-4 y Claude llegaron en 2022-2023, pudimos integrarlos de inmediato. Los competidores que habían pasado años construyendo tuberías de NLP personalizadas tuvieron que repensar toda su pila. Solo actualizamos nuestros modelos y seguimos enviando.
Construir IA-nativo también cambió fundamentalmente nuestro proceso de desarrollo de productos. El software tradicional tiene una hoja de ruta bastante lineal: decides qué construir, lo construyes y lo envías. Con la IA, usamos lo que llamo un “modelo de Jenga”. Cada bloque representa una posible capacidad de IA. Si empujamos un bloque y obtenemos resistencia porque los modelos no son lo suficientemente buenos todavía, intentamos uno diferente. Sabemos que en seis meses, la tecnología mejorará y podremos regresar a eso. Esto nos evita forzar características antes de que estén listas, mientras nos aseguramos de que siempre estemos enviando valor.
La otra ventaja fue la credibilidad. Sí, los inversores me dijeron que no pusiera “IA” en nuestro nombre en 2020, pero ser temprano nos dio autenticidad. No estábamos saltando a una tendencia; estábamos apostando por una tesis antes de que se volviera obvio. Eso nos posicionó como constructores, no como seguidores rápidos.
Has descrito las conversaciones de las reuniones como una de las fuentes de datos más pasadas por alto dentro de las organizaciones. ¿Qué te convenció de que este era el próximo gran frente para la IA?
Me di cuenta de que nunca había conocido a un vendedor que tenga ocho horas al día para escuchar todas las reuniones de su equipo, y ni hablar de tomar decisiones y capacitar a su equipo basándose en lo que han escuchado. Las reuniones generan datos increíblemente valiosos, pero son completamente inaccesibles a escala. Con las reuniones tradicionales, nos deshacemos del 99% del contenido, mientras que el último 1% de notas va al CRM. Luego tratamos de extrapolar hacia atrás desde allí qué pasará con nuestro negocio. Es un proceso absurdo. La información que realmente importa, el tono de la voz del cliente, la objeción específica que planteó, la mención competitiva que surgió, todo se filtra a través de las notas apresuradas de alguien y pierde todo el contexto.
Lo que me convenció de que este era el próximo gran frente fue reconocer que este “datos oscuros de conversación” es en realidad la señal más rica de lo que está sucediendo en una organización. Estás obteniendo información en tiempo real sobre puntos de dolor del cliente, brechas de producto, amenazas competitivas y necesidades de capacitación, todo en las propias palabras de las personas. Cuando un cliente explica por qué necesita una característica, eso es mucho más valioso que el resumen de un representante de ventas en un campo de CRM.
El avance con la IA es que finalmente podemos aprovechar estos datos a escala. Cuando lanzamos por primera vez Ask Fathom, podía responder preguntas sobre reuniones individuales. Luego lo mejoramos para manejar pequeños grupos de reuniones. Ahora es lo suficientemente inteligente como para entender el conjunto de reuniones de toda la empresa. Los líderes de ventas pueden preguntar, “¿Qué competidores están tendiendo hacia arriba más recientemente? Muéstrame algunos clips.” Los equipos de ingeniería pueden consultar, “Díganos la historia de los motores de transcripción en Fathom” y obtener un documento sintetizado de seis páginas que extrae de cuatro años de reuniones de ingeniería.
Está comenzando a ser un cerebro mucho más grande que realmente entiende qué está haciendo su negocio y las conversaciones que está teniendo. Puedes imaginar un mundo pronto donde una IA puede decirte qué características debes construir a continuación basándose en lo que ayudaría a cerrar la mayoría de los tratos, o qué competidores están surgiendo, o qué brechas de capacitación existen en todo tu equipo. Hay esta fuente de datos increíble que la IA está explotando para darte entradas para tu próxima reunión de estrategia o proceso de creación de mapas.
Muchos usuarios citan a Fathom como transformador para mantenerse presente durante las reuniones. ¿Cómo equilibras la automatización con la preservación del flujo natural de la conversación humana?
Esto ha sido fundamental en nuestra filosofía de diseño desde el principio. El objetivo no es que la IA te diga qué hacer en una reunión, sino más bien darte información que te ayude a ser más presente y eficaz en tus conversaciones.
Somos cuidadosos con lo que automatizamos y lo que no. No lanzamos características hasta que sabemos que podemos hacerlas realmente bien. Esto a veces significa que no somos los primeros en llegar al mercado con ciertas capacidades, pero cuando las lanzamos, funcionan y entregan un valor genuino. Hemos sido cautelosos al perseguir cosas como la grabación de llamadas telefónicas o la captura de reuniones en la sala a pesar de las frecuentes solicitudes. Preferimos destacarnos en lo que hacemos antes que lanzar una experiencia mediocre que interrumpa el flujo natural de la conversación.
En última instancia, nuestros usuarios nos dicen que estamos logrando el equilibrio correcto: dicen que están ahorrando 6+ horas a la semana y moviéndose 3 veces más rápido desde la información hasta los próximos pasos; el 95% informa que Fathom los mantiene presentes en las reuniones. Esto confirma que estamos aumentando la capacidad humana, no reemplazándola.
Fathom atrajo a más de 1.300 inversores de usuarios en su Serie A, un raro signo de confianza a nivel de producto. ¿Qué crees que resonó tan fuertemente con los usuarios cotidianos?
Por un lado, damos una producto gratuito realmente robusto: reuniones ilimitadas, cinco resúmenes de IA por mes. Dos tercios de nuestros usuarios nunca nos pagan un dólar, y estamos completamente bien con eso. No es un juego de SaaS típico. Nuestros usuarios ven que no estamos tratando de extraer valor de ellos en cada giro. Estamos enfocados en hacer que la vida de los contribuyentes individuales sea mejor de forma gratuita, y monetizamos vendiendo herramientas de gestión a sus jefes, paneles de coaching, inteligencia entre reuniones y información competitiva. El producto simplemente funciona, y sigue funcionando ya sea que pagues o no. Eso crea confianza genuina.
Nuestro crecimiento es casi enteramente de boca a boca, hemos crecido más como una plataforma de redes sociales que como software B2B tradicional. Nuestros usuarios son nuestros defensores y canal de distribución. Dejar que se conviertan en inversores simplemente reconoce lo que ya es cierto: son socios en esta misión.
También creo que hay una resonancia más profunda alrededor del problema que estamos resolviendo. Todos han experimentado el dolor de estar en una reunión, tratando de estar presentes y viendo a alguien teclear frenéticamente en lugar de participar. Todos han necesitado información de una reunión en la que no estaban y han obtenido un resumen inútil de dos líneas. El problema es universal, y la solución se siente casi mágica cuando funciona bien. Los usuarios invierten porque quieren que este futuro exista, no solo para ellos, sino para todos con los que trabajan.
Tu fondo incluye la construcción de UserVoice, que ayudó a definir cómo las empresas gestionan los comentarios de los clientes. ¿Cómo esa experiencia influyó en tu pensamiento sobre la memoria organizacional y los flujos de conocimiento impulsados por IA?
UserVoice me enseñó que la información más valiosa en las empresas a menudo está más dispersa. Los comentarios de los clientes estaban en todas partes. Estaban enterrados en tickets de soporte, correos electrónicos reenviados y conversaciones de ventas aleatorias. Las empresas tenían miles de puntos de datos sobre lo que los clientes querían, pero no había forma de sintetizarlo en decisiones estratégicas. Construimos infraestructura para agregar esos comentarios a escala y hacerlos accesibles para las personas que toman decisiones de productos.
El paralelo con Fathom es claro, pero el espacio de problemas es más profundo. Las reuniones son exponencialmente más dispersas que los comentarios de los clientes. Cada organización tiene cientos o miles de horas de conversaciones que ocurren cada semana. Lo que aprendí de UserVoice es que la captura es necesaria, pero no es suficiente. No puedes simplemente agregar información; necesitas construir inteligencia sobre lo que importa y enrutarlo a las personas adecuadas. Con UserVoice, construimos sistemas de votación, algoritmos de tendencia y paneles de administrador para que los equipos de productos puedan separar la señal de ruido. Con Fathom, estamos construyendo IA que entiende el contexto a través de conversaciones y puede surfacear proactivamente información: “Cinco clientes mencionaron este caso de uso este mes”, o “Tu equipo sigue quedándose atascado en esta objeción”.
La otra lección fue sobre la democratización. UserVoice hizo que fuera posible para cualquier cliente proporcionar comentarios, no solo los más ruidosos que podían obtener a los ejecutivos en el teléfono. Con Fathom, estamos democratizando el acceso a la inteligencia de las reuniones. En nuestro caso de estudio con Netgain, su gerente de operaciones estaba pasando 7,5 horas al día solo respondiendo preguntas básicas sobre lo que estaba sucediendo en las llamadas de ventas. Eso es absurdo. La información existía, pero estaba atrapada en las cabezas de las personas y en notas dispersas.
El futuro de la memoria organizacional está moviéndose desde estos silos de conocimiento aislados, CRM, documentos, sistemas de comentarios, hacia inteligencia conversacional conectada. Esa es la evolución lógica de lo que comenzamos a construir con UserVoice, pero la IA hace que sea posible hacerlo con la total fidelidad de la conversación humana, no solo con datos estructurados.
Las herramientas de IA basadas en Zoom estallaron después de 2020. En tu opinión, ¿qué diferencia a un asistente de IA realmente útil de uno que solo agrega ruido?
Siempre les digo a las personas que solo hay dos cosas que pueden hundir realmente a un asistente de IA para reuniones: si el producto no es confiable, o si la salida de IA es basura. Creo que hubo mucha mercadotecnia de IA en la generación anterior donde era fácil prometer cosas mágicas, pero luego la realidad resultó ser tonterías. Siempre hemos tratado de asegurarnos de que tengamos un producto de alta calidad y confiable que haga lo que promete. Nuestros diferenciales clave son:
- Precisión de la transcripción. Fathom se considera la transcripción más precisa de allí. La mayoría de las herramientas aprovechan un servicio de transcripción de terceros, mientras que construimos nuestra propia tecnología de transcripción propietaria en casa. Si tu transcripción es mala, todo desde un componente de IA se arruina porque todo proviene de la transcripción.
- Confiabilidad e infraestructura. Cuando te unes a una reunión, a menudo estás apurado o estresado. Muchas de estas otras herramientas tendrían bots que se unen a las reuniones pero luego no grabarían, o la grabación fallaría. Existimos casi a nivel de sistema en tiempo real, estás trabajando en algo que está un paso detrás de la aviónica. Si no funciona dos veces, el usuario se va. No es como el SaaS tradicional donde puedes estar abajo ocasionalmente.
- IA que entiende la sutileza y el contexto. El lenguaje empresarial puede ser muy sutil. Recuerdo haber dirigido el equipo de ventas en UserVoice y haber leído las notas de las personas, pensando: “Necesito escuchar cómo lo dijeron realmente”. La IA necesita capturar no solo lo que se dijo, sino el tono, la vacilación y el entusiasmo (o la falta de él). Eso es por qué enlazamos cada punto de resumen con el momento real en la grabación.
- Personalización sin complejidad. La IA debe adaptarse a tu negocio, no al revés. Los equipos de ventas deben poder modificar plantillas para que coincidan con sus metodologías específicas, MEDDIC, Challenger, SPICED, lo que uses. Pero esto no puede requerir un título en ciencia de datos. Simplemente necesita funcionar.
Fathom convierte el contenido de las reuniones en conocimiento accionable. ¿Cuán cerca estamos de los sistemas de IA que funcionan como motores de flujo de trabajo reales, conectando conversación, decisiones y tareas descendentes automáticamente?
Creo que estamos más cerca de lo que la mayoría de las personas piensa. Right now, estamos moviéndonos hacia un mundo donde Fathom hace más y más del trabajo por ti. El primer paso es simplemente obtener la información donde quieras que vaya. El siguiente paso, que no está lejos, es tener la IA que realmente hace el trabajo por ti.
Ya estamos viendo versiones tempranas de esto. Nuestra integración con Asana toma elementos de acción de las reuniones y crea tareas rastreables automáticamente. Fathom no quiere crear una solución de gestión de tareas, hay muchas grandes allí, como Asana. Así que estamos construyendo integraciones que empujan los resultados de las reuniones directamente a las herramientas que la gente ya usa para hacer el trabajo.
En el lado del CRM, empujamos campos estructurados automáticamente a Salesforce y HubSpot. En un caso de estudio, esto ahorró 20 a 30 minutos por actualización del estado de la venta y condujo a una precisión casi perfecta en la previsión de fin de mes. Eso es un motor de flujo de trabajo en acción: la conversación sucede, la IA extrae los datos comerciales clave y luego fluye automáticamente a tu sistema de registro sin que nadie teclee nada.
Pero creo que el verdadero avance es el que viene con lo que llamo alertas y enrutamiento inteligentes basados en semántica. Imagina ser un gerente o líder de ventas y obtener un resumen destacado diario donde la IA ha encontrado cada discusión de precios que salió mal, o cada bloqueo de producto que surgió en una llamada de renovación. Si eres un gerente de ingeniería, verás cada debate acalorado entre tus ingenieros. La IA puede entender el tono y la sutileza ahora, no solo palabras clave, así que sabe qué momentos realmente te importan.
A medida que las empresas crecen, luchan con el conocimiento distribuido y la decadencia de la información. ¿Cómo ves a la IA abordando la brecha entre lo que los equipos discuten y lo que realmente se ejecuta?
Esto es uno de los problemas más críticos que estamos resolviendo. Hay dos grupos que realmente podemos ayudar: las personas en la reunión que tratan de tomar notas y estar presentes, y la gestión, el liderazgo y los fundadores que no están en la reunión pero están dirigiendo equipos y tratando de entender qué está sucediendo. Ese segundo grupo es donde el problema de conocimiento distribuido realmente golpea.
El problema central es la visibilidad. Cuando cualquier persona en una empresa quiere saber el estado de un trato o qué está sucediendo con un cliente, tradicionalmente no hay un lugar fácil para encontrar esa información. Llaman al equipo de ventas, forzando a los representantes a pasar 20-30 minutos excavando en notas. Durante los períodos pico, algunos gerentes de operaciones reciben 15 solicitudes diarias, eso es 7,5 horas pasadas en recuperación de información en lugar de actividades de valor agregado.
La IA puede comenzar a conectar puntos a través de conversaciones que ningún ser humano podría rastrear. Ese tipo de reconocimiento de patrones a través de conversaciones distribuidas es cómo se previene la decadencia del conocimiento y realmente se convierten las conversaciones en inteligencia estratégica.
Mirando hacia adelante cinco años, ¿cómo anticipas que la inteligencia de las reuniones evolucione, y qué papel ves que la IA desempeñe en el futuro de la memoria organizacional, la toma de decisiones y la colaboración?
En cinco años, creo que miraremos hacia atrás en las herramientas de inteligencia de reuniones de hoy de la misma manera que ahora miramos hacia los primeros smartphones: impresionantes para su época, pero primitivos en comparación con lo que se volvió posible.
La primera gran evolución es moverse desde la toma de notas hasta la automatización real del flujo de trabajo. Imaginamos un futuro donde solo decir algo en una reunión puede hacer que suceda, sin el trabajo posterior a la reunión. Right now, si dices en una reunión, “Vamos a crear un spec para esta característica y programar una reunión de seguimiento con ingeniería la próxima semana”, todavía tienes que crear manualmente ese documento y enviar esa invitación al calendario. En cinco años, la IA hará todo eso automáticamente. Lo dices, y sucede. Con la IA creando las tareas, los specs y los documentos, las personas pueden enfocarse en el trabajo que realmente requiere creatividad y juicio humanos.
La segunda evolución es expandirse desde las reuniones con clientes a todas las reuniones. Right now nos enfocamos en reuniones externas: ventas, éxito del cliente, agencias que se reúnen con clientes. Pero nuestro objetivo en los próximos 12 a 18 meses es hacer que Fathom sea la plataforma que puedes usar en toda tu organización, no solo en los equipos que se enfrentan a los clientes. Estamos construyendo grabaciones sin bot que pueden capturar cualquier conversación, incluidas reuniones en Slack y reuniones en persona. Está evolucionando hacia ser capaz de capturar cualquier conversación que estés teniendo en tu empresa, sin importar el medio.
Las empresas que salgan a la cabeza serán aquellas que traten los datos conversacionales como un ciudadano de primera clase, tan importante como sus datos de CRM, análisis y documentos. Porque en última instancia, el conocimiento más importante en cualquier organización no está en los sistemas; está en las conversaciones. La IA finalmente está haciendo que sea posible aprovechar eso.
Gracias por la gran entrevista, los lectores que deseen aprender más sobre esta aplicación de toma de notas deben visitar Fathom.












