Entretiens
Richard White, Fondateur & PDG de Fathom – Série d’entretiens

Richard White, Fondateur & PDG de Fathom, est un entrepreneur répétitif et axé sur les produits, connu pour avoir transformé des frustrations personnelles en logiciels définissant des catégories. Avant Fathom, il a fondé et dirigé UserVoice pendant près de 13 ans, la développant en une plate-forme de gestion de rétroaction rentable utilisée par des milliers d’entreprises, allant des startups aux entreprises comme Microsoft, tout en créant l’onglet “Rétroaction” sur les sites Web, devenu omniprésent. Plus tôt dans sa carrière, il a construit et exploité SlimTimer entièrement seul pendant plus de dix ans, a dirigé des projets open-source influents tels que AjaxScaffold dans l’écosystème Ruby on Rails et a travaillé en tant que responsable de la conception de produits chez Kiko (YC S05), expériences qui ont collectivement façonné sa philosophie autour de l’utilisabilité, de l’empathie client et de la construction d’outils qui améliorent discrètement mais de manière significative la façon dont les équipes travaillent.
Fondé en 2020, Fathom reflète la même éthique en abordant un point de douleur universel : la surcharge cognitive de la prise de notes tout en essayant d’avoir de vraies conversations. La plate-forme enregistre, transcrit et résume automatiquement les réunions – notamment sur Zoom – permettant aux utilisateurs de mettre en évidence des moments en temps réel, de partager de courtes clips au lieu de notes brutes et de préserver la nuance qui se perd souvent dans les résumés écrits. À mesure que Fathom a mûri, il est allé au-delà de la simple transcription pour devenir un système d’enregistrement léger pour les conversations, conçu pour aider les équipes à conserver le contexte, à apprendre des appels de clients et à collaborer de manière asynchrone sans ajouter de friction à la réunion elle-même.
Vous avez passé les 15 dernières années à construire des entreprises qui redéfinissent la façon dont les gens communiquent – de UserVoice à Fathom. Quel a été le moment qui vous a poussé à fonder Fathom, et comment vos racines d’ingénierie et de conception de produits ont-elles façonné l’entreprise dès le premier jour ?
Mon inspiration pour fonder Fathom est venue au début de 2020. C’était avant la pandémie, mais je faisais une recherche utilisateur approfondie pour un produit et je me suis retrouvé à passer 15 ou 20 réunions Zoom d’affilée par jour. Six semaines de cela m’ont rendu conscient de la douleur que cette expérience pouvait causer. Je ne peux pas parler et taper en même temps – je regardais mes notes deux semaines plus tard et je ne me souvenais pas de quelle conversation il s’agissait. Le plus gros problème était que je faisais toute cette recherche et que je partageais ensuite quelques points avec mon équipe, mais que tout se perdait en traduction. C’était un moment de « meurtrir le pied » pour moi : quelque chose qui, s’il se produit une fois par mois, on l’ignore. Vous vous meurtrissez le pied sur quelque chose tous les jours, plusieurs fois par jour, vous essayez très vite de le réparer.
Mes antécédents en ingénierie et en conception de produits ont tous deux éclairé les choix que j’ai faits pendant la construction de Fathom. J’ai toujours abordé les problèmes en prenant des concepts qui existent déjà et en les rendant radicalement plus utilisables pour un public beaucoup plus large. Avec Fathom, j’ai eu cette idée que la technologie de transcription devenait commodifiée – il y avait une prolifération de solutions sur étagère qui n’existaient pas il y a cinq ans. La transcription faisait donc partie de la solution, mais ce n’était pas la solution elle-même.
D’un point de vue de conception de produits, j’ai réalisé que les transcriptions peuvent être précieuses pour les personnes qui étaient sur l’appel. Mais elles ne sont vraiment pas utiles aux personnes qui n’y étaient pas. Ce que nous avons trouvé beaucoup plus percutant, c’était de montrer une clip vidéo de 30 secondes du client objectant sur le prix ou posant une question technique. Nous utilisons la transcription presque comme une table des matières pour trouver la véritable clip audio-vidéo. Cette pensée produit – comprendre les tâches à accomplir, et non seulement la technologie – est venue directement de mes racines en conception.
Fathom a été créé en 2020, bien avant que la plupart des entreprises ne pensent sérieusement aux flux de travail natifs AI. Quels avantages avoir construit avec l’IA au cœur – plutôt que de la rétroéquiper – vous a-t-il donnés dès le départ ?
L’avantage clé était la liberté architecturale. Nous pouvions concevoir chaque système, des pipelines de données à l’expérience utilisateur, en supposant que l’IA serait une couche fondamentale et non une fonctionnalité greffée. La plupart de nos concurrents en 2020 et 2021 embauchaient des experts en linguistique et des spécialistes en ML pour construire leurs propres modèles. Nous avons pris la direction opposée parce que nous croyions que les gagnants dans l’espace seraient ceux qui pourraient appliquer l’IA de manière efficace pour résoudre de vrais problèmes, et non ceux qui construisaient les modèles eux-mêmes. Cette vision contraire nous a permis de rester agiles avec une équipe plus petite et de concentrer nos ressources d’ingénierie sur les problèmes d’infrastructure difficiles – enregistrement fiable sur les plateformes, mécanismes de distribution virale, traitement en temps réel à grande échelle.
Voici la chose à propos du démarrage en 2020 : l’IA n’était pas encore suffisamment bonne. Nous le savions. Mais nous savions aussi que si nous attendions que l’IA mûrisse avant de construire l’entreprise, nous serions en retard de deux à trois ans. La porte serait grande ouverte, et tout le monde se précipiterait à l’intérieur. Nous avons donc construit tout le reste d’abord – l’infrastructure, les canaux de distribution, l’expérience utilisateur – avec l’attente explicite que lorsque l’IA serait prête, nous pourrions la intégrer comme un nouveau moteur dans une voiture. Cette décision a payé énormément. Lorsque GPT-4 et Claude sont arrivés en 2022-2023, nous pouvions les intégrer immédiatement. Les concurrents qui avaient passé des années à construire des pipelines NLP personnalisés devaient suddenly repenser toute leur pile.
Construire avec l’IA native a également fondamentalement changé notre processus de développement de produits. Le logiciel traditionnel a une feuille de route pretty linéaire : Vous décidez ce que vous allez construire, vous le construisez et vous le livrez. Avec l’IA, nous utilisons ce que j’appelle un “modèle Jenga”. Chaque bloc représente une capacité AI potentielle. Si nous poussons sur un bloc et que nous rencontrons une résistance parce que les modèles ne sont pas encore suffisamment bons, nous essayons un autre. Nous savons que dans six mois, la technologie va s’améliorer et que nous pourrons revenir à cela. Cela nous empêche de forcer les fonctionnalités avant qu’elles ne soient prêtes, tout en nous assurant que nous livrons toujours de la valeur.
L’autre avantage était la crédibilité. Oui, les investisseurs m’ont dit de ne pas mettre “IA” dans notre nom en 2020, mais être tôt nous a donné de l’authenticité. Nous n’étions pas en train de sauter sur une tendance ; nous parions sur une thèse avant qu’elle ne devienne évidente. Cela nous a positionnés en tant que constructeurs, et non en suivant rapidement les tendances.
Vous avez décrit les conversations de réunion comme l’une des sources de données les plus négligées au sein des organisations. Qu’est-ce qui vous a convaincu que c’était la prochaine grande frontière pour l’IA ?
Je me suis rendu compte que je n’avais jamais rencontré un représentant des ventes qui avait huit heures par jour pour écouter toutes les réunions de son équipe, et encore moins prendre des décisions et coacher son équipe sur ce qu’il avait entendu. Les réunions génèrent des données incroyablement précieuses, mais elles sont complètement inaccessibles à grande échelle. Avec les réunions traditionnelles, nous jetons 99 % du contenu, tandis que les derniers 1 % des notes vont dans le CRM. Ensuite, nous essayons de déduire à rebours ce qui va se passer avec nos affaires. C’est un processus absurde. Les informations qui comptent vraiment – le ton de la voix d’un client, l’objection spécifique qu’il a soulevée, la mention concurrentielle qui est apparue – tout cela est filtré à travers les notes hâtivement tapées de quelqu’un et perd tout contexte.
Ce qui m’a convaincu que c’était la prochaine frontière était de reconnaître que ces “données sombres de conversation” sont en fait le signal le plus riche de ce qui se passe dans une organisation. Vous obtenez des informations en temps réel sur les points de douleur des clients, les lacunes de produits, les menaces concurrentielles et les besoins de formation – tout dans les mots des gens. Lorsqu’un client explique pourquoi il a besoin d’une fonctionnalité, c’est beaucoup plus précieux qu’un résumé d’un représentant des ventes dans un champ CRM.
La percée avec l’IA est qu’on peut enfin exploiter ces données à grande échelle. Lorsque nous avons lancé Ask Fathom, il pouvait répondre à des questions sur des réunions individuelles. Ensuite, nous l’avons amélioré pour gérer de petits groupes de réunions. Maintenant, il est suffisamment intelligent pour comprendre l’ensemble des réunions de votre entreprise. Les leaders des ventes peuvent demander : “Quels concurrents sont les plus tendance ces derniers temps ? Montrez-moi quelques clips.” Les équipes d’ingénierie peuvent interroger : “Dites-nous l’historique des moteurs de transcription chez Fathom” et obtenir un document synthétisé de six pages en tirant de quatre ans de réunions d’ingénierie.
C’est en train de devenir un cerveau beaucoup plus grand qui comprend vraiment ce que fait votre entreprise et les conversations qu’elle a. Vous pouvez imaginer un monde où un IA peut vous dire quels fonctionnalités vous devriez construire ensuite sur la base de ce qui aiderait à conclure le plus de deals, ou quels concurrents sont en train de monter, ou quels lacunes de formation existent au sein de votre équipe. Il y a cette source de données incroyable que l’IA est en train de miner pour vous donner des entrées dans votre prochaine réunion de stratégie ou de planification.
De nombreux utilisateurs citent Fathom comme étant transformateur pour rester présent lors des réunions. Comment équilibrez-vous l’automatisation avec la préservation du flux naturel de la conversation humaine ?
Ceci a été fondamental dans notre philosophie de conception dès le début. L’objectif n’est pas d’avoir l’IA vous dire quoi faire dans une réunion, mais plutôt de vous donner des informations qui vous aident à être plus présent et efficace dans vos conversations.
Nous sommes prudents sur ce que nous automatisons et ce que nous n’automatisons pas. Nous ne lancerons pas de fonctionnalités jusqu’à ce que nous sachions que nous pouvons les faire vraiment bien. Cela signifie parfois que nous ne sommes pas les premiers sur le marché avec certaines capacités, mais lorsque nous lançons quelque chose, cela fonctionne et apporte une valeur réelle. Nous avons été prudents dans la poursuite de choses comme l’enregistrement d’appels téléphoniques ou de certaines réunions en salle malgré les demandes fréquentes. Nous préférons exceller dans ce que nous faisons plutôt que de lancer une expérience médiocre qui perturbe le flux naturel de la conversation.
Finalement, nos utilisateurs nous disent que nous trouvons un équilibre approprié : Ils disent qu’ils économisent 6 heures ou plus par semaine et avancent 3 fois plus vite de l’insight à la prochaine étape ; 95 % rapportent que Fathom les maintient présents dans les réunions. Cela confirme que nous augmentons les capacités humaines, sans les remplacer.
Fathom a attiré plus de 1 300 investisseurs-utilisateurs dans son tour de table A – un signe rare de confiance au niveau du produit. Qu’est-ce qui a résonné si fortement avec les utilisateurs quotidiens ?
Tout d’abord, nous offrons un produit gratuit réellement robuste : réunions illimitées, cinq résumés AI par mois. Les deux tiers de nos utilisateurs ne nous paient jamais un centime, et nous sommes tout à fait d’accord avec cela. Ce n’est pas un jeu de SaaS typique. Nos utilisateurs voient que nous n’essayons pas de leur extorquer de la valeur à chaque tour. Nous nous concentrons sur l’amélioration de la vie des contributeurs individuels gratuitement, et nous monétisons en vendant des outils de gestion à leurs patrons – tableaux de bord de coaching, intelligence de réunion croisée et informations concurrentielles. Le produit fonctionne, et il continue à fonctionner que vous payiez ou non. Cela crée une confiance réelle.
Notre croissance est presque entièrement bouche à oreille – nous avons grandi plus comme une plate-forme de médias sociaux que comme un logiciel B2B traditionnel. Nos utilisateurs sont nos avocats et notre canal de distribution. Les laisser devenir des investisseurs ne fait que reconnaître ce qui est déjà vrai : Ils sont des partenaires dans cette mission.
Je pense également qu’il y a une résonance plus profonde autour du problème que nous résolvons. Tout le monde a vécu la douleur d’être dans une réunion, d’essayer d’être présent et de regarder quelqu’un taper frénétiquement à la place de s’engager. Tout le monde a eu besoin d’informations provenant d’une réunion à laquelle il n’a pas assisté et a obtenu un résumé inutile de deux lignes. Le problème est universel, et la solution semble presque magique lorsqu’elle fonctionne bien. Les utilisateurs investissent parce qu’ils veulent que cet avenir existe – pas seulement pour eux-mêmes, mais pour tous ceux avec qui ils travaillent.
Votre expérience comprend la construction de UserVoice, qui a aidé à définir la façon dont les entreprises gèrent les rétroactions des clients. Comment cette expérience a-t-elle influencé votre réflexion sur la mémoire organisationnelle et les flux de connaissances alimentés par l’IA ?
UserVoice m’a appris que les informations les plus précieuses dans les entreprises sont souvent les plus dispersées. Les rétroactions des clients étaient partout. Elles étaient enfouies dans les tickets de support, les e-mails transférés et les conversations de vente aléatoires. Les entreprises avaient des milliers de points de données sur ce que les clients voulaient, mais pas de moyen de les synthétiser en décisions stratégiques. Nous avons construit une infrastructure pour agréger ces rétroactions à grande échelle et les rendre accessibles aux personnes prenant des décisions de produits.
Le parallèle avec Fathom est clair, mais l’espace de problème est plus profond. Les réunions sont exponentiellement plus dispersées que les rétroactions des clients. Chaque organisation a des centaines ou des milliers d’heures de conversations qui se déroulent chaque semaine. Ce que j’ai appris de UserVoice, c’est que la capture est nécessaire, mais ce n’est pas suffisant. Vous ne pouvez pas simplement agréger des informations ; vous devez construire une intelligence sur ce qui compte et la router vers les bonnes personnes. Avec UserVoice, nous avons construit des systèmes de vote, des algorithmes de tendance et des tableaux de bord d’administration afin que les équipes de produits puissent séparer le signal du bruit. Avec Fathom, nous construisons une IA qui comprend le contexte à travers les conversations et peut proactivement faire surface des insights : “Cinq clients ont mentionné ce cas d’utilisation ce mois”, ou “Votre équipe se bloque toujours sur cette objection”.
L’autre leçon était sur la démocratisation. UserVoice a rendu possible pour n’importe quel client de fournir des rétroactions, et pas seulement les plus bruyants qui pouvaient obtenir des cadres supérieurs au téléphone. Avec Fathom, nous démocratisons l’accès à l’intelligence de réunion. Dans notre étude de cas avec Netgain, leur responsable des opérations passait 7,5 heures par jour à répondre simplement à des questions de base sur ce qui se passait dans les appels de vente. C’est insensé. Les informations existaient, mais elles étaient piégées dans les têtes des gens et dans des notes dispersées.
Le futur de la mémoire organisationnelle est en train de passer de ces silos de connaissances isolés – CRM, documents, systèmes de rétroaction – à une intelligence conversationnelle connectée. C’est l’évolution logique de ce que nous avons commencé à construire avec UserVoice, mais l’IA rend cela possible avec la pleine fidélité de la conversation humaine, et non seulement avec des données structurées.
Les outils basés sur Zoom avec IA ont explosé après 2020. Qu’est-ce qui, selon vous, différencie un véritable assistant IA utile d’un qui ne fait que du bruit ?
Je dis toujours aux gens qu’il n’y a que deux choses qui peuvent vraiment couler un assistant de réunion IA : si le produit n’est pas fiable, ou si la sortie AI est de la mauvaise qualité. Je pense qu’il y a eu beaucoup de marketing IA dans la génération précédente où il était facile de promettre des choses magiques, mais ensuite la réalité est apparue comme du gibberish. Nous avons toujours essayé de nous assurer que nous avons un produit de haute qualité, fiable, qui fait ce qu’il promet. Nos principaux différenciateurs sont :
- Précision de la transcription. Fathom est considéré comme la transcription la plus précise qui existe aujourd’hui. La plupart des outils utilisent un service de transcription tiers, alors que nous avons construit notre propre technologie de transcription propriétaire en interne. Si votre transcription est mauvaise, tout ce qui vient de l’IA est absolument gâché parce que tout provient de la transcription.
- Fiabilité et infrastructure. Lorsque vous rejoignez une réunion, vous êtes souvent pressé ou stressé. Beaucoup de ces autres outils auraient des bots rejoindre des réunions mais ensuite ne pas enregistrer, ou l’enregistrement échouerait. Nous existons presque à un niveau de système en temps réel – vous travaillez sur quelque chose qui est un cran en dessous de l’avionique. Si cela ne fonctionne pas deux fois, l’utilisateur est parti. Ce n’est pas comme le SaaS traditionnel où vous pouvez être en panne occasionnellement.
- IA qui comprend la nuance et le contexte. Le langage des affaires peut être très subtil. Je me souviens d’avoir dirigé l’équipe des ventes chez UserVoice et d’avoir lu les notes des gens, en pensant : “J’ai besoin d’entendre comment ils ont vraiment dit cela”. L’IA doit capturer non seulement ce qui a été dit, mais le ton, l’hésitation et l’excitation (ou le manque d’excitation). C’est pourquoi nous relions chaque point de résumé à l’instant réel de l’enregistrement.
- Personnalisation sans complexité. L’IA devrait s’adapter à votre entreprise, et non l’inverse. Les équipes de vente devraient être en mesure de modifier des modèles pour correspondre à leurs méthodologies spécifiques – MEDDIC, Challenger, SPICED, peu importe ce qu’ils utilisent. Mais cela ne doit pas nécessiter un diplôme en science des données. Il faut que cela fonctionne simplement.
Fathom transforme le contenu de la réunion en connaissances actionnables. À quel point sommes-nous proches de systèmes IA qui fonctionnent comme de véritables moteurs de flux de travail – en connectant la conversation, les décisions et les tâches en aval de manière automatique ?
Je pense que nous sommes plus proches que la plupart des gens ne le réalisent, mais il y a encore des étapes importantes à franchir. Actuellement, nous nous dirigeons vers un monde où Fathom fait de plus en plus de travail pour vous. La première étape est simplement d’obtenir les informations où vous voulez qu’elles aillent. La deuxième étape, qui n’est pas loin, est d’avoir l’IA qui fait réellement le travail pour vous.
Nous voyons déjà des versions préliminaires de cela. Notre intégration Asana prend les éléments d’action des réunions et crée automatiquement des tâches suivies. Fathom ne veut pas créer une solution de gestion de tâches – il y a beaucoup de grandes options là-bas, comme Asana. Nous construisons donc des intégrations qui poussent les résultats de réunion directement dans les outils que les gens utilisent déjà pour faire du travail.
Sur le côté CRM, nous poussons automatiquement des champs structurés – points de douleur, calendriers, principaux décideurs – dans Salesforce et HubSpot. Dans une étude de cas, cela a économisé 20 à 30 minutes par mise à jour de statut d’affaire et a conduit à une précision de prévision presque parfaite à la fin du mois. C’est un moteur de flux de travail en action : La conversation se produit, l’IA extrait les données commerciales clés, puis cela se déplace automatiquement dans votre système d’enregistrement sans que personne n’ait à taper quoi que ce soit.
Mais je pense que la véritable percée est en train d’arriver avec ce que j’appelle les alertes et le routage intelligents basés sur le sémantique. Imaginez être un manager ou un leader des ventes et recevoir un résumé quotidien où l’IA a trouvé toutes les discussions de prix qui ont mal tourné, ou toutes les objections de produit qui ont été soulevées. Si vous êtes un responsable des ingénieries, vous verrez toutes les discussions animées parmi vos ingénieurs. L’IA peut comprendre le ton et la nuance, et non seulement les mots clés, donc elle sait quels moments vous vous souciez vraiment.
À mesure que les entreprises grandissent, elles luttent contre les connaissances distribuées et la dégradation de l’information. Comment voyez-vous l’IA comblant l’écart entre ce que les équipes discutent et ce qui est réellement exécuté ?
C’est l’un des problèmes les plus critiques que nous résolvons. Il y a deux groupes que nous pouvons vraiment aider : les personnes dans la réunion qui essaient de prendre des notes et d’être présentes, et la direction, la direction et les fondateurs qui ne sont pas dans la réunion mais dirigent des équipes et essaient de comprendre ce qui se passe.
Le problème fondamental est la visibilité. Lorsque quelqu’un dans une entreprise veut savoir le statut d’une affaire ou ce qui se passe avec un client, traditionnellement, il n’y a pas d’endroit facile pour trouver ces informations. Ils appellent l’équipe des ventes, forçant les représentants à passer 20-30 minutes à fouiller dans les notes. Pendant les périodes de pointe, certains responsables des opérations reçoivent 15 demandes par jour – cela représente 7,5 heures passées à la récupération d’informations au lieu d’activités à valeur ajoutée.
L’IA peut commencer à relier les points entre les conversations que aucun humain ne peut suivre. Ce type de reconnaissance de modèles à travers les conversations distribuées est la façon dont vous prévenez la dégradation des connaissances et transformez réellement les conversations en intelligence stratégique.
En regardant cinq ans en avant, comment anticipez-vous que l’intelligence de réunion évoluera – et quel rôle voyez-vous l’IA jouer dans le futur de la mémoire organisationnelle, de la prise de décision et de la collaboration ?
Dans cinq ans, je pense que nous regarderons les outils d’intelligence de réunion d’aujourd’hui de la même façon que nous regardons maintenant les premiers smartphones : impressionnants pour leur époque, mais primitifs par rapport à ce qui est devenu possible.
La première grande évolution est le passage de la prise de notes à une véritable automatisation du flux de travail. Nous imaginons un avenir où dire simplement quelque chose dans une réunion peut le faire exister, sans le travail post-réunion. Actuellement, si vous dites dans une réunion : “Créons une spécification pour cette fonctionnalité et planifions un suivi avec l’ingénierie la semaine prochaine”, vous devez encore manuellement créer ce document et envoyer cette invitation de calendrier. Dans cinq ans, l’IA fera tout cela automatiquement. Vous le dites, et cela se produit. Avec l’IA créant les tâches, les spécifications et les documents, les gens peuvent se concentrer sur le travail qui nécessite réellement la créativité et le jugement humains.
La deuxième évolution est l’expansion de l’extérieur à toutes les réunions. Actuellement, nous nous concentrons sur les réunions externes : ventes, réussite client, agences réunies avec des clients. Mais notre objectif pour les 12 à 18 prochains mois est de faire de Fathom la plate-forme que vous pouvez utiliser dans toute votre organisation, et non seulement les équipes orientées client. Nous construisons un enregistrement sans bot qui peut capturer n’importe quelle conversation, y compris les réunions Slack et les réunions en personne. Cela évolue vers la capacité de capturer n’importe quelle conversation que vous avez dans votre entreprise, quelle que soit la plate-forme.
Les entreprises qui émergeront au sommet seront celles qui traitent les données conversationnelles comme un citoyen de première classe – aussi important que leurs données CRM, leurs analyses et leurs documents. Parce que, finalement, les connaissances les plus importantes dans n’importe quelle organisation ne sont pas dans les systèmes ; elles sont dans les conversations. L’IA rend enfin cela possible.












