访谈
理查德·怀特,Fathom 的创始人和 CEO – 采访系列

理查德·怀特,Fathom 的创始人和 CEO,是一位重复创业者和以产品为中心的企业家,以将个人挫折转化为定义类别的软件而闻名。在 Fathom 之前,他创立并领导了 UserVoice 近 13 年,将其发展成为一个盈利的反馈管理平台,成千上万的公司使用它,从初创公司到像微软这样的企业,同时还开创了现在无处不在的网站“反馈”标签。在他的早期职业生涯中,他独自构建和运营了 SlimTimer超过十年,领导了 Ruby on Rails 生态系统中的影响力开源项目,如 AjaxScaffold,并在 Kiko (YC S05) 担任产品设计负责人,这些经历共同塑造了他对可用性、客户同理心和构建工具的哲学,这些工具可以在不显眼的情况下但具有深远意义地改善团队的工作方式。
2020 年成立的 Fathom 体现了同样的理念,通过解决一个普遍的痛点:在尝试进行真正对话的同时记笔记的认知超载。该平台自动记录、转录和总结会议——最值得注意的是在 Zoom 上,允许用户实时突出时刻、分享短片段而不是原始笔记,并保留在书面摘要中经常丢失的细微差别。随着 Fathom 的成熟,它已经发展成为对话的轻量级系统记录,旨在帮助团队保留上下文、从客户电话中学习并在不向会议本身添加摩擦的情况下异步协作。
您过去 15 年一直在打造改变人们沟通方式的公司——从 UserVoice 到 Fathom。是什么时候让您决定创立 Fathom 的,如何让您的工程和产品设计根基从第一天就塑造了这家公司?
我创立 Fathom 的灵感来自 2020 年初。那时是疫情前,我正在为一个产品进行广泛的用户研究,突然我每天要参加 15 或 20 次连续的 Zoom 会议。六周后,我深刻地意识到这种体验有多么痛苦。我不能同时说话和打字——我会看两周后我的笔记,记不住哪个对话是哪个。最大的问题是我会做所有这些研究,然后与我的团队分享几个要点,但它根本没有效果。所有东西都在翻译中丢失了。这对我来说是一个“碰到脚趾”的时刻:如果这种事情每个月发生一次,你会忽略它。如果你每天多次碰到某个东西,你会很快尝试解决它。
我的工程和设计背景都影响了我在构建 Fathom 时做出的选择。我一直通过采取已经存在的概念并使其对更大受众来说变得极其可用来解决问题。对于 Fathom,我有这样的洞察力:转录技术正在变得商品化——五年前不存在的现成解决方案正在涌现。因此,转录是解决方案的一部分,但它本身并不是解决方案。
从产品设计的角度来看,我意识到转录对于参加过电话会议的人来说是有价值的。但是,对于那些没有参加会议的人来说,它们并没有多大帮助。我们发现展示 30 秒的视频片段,显示客户对价格提出异议或询问技术问题,远比转录更有影响力。我们使用转录几乎像一个目录来找到实际的音频-视频片段。这种产品思维——了解要完成的工作,而不仅仅是技术——直接来自我的设计根基。
Fathom 于 2020 年成立,比大多数公司开始认真思考 AI 本地工作流程要早得多。将 AI 作为核心构建而不是改装它在早期给了您什么优势?
关键优势是架构自由。我们可以设计每个系统,从数据管道到用户体验,假设 AI 将成为一个基本层,而不是一个后置功能。大多数 2020 年和 2021 年的竞争对手都在聘请语言学专家和 ML 专家来构建自己的模型。我们采取了相反的方法,因为我们相信该领域的赢家将是那些能够有效地将 AI 应用于解决实际问题的人,而不是那些构建模型本身的人。这种相反的观点使我们能够保持灵活性,拥有一个较小的团队,并专注于难以解决的基础设施问题——可靠的跨平台记录、病毒式分发机制、实时处理。
2020 年开始的关键是:AI 当时还不够好。但我们知道,如果我们等待 AI 成熟后再构建公司,我们就会晚两到三年。门将会敞开,大家都会蜂拥而至。所以我们先构建了其他一切——基础设施、分发渠道、用户体验——并明确期望,当 AI 到来时,我们可以像在汽车中掉入新引擎一样将其整合。这个决定带来了巨大的回报。当 GPT-4 和 Claude 于 2022-2023 年到来时,我们可以立即将其集成。那些花了几年时间构建自定义 NLP 管道的竞争对手突然不得不重新思考他们的整个技术栈。我们只是升级了我们的模型并继续交付。
构建 AI 本地也从根本上改变了我们的产品开发过程。传统软件有一个相当线性的路线图:您决定要构建什么,构建它,然后交付它。使用 AI,我们使用我所谓的“积木模型”。每个积木代表一个潜在的 AI 能力。如果我们推一个积木并遇到阻力,因为模型还不够好,我们尝试另一个积木。我们知道六个月后,技术将会改进,我们可以回到它。这使我们避免在功能准备好之前强制实施它们,同时确保我们始终交付价值。
另一个优势是可信度。是的,投资者在 2020 年告诉我不要在我们的名字中加入“AI”,但早期让我们具有真实性。我们没有赶潮流;我们在它变得明显之前就押注了一个论点。
您将会议对话描述为组织内部最被忽视的数据源之一。是什么让您相信这是 AI 的下一个主要前沿领域?
我意识到我从未遇到过一位销售人员,他们每天有八个小时的时间来听他们团队的所有会议,更不用说做出决定并根据他们听到的内容来指导他们的团队。会议会产生非常有价值的数据,但它在规模上是完全不可访问的。使用传统会议,我们会丢弃内容的 99%,而最后 1% 的笔记会进入 CRM。然后我们会尝试从中反向推断出业务的未来会发生什么。这是一个荒谬的过程。真正重要的信息——客户声音的语气、他们提出的具体异议、提到的竞争对手——都会通过某人的匆忙笔记过滤并失去所有上下文。
让我相信这是下一个前沿领域的是认识到这种“对话黑暗数据”实际上是组织中发生的事情的最丰富的信号。你正在实时获得对客户痛点、产品差距、竞争威胁和培训需求的洞察——所有这些都是用人们自己的话来说的。当客户解释为什么他们需要一个功能时,这比销售代表在 CRM 字段中的概括更有价值。
AI 的突破是我们终于可以在规模上利用这些数据。当我们首次推出 Ask Fathom 时,它可以回答关于单个会议的问题。然后我们将其增强为处理小组会议。现在它足够聪明,可以理解您整个公司的会议集。销售领导者可以询问“最近哪些竞争对手正在走向顶峰?给我看一些片段。”工程团队可以询问“告诉我们 Fathom 的转录引擎的历史”并获得一份六页的综合文件,内容来自四年来的工程会议。
这开始成为一个更大的大脑,真正理解您的业务和对话正在发生什么。您可以想象一个世界,AI 可以告诉您应该下一步构建什么功能,以帮助关闭最多的交易,或者哪些竞争对手正在出现,或者您的团队中存在哪些培训差距。有这样一个令人惊叹的数据源,AI 正在为您提供输入,以便您进入下一次战略会议或路线图流程。
许多用户将 Fathom 称为变革性工具,以保持会议期间的专注度。您如何平衡自动化与保持人际对话的自然流程?
这是我们从一开始就关注的核心设计理念。目标不是让 AI 告诉你在会议中该做什么,而是让你在对话中更有存在感和有效性。
我们在自动化什么和不自动化什么方面很谨慎。我们不会推出功能,直到我们知道我们可以做得很好。这有时意味着我们不是某些功能的先驱,但当我们推出某些功能时,它们是有效的并且具有真正的价值。我们一直在追求电话录音或某些会议室会议捕获的请求,尽管频繁,但我们宁愿在我们做的事情上出类拔萃,也不愿推出一个中等水平的体验,从而破坏对话的自然流程。
最终,我们的用户告诉我们,我们正在取得正确的平衡:他们说他们每周节省 6+ 小时,会议到下一步的速度加快了 3 倍;95% 的用户报告说 Fathom 让他们在会议期间保持专注度。这证实了我们正在增强人类能力,而不是取代它。
Fathom 在其 A 轮融资中吸引了 1,300 多名用户投资者——这是产品级信任的罕见迹象。您认为是什么与日常用户产生了如此强烈的共鸣?
首先,我们提供一个真正强大的免费产品:无限会议,每月五次 AI 总结。我们的用户中有三分之二永远不会向我们支付一分钱,我们对此完全满意。它不是一个典型的 SaaS 玩法。我们的用户看到我们不是试图从他们身上榨取价值。我们专注于让个人贡献者的生活变得更好,免费提供服务,我们通过向他们的老板出售管理工具来赚钱——教练仪表盘、跨会议智能和竞争洞察。产品本身就是有效的,它继续发挥作用,无论你是否付费。这就产生了真正的信任。
我们的增长几乎完全是口碑——我们已经像一个社交媒体平台一样增长,而不是传统的 B2B 软件。我们的用户是我们的倡导者和分销渠道。让他们成为投资者只是承认了已经存在的现实:他们是我们使命的合作伙伴。
我认为还有更深层次的共鸣,围绕着我们正在解决的问题。每个人都经历过在会议期间试图保持专注和看着有人疯狂地打字而不是参与的痛苦。每个人都曾经需要从他们没有参加的会议中获取信息,但只得到了无用的两行摘要。问题是普遍的,解决方案在有效时几乎显得神奇。用户投资,因为他们希望这个未来存在——不仅是为了他们自己,也是为了他们一起工作的每个人。
您的背景包括构建 UserVoice,它有助于定义公司如何管理客户反馈。这种经历如何影响您对组织记忆和 AI 驱动的知识流的思考?
UserVoice 教会了我,公司中最有价值的信息往往是最分散的。客户反馈无处不在。它被埋藏在支持票中、转发的电子邮件和随机的销售对话中。公司会有成千上万个数据点关于客户想要什么,但没有办法将其综合成战略决策。我们构建了基础设施来聚合反馈,并使其对做出产品决策的人可访问。
与 Fathom 的相似之处很明显,但问题空间更为深刻。会议比客户反馈更分散。每个组织每周都会有成千上万个小时的对话发生。从 UserVoice 中我学到的东西是,捕获是必要的,但这还不够。你不能只是聚合信息;你需要围绕什么重要而构建智能,并将其路由到正确的人。使用 UserVoice,我们构建了投票系统、趋势算法和管理仪表盘,以便产品团队可以从噪音中分离出信号。使用 Fathom,我们正在构建理解对话背景并可以主动提供洞察力的 AI:“五个客户提到了这个使用场景这个月”,或者“您的团队不断遇到这个异议”。
另一个教训是民主化。UserVoice 使任何客户都可以提供反馈,而不仅仅是那些能够让高管接听电话的最响亮的客户。使用 Fathom,我们正在民主化获取会议智能的机会。在我们的 Netgain 案例研究中,他们的运营经理每天花费 7.5 小时回答有关销售电话中发生的事情的基本问题。这太疯狂了。信息存在,但它被困在人们的脑海中和分散的笔记中。
组织记忆的未来正在从这些孤立的知识库(CRM、文档、反馈系统)转变为连接的对话式智能。这是我们用 UserVoice 开始构建的东西的逻辑进化,但 AI 使其成为可能,使用的是人类对话的全部保真度,而不仅仅是结构化数据。
2020 年后,基于 Zoom 的 AI 工具爆发式增长。您认为什么区分了真正有用的 AI 助手和只是增加噪音的助手?
我总是告诉人们,只有两件事可以真正让 AI 会议助手沉没:如果产品不可靠,或者 AI 输出是垃圾。我认为在前一代中,有很多营销 AI,很容易承诺神奇的东西,但现实却是胡言乱语。我们一直努力确保我们有一个高质量、可靠的产品,能够做到它承诺的。我们的主要区别是:
- 转录准确性。 Fathom 被认为是目前最准确的转录。大多数工具利用第三方转录服务,而我们在内部构建了自己的专有转录技术。如果您的转录不良,则从转录开始的所有 AI 组件都会完全损坏。
- 可靠性和基础设施。 当您加入会议时,您通常很赶时间或感到压力。许多其他工具会让机器人加入会议,但然后不会记录,或者记录会失败。我们几乎存在于实时系统级别——您正在处理一个比航空电子系统仅一步之后的东西。如果它不工作两次,用户就会离开。它不像传统的 SaaS,您可以偶尔宕机。
- 理解细微差别和上下文的 AI。 商业语言可能非常微妙。我记得在 UserVoice 运营销售团队时,阅读人们的笔记,想着“我需要听到他们实际上是如何说的”。AI 需要捕捉不仅仅是说了什么,还有语气、犹豫和兴奋(或缺乏兴奋)。这就是为什么我们将每个总结点链接回实际的录音时刻。
- 无需复杂性的自定义。 AI 应该适应您的业务,而不是相反。销售团队应该能够修改模板以匹配他们特定的方法论——MEDDIC、挑战者、SPICED,或者他们使用的任何其他方法。但是,这不应该需要数据科学学位。它应该只是有效。
Fathom 将会议内容转化为可行的知识。您预计会议智能在未来五年内将如何演变——AI 将在组织记忆、决策和协作的未来中发挥什么作用?
五年后,我认为我们会回头看今天的会议智能工具,就像我们现在看待早期智能手机一样:当时令人印象深刻,但与可能实现的东西相比却很原始。
首先,会议智能将从笔记记录转变为真正的工作流自动化。我们设想一个未来,只要在会议中说某些话就可以让它变成现实,而无需事后工作。目前,如果你在会议中说“让我们为这个功能创建一个规格,并下周与工程团队安排一个后续会议”,你仍然需要手动创建该文档并发送日历邀请。在五年内,AI 将为你完成所有这些工作。只要你说出来,它就会发生。有了 AI 创建任务、规格和文档,人们就可以专注于真正需要人类创造力和判断力的工作。
第二个演变是从面向客户到面向所有会议的扩展。目前,我们专注于外部会议:销售、客户成功、代理商与客户的会议。但我们的目标是在接下来的 12 到 18 个月内,使 Fathom 成为您可以在整个组织中使用的平台,而不仅仅是面向客户的团队。我们正在构建无需机器人参与的录音,可以捕获任何对话,包括 Slack 会议和面对面会议。它正在演变为能够捕获您公司正在进行的任何对话,无论使用什么媒介。
那些将对话数据视为与 CRM 数据、分析和文档一样重要的第一类公民的公司将会脱颖而出。因为最终,任何组织中最重要的知识都不是在系统中,而是在对话中。AI终于使其成为可能。
感谢这次精彩的采访,希望了解更多关于此笔记应用的读者可以访问 Fathom。












