访谈
马修·克劳森博士,沃尔特斯·克鲁威尔健康公司人工智能/通用人工智能产品管理总监 – 采访系列

马修·克劳森博士 是一位医疗保健技术领导者和执业外科医生,专注于将人工智能应用于临床实践。他是沃尔特斯·克鲁威尔健康公司人工智能/通用人工智能产品总监,负责领导提高证据合成和现实世界数据分析的计划。之前,他曾领导德勤的医疗保健提供者人工智能实践,开发生成性人工智能解决方案以增强文档记录、收入周期和研究。他还在哈佛医学院担任助理教授,并撰写了超过 90 篇同行评议文章。
沃尔特斯·克鲁威尔 是一个全球性的专业信息、软件和服务提供商,支持医疗保健、税务和会计、法律和监管、金融合规和环境、社会和治理(ESG)领域的客户。该公司总部位于荷兰,利用深厚的行业专业知识和先进技术提供工具,以简化工作流程、确保合规性和支持关键决策。其业务遍及 180 多个国家,产品和服务分为医疗保健、税务和会计、法律和监管、金融和企业合规以及企业绩效和 ESG 等部门。
让我们从一个个人问题开始——您如何平衡您作为一名外科医生和人工智能产品领导者的双重角色?您的临床工作是否影响了您对人工智能在医疗保健领域的看法?
老实说,这需要无情的时间管理和一台工业级的咖啡机。早上的门诊让我保持了患者护理技能的诚实,而剩下的时间则花在将前线的痛点转化为产品规格上。两个角色相互促进:看到一位住院医师点击十个屏幕来订购泰诺,就是我所需要的所有市场研究。
人工智能项目在没有任何与会者感受到痛点的情况下就会失败。我们的未来就绪医疗保健调查显示,80% 的领导者表示“优化工作流程”是首要任务。然而,只有 63% 的人认为他们已经准备好使用生成性人工智能(GenAI)来实现这一目标。这是战略执行差距的典型例子,领域专家可以通过提出正确的临床“为什么”来弥补这一差距,然后再编写一行代码。
我的临床视角也使使命保持实际。前线人员告诉我们,他们的首要任务是解决人员短缺(82%)、减少行政开支(77%)和减轻倦怠(76%)。如果一个算法不能移动其中一个指标,那么它只是表演。如果临床医生不关心它,他们会很快失去兴趣。
这种视角也使我在人工智能不应涉足的领域保持谨慎。事实上,57% 的专业人士担心过度依赖 GenAI 可能会侵蚀临床判断力,但只有 18% 的人表示他们的组织已经发布了指导方针。直到治理赶上之前,任务很明确:自动化文书工作,而不是思考。
所以,对我来说,平衡不是关于咖啡和日历的问题,而是关于在诊所里保持一只脚——这样我就永远不会忘记人工智能是为谁服务的——和在产品中保持一只脚——这样知识就可以交付。如果做得好,咖啡只是一个很好的奖励。
沃尔特斯·克鲁威尔的未来就绪医疗保健调查报告强调了生成性人工智能的热情和执行之间存在着巨大的差距。你是否对调查结果感到惊讶?你个人认为最重要的发现是什么?
我并不感到惊讶。我还没有遇到一个反对自动化的临床医生。是什么阻碍了推出,不是对“医疗保健中的天网”场景的恐惧,而是医疗保健运营的日常磨难。调查结果明确了这一现实。八分之七的领导者将工作流程优化列为首要任务,但仅六分之五的人认为他们已经准备好让 GenAI 处理它。这种差距正是我所看到的:法律责任、数据看起来更像一个杂乱的抽屉而不是一个数据湖,以及仍然奖励数量而不是效率的财务激励。还有其他障碍,包括培训真空、影子 IT 疲劳和监管迷雾。
对我来说,最引人注目的是这些障碍是多么平凡。人员短缺、行政拖累和倦怠占据了担忧清单的首位,但只有 18% 的组织拥有正式的 GenAI 政策。如果您不知道谁对模型的输出负责,或者如何审计它,热情就会在合规办公室死去。另外,68% 的受访者表示劳动力成本是他们最大的财务压力,这也难怪高管们在签署另一份软件发票之前希望看到投资回报的证明。标题不是“人工智能恐慌”,而是“好主意——给我看工作流程和商业案例”。
超过半数的受访医疗保健专业人员担心生成性人工智能可能会侵蚀临床决策能力。你认为这种担忧是合理的,还是反映了对人工智能系统的信任和透明度的更深层次的担忧?
一些焦虑是真实的,但它与科幻恐怖的 HAL-9000 风格的流氓人工智能没有太多关系,更多的是与平凡的责任有关。当一个工具在几秒钟内提供差异诊断时,您需要非常清晰的来源:推荐从哪里来,谁签字,并且如何进行审计? 今天,只有很小一部分组织有正式的 GenAI 治理,因此临床医生会谨慎行事。这在我们的数据中表现为 57% 的人说“过度依赖可能会侵蚀判断力”。对我来说,这是一个信号,表明他们不希望一个黑盒子干扰他们的执业许可。
我通过历史的视角看待这个问题。当电子表格进入财务部门时,一些会计师担心他们的分析能力会变得迟钝。相反,电子表格软件成为新的基准,提高了准确性的底线。医疗保健领域急需类似的飞跃。我们由于医疗保健的变异性而失去太多患者;医疗错误仍然是伤害和死亡的主要原因。生成性人工智能的超能力可以通过更快地表明指南、突出禁忌症和标记异常值来缩小这些错误范围,这比任何人类都可以浏览图表。但是,它必须保持在一个助手的位置,而不是一个自主的决策者,特别是在接下来的三年到五年内。
所以,是的,担忧是合理的,但它是可以解决的。透明的数据集、审计跟踪和人工干预检查可以将“人工智能侵蚀”转化为“人工智能增强”。给临床医生可追溯的建议和明确的责任制,57% 的人就会消失。这不是关于取代专业知识,而是关于用更好的工具来增强它。
只有 18% 的受访者表示他们的组织有明确的生成性人工智能政策。没有这样的治理,部署生成性人工智能工具的潜在风险是什么?
可以把它想象成在没有说明书的情况下推出一款新药。医疗保健数据非常敏感,生成性人工智能模型只有在吸收了这些保护健康信息(PHI)丰富的上下文时才会变得更智能。没有严格的数据管理政策来管理谁可以上传信息、如何记录数据以及数据存储位置,一个组织只需一个剪贴板快照就可能发生隐私泄露,这可能会成为头条新闻。
法律责任是下一个地雷。当算法推断出一个违反指示的剂量时,谁来承担医疗事故索赔?供应商、医院还是点击“接受”的临床医生?现在,答案还不明确,因为不到五分之一的组织有明确的“规则”来管理生成性人工智能。在真空状态下,律师经常默认为最深的口袋,这种不确定性本身就可以阻碍创新。
治理还可以防止更微妙的风险,例如模型漂移和沉默偏见。一个在上季度指南上训练的肿瘤机器人可能会悄悄地过时,导致护理偏离基于证据的轨道。政策可以强制执行版本控制、结果监测和日落触发器,以防止算法变成安全隐患。
最后,信任岌岌可危。临床医生担心过度依赖生成性人工智能可能会削弱他们的临床判断力;推出不透明的工具只会证实这些担忧。明确的治理、数据血统的透明度、验证协议和人工干预检查可以将“黑盒子”焦虑转化为信心,即人工智能是一个助手,而不是一个流氓居民。
根据您在沃尔特斯·克鲁威尔和手术室的工作,生成性人工智能在医疗保健领域最现实的近期应用场景是什么?
忘记机器人外科医生吧。未来三年的杀手级生成性人工智能机会是 行政摧毁。已经有两条途径正在证明自己:
- 前台记录。 环境监听工具现在可以在医生与患者交谈时草拟进展笔记,然后直接将其放入电子健康记录(EHR)中。我们的调查显示,41% 的受访者将其列为他们的生成性人工智能愿望清单上的第一项,这项技术已经在早期采用者医疗系统中投入使用。几项研究表明,环境式听写系统可以将认知负担减少 51%,睡衣时间减少 60% 以上。这是一个硬性 ROI;您可以快速感受到它。
- 后台收入保护。 下一个多米诺骨牌是事先授权包、拒绝上诉信函和其他收入周期的污垢。为了参考,67% 的领导者表示事先授权单独就扼杀了生产力,62% 的人指出 EHR 管理拖累。可以阅读图表并自动填充这些表单的大型语言模型已经将索赔的天数削减并释放了员工用于更高价值的工作。
为什么选择这两种方法?它们击中了 低临床风险、高工作量缓解和明确的美元和美分理由 的三重奏。在一个 68% 的高管将人员成本列为首要财务压力的市场中,能够在不改变护理计划的情况下将时间还给临床医生的工具是最容易说“是”的。自主诊断将来得更晚;现在,生成性人工智能通过消除剪贴板来证明自己的价值。
调查指出,数据并不是受访者关注的首要风险——这令人惊讶,因为数据隐私经常占据头条新闻。临床医生和管理员认为哪些风险更为紧迫?我也感到惊讶。头条新闻会让我们相信 HIPAA 泄露让每个医院的首席信息官都寝食难安。然而,我们的数据显示,只有 56% 的专业人士将隐私列为生成性人工智能的首要风险,而更大比例(57%!)的人担心“降低”临床判断力。这告诉我,前线的恐惧不是黑客,而是责任感。
以下是临床医生和管理员担心的事情:
- 责任轮盘赌。 如果算法推断出一个违反指示的剂量,谁来承担医疗事故索赔?缺乏明确的法规和标准与透明度差距并列,占比 55%,表明人们对法律影响范围的真正不安。
- 监管鞭打。 76% 的领导者已经感到被不断变化的医疗补助和医疗救助规则所困扰;在此之上添加不透明的生成性人工智能,只会在治理框架固化之前使其成为一个难以销售的产品。
- 模型漂移和偏见。 55% 的人将未经训练的模型的偏见列为关键风险,这是一个提醒,过时的数据可能与缺失的数据一样危险。
简而言之,大多数组织假设他们的防火墙还不错;他们 不 有明确的责任链,当一个大型语言模型(LLM)的输出出现在护理计划中时。直到治理框架明确了所有权、审计跟踪和更新周期,生成性人工智能的推出将继续停滞,不论安全堆栈有多紧凑。
您认为生成性人工智能工具最终会增强还是削弱临床医生的自主权?我们如何设计支持决策而不越界的系统?
生成性人工智能有望 扩大 而不是缩小临床自主权。现在,自主权受到大量的收件箱整理、事先授权文档和 EHR 体操的阻碍。因此,前线人员将“优化工作流程”列为他们对生成性人工智能的首要用例(80% 的优先级),尽管只有 63% 的人觉得自己在技术上已经准备好了。药剂师和辅助医疗专业人员已经押注了上升的趋势:41% 和 47% 的人预计生成性人工智能将消除足够的行政脂肪,以减少支持人员的需求。解放临床医生摆脱数据录入意味着他们可以与患者共度更多时间。这是每个人都想要的自主权。
然而,调查提醒我们,自主权可以从两个方面看:57% 的受访者担心过度依赖生成性人工智能可能会削弱临床判断力。解药是周到的设计,而不是节流。系统必须显示其工作原理,包括来源标志、引用和置信度,以便人类保持最终的仲裁者。版本控制和部署后监控可以在护理路径中悄悄地捕获模型漂移,而“始终可见的覆盖”按钮可以明确指出算法是一个助手,而不是主治医生。治理是最后一英里。只有 18% 的专业人士表示他们的组织有发布的生成性人工智能政策。没有透明的责任链,即使是最好的用户体验也会在法律模糊性中停滞。健全的政策需要规定数据管理、审计跟踪和角色划分,这些内容需要在医生、护士和点击按钮的医师助理之间共享。当我们将这些防护措施与工作流程本地设计相结合时,生成性人工智能不再感觉像对自主权的威胁,而是开始像临床医生一直在乞求的副驾驶一样行事。
是什么阻碍了采用的最大障碍——技术限制、监管不确定性、工作流程摩擦,还是更深层次的东西,如文化抵抗?
这是一个执行缺陷,裹在传统的激励措施中。多数医疗系统领导者可以阐述一个光滑的生成性人工智能愿景,但他们的运营能力还没有跟上。我们的调查显示了这一脱节:80% 的受访者将“优化工作流程”列为首要任务,但只有 63% 的人认为他们已经准备好使用生成性人工智能来实现这一目标。愿景很廉价;集成工程师、变革管理手册和图形处理单元(GPU)预算则不是。
治理是下一个陷阱。只有 18% 的专业人士知道他们的医院有发布的生成性人工智能政策。没有明确的数据使用、验证和责任规则,每个有前途的试点都有可能成为合规炸弹。这种法律模糊性被快速变化的国家和联邦法规所放大;75% 的领导者担心这些法规会破坏他们推出的任何解决方案。
然后是壕沟级别的摩擦:近半数的高管将脏数据和 EHR 集成噩梦列为主要障碍,只有 42% 的人表示他们有一个流程将生成性人工智能工具集成到现有的工作流程中。如果模型无法看到图表或添加点击,临床医生在午餐前就会放弃它。
最后,还有“试点炼狱”。众多外部研究估计,人工智能试点毕业到企业规模的成功率约为十分之一。董事会庆祝演示,发布新闻稿,然后继续前进。因为没有人为后续的管道工作提供资金。生成性人工智能将保持为 PowerPoint 的承诺,直到医院配备了以前曾经发货过软件的产品所有者。
简而言之,技术和文化并不是独立的阻碍因素。它们是融合在一起的。解决负责的领导、真正的集成预算、明确的防护措施和对生成性人工智能的渴望,热情就会与其炒作相匹配。
您已经建立了专注于务实、基于证据的结果的人工智能系统。您会给医疗保健领导者什么建议,他们正在尝试在炒作中找到方向并确定真正有价值的人工智能投资?
从诊断开始,而不是演示。在让一个闪亮的锤子寻找钉子之前,量化钉子:手术室利用率是否连续两个季度下降了 8%?否决上诉是否滞后并且正在出血收入?护士站三是否每班花费两个小时在 EHR“切换时间”(在屏幕和任务之间切换的时间)上?一旦痛点明确,正确的工具就会自然出现。正如威廉·奥斯勒爵士几代前提醒医疗界,“听患者说;他们会告诉你诊断。”
问题明确后,像首席财务官一样审问商业案例。要求硬性数字:基准指标、预计变化、能够通过董事会嗅探测试的回报窗口。记住,大约只有十分之一的人工智能试点毕业到企业规模;如果供应商无法展示一个已经移动了您关心的关键绩效指标(KPI)的活跃客户,请继续前进。
接下来,决定是购买、构建还是合作。购买可以加速时间到价值,但要注意包装在炒作中的虚拟产品。构建可以提供控制,但只有当您拥有一个拥有生产机器学习经验的老虎队利润和损失所有者时。混合合作往往可以找到平衡:您的数据,他们的模型,共享的上升和共享的风险。
最后,优先考虑小型、跨职能团队,具有明确的责任感。考虑一个包括首席医疗官、首席信息官、数据工程负责人和一位前线冠军的两块披萨小队,而不是大型指导委员会。将他们的激励因素与多年来的结果目标对齐,而不是短期指标,并为他们提供专用的基础设施预算——图形处理单元、数据工程和机器学习运营(MLOps)——以便项目在试点阶段之后取得进展。
最后,展望未来:五年后,一个完全集成的生成性人工智能系统在医院环境中会是什么样子?我们需要实现哪些里程碑才能到达那里?
想象一下走进一个诊所,医生永远不需要转身去键盘。对话流畅,一种微妙的环境监听代理捕获对话,草拟笔记,提示基于指南的订单,并在医生手放在门把手之前生成事先授权包。早期试点已经证明了这一概念,41% 的临床医生在我们的调查中表示,这正是他们下一步想要的生成性人工智能功能。
使这一场景成为可能的不是科幻小说中的机器人,而是一个将干净、可互操作的数据与实时编排层和“治理即代码”融合在一起的隐形架构。我们仍然有作业要做。为了弥合差距,首先要考虑数据管道,然后嵌入防护措施(而不是将其附加在上面),以将炒作变为习惯。
里程碑自然会随着基础的建立而出现。在第一年,我建议医院和医疗系统连接数据结构,发布企业范围的生成性人工智能指南,并建立机器学习运营(MLOps)管道。在实施的第二年,重要的是要在门诊中扩大环境文档记录,衡量文档时间和睡衣时间。在第三年,让生成性人工智能草拟拒绝上诉和事先授权包(67% 的领导者表示这一负担是成熟的)。在第四年和第五年,发展成为实时临床决策支持,具有来源和最终基于对话的护理规划,在系统执行订单的同时发出命令。
感谢您接受这次精彩的采访,希望了解更多的读者可以访问 沃尔特斯·克鲁威尔 或阅读 未来就绪医疗保健调查报告 报告 。












