

医疗保健 AI 公司大多专注于训练模型以医疗文献、临床笔记和基于文本的数据为基础。但是,Knit Health 采取了不同的方法:教导 AI 系统了解医疗保健在医院和诊所内部的实际运作方式。加州大学伯克利分校的衍生公司以 1160 万美元的种子资金从隐身状态中脱颖而出,资金由 Uncork Capital 和 Frist Cressey Ventures 共同领投,前种子轮投资由 Moxxie Ventures 提供,Coalition Operators 也参与了投资。该公司表示,这笔资金将支持其 大型临床行为模型(LCBM) 的开发和部署,这是一个旨在从现实医疗环境中学习的系统。与传统的医疗聊天机器人或文档助手不同,Knit Health 正在构建所谓的“集体临床智能”——在医院中训练的 AI,学习患者路由、转诊、预约决策、出院时机和护理协调工作流中的模式。超越基于文本的医疗保健...


UiPath 宣布推出第一个支持多个 AI 编码代理的企业自动化平台,包括 OpenAI Codex 和 Anthropic 的 Claude Code。新的功能,称为“UiPath for Coding Agents”,旨在将 AI 生成的软件和自动化直接连接到企业治理、编排、测试和部署管道中。该公告反映了企业软件开发领域正在发生的更广泛的转变。 AI 编码工具 已迅速从自动完成助手演变为越来越自治的代理,能够生成代码、调试应用程序、运行测试和管理开发工作流。然而,许多组织仍然难以在大型企业环境中安全地操作这些工具。UiPath 正试图将自己定位为位于 AI 编码代理和企业基础设施之间的编排层。从孤立的编码代理到企业工作流当前一代编码代理(包括 Codex 和 Claude Code...


Corti 正面临人工智能领域最具挑战性的问题之一:将强大的模型性能转化为现实世界中的医疗保健部署。总部位于哥本哈根的 Corti 公司宣布推出了一项新的启动加速计划,旨在帮助早期医疗保健和生命科学初创企业克服日益增长的监管壁垒,特别是在欧洲,合规成本和时间表已经成为一个主要的瓶颈。此举正值医疗保健人工智能格局迅速分化之际,一些公司正在美国大力扩张,而其他公司则由于欧洲日益严格的规定而缩减了在欧洲的业务。一个转折点的领域医疗保健人工智能不再受限于原始模型能力。相反,限制因素越来越多地成为 监管批准 和临床验证。在主要市场,监管越来越严格。在欧洲,新的 欧盟人工智能法案 和现有的医疗器械法规使得建设合规系统的成本增加。仅认证就可能花费数十万欧元,并需要超过一年时间,这对许多初创公司来说是一个难以逾越的障碍。这已经开始重塑竞争格局。一些平台正在优先考虑监管较少的市场,而其他平台则完全退出了欧洲。Corti 采取了相反的方法,迎合复杂性,并将自己定位为基础设施,为希望在这些约束下建设的公司提供服务,而不是避开它们。了解 Corti 和其临床级人工智能栈Corti 将自己描述为“临床级人工智能的前沿实验室”,专注于为医疗保健环境构建专门的系统,而不是适应通用模型。其平台的核心是 Symphony,一种专门为受监管的临床工作流程设计的目的性人工智能模型。与通用人工智能系统不同,Symphony 以合规性、可审计性和临床可靠性为核心要求构建。该平台包括以下功能: 用于医疗对话的临床语音转文本 具有审计跟踪的自动医疗编码 结构化临床文档生成 针对特定医疗保健工作流程的基于代理的系统 这种垂直方法越来越重要。医疗保健人工智能需要不仅仅是准确性,还需要可解释性、可追溯性和严格标准的遵守,例如 HIPAA 和 GDPR。Corti 的更广泛的平台已经在生产环境中使用,支持临床和行政工作流程,服务于每年超过 1 亿名患者。为什么 Symphony...


在媒体上,银行和更广泛的金融行业通常被描绘成穿着笔挺西装的商人,从摩天大楼的顶层做出商业决策,或者是天才交易员,可以从少量数据中理解市场的状况。由于这是金融界最有力的形象之一,关于该领域新技术特性的讨论往往集中在它们将如何改变这种前台工作。人工智能在这里也不例外,大部分关于其在金融领域采用讨论都集中在代理是否会取代交易员,或者它们是否可以比顾问更有效地分配资本。然而,人工智能最有效的应用结果却远离了很多人想象的光鲜形象。事实上,人工智能通过处理日常运营中的“枯燥”工作带来了更多的利润。人工智能真正创造价值的地方人工智能的主要优势在于它可以以比人类更低的成本和更快的速度处理任务。通过这样做,它实际上通过提高运营效率来产生利润。例如,使用人工智能工具,花旗银行将开户前的文件审查时间从一个多小时缩短到仅15分钟。自然,快速的决策会让客户满意,甚至可能使他们更加忠诚。但同时,这45分钟的时间也为银行节省了成千上万美元的成本,因为这些工具可以让人类从事更重要的工作。人工智能有助于优化金融公司依赖的庞大金融官僚和内部框架。因此,最有价值的应用场景往往不是最壮观的。自动交易员或为客户推荐最佳交易的聊天机器人听起来令人印象深刻,但自动化的KYC程序和尽职调查检查可能会为银行或金融公司带来更大的经济价值。话虽如此,就像花旗银行的文件审查过程一样,没有什么能阻止这些改进也惠及客户。用户可能会欣赏应用程序中的个人人工智能助手,但如果贷款决策可以从几天缩短到几分钟,或者他们的交易不被错误地标记为欺诈(因为这些概率被人工智能降低了几十个百分点),他们会更加欣赏它。人工智能如何成为最赚钱的“员工”通常,当银行的客户群体增长时,其员工数量也必须几乎成比例增长。过去,使用相同的团队规模审查越来越多的交易和客户文件是不可能的。各种现代技术解决方案在某种程度上提供了帮助,但业务增长仍然不可避免地导致员工数量增长。随着公司员工数量的增加,需要更多的管理人员,整个结构的成本也会变得更加昂贵。现在,随着人工智能的出现,这个问题开始消失,因为有了人工智能工具的帮助,较少的员工仍然可以有效地服务于越来越多的客户。一些公司已经在使用这种逻辑:例如,Klarna声称,一名人工智能助手可以完成700人的工作。不论应用这种工具的成本是多少,它不太可能接近几百名员工的正常工资。然而,要真正使其发挥作用,公司需要在工作流程中正确地集成人工智能,而不仅仅是进行实验。在金融领域,许多项目仍然停留在试验阶段,显然,这不能产生太多的价值。当一家公司正在讨论是否采用新工具或如何扩大人工智能代理的规模时,其竞争对手不会停下来,他们正在建设自己的人工智能能力。在这场竞争中落后将导致重大财务损失。具体来说,未能早期将运营转移到人工智能轨道上的公司可能会失去多达9%的利润。稍后弥补这种损失将不是一件容易的事,它要求金融公司建立一个扎实的人工智能战略。如何管理人工智能决策这是最大的挑战,因为将人工智能代理嵌入金融运营中不可避免地意味着将一些决策权委托给它们。在金融领域,人工智能已经成为一种无穷无尽的免费“初级员工”来源,通过优化基本的后台运营,这种情况尤其如此。问题在于,这种工作中的错误往往是最昂贵的。通常,监管机构会防止金融组织做出危险的事情,并制定规则以尽量减少可能的损害。然而,当涉及到人工智能时,行业的发展速度远远超过了监管,只有四分之一的监管机构从受监管的实体中收集人工智能使用数据。这显然不足以跟上越来越多的公司将代理添加到其运营中的步伐。因此,金融公司必须自己找到方法来规范人工智能驱动的工具。这是可以理解的,因为这里的任何错误都可能导致数百万美元的损失。例如,在现代银行中,代理被赋予有限的权限,就像真正的员工一样。如果人工智能处理客户文件,它显然不需要更改客户风险评级的权利。代理被分配一个严格的运营角色,并且不允许超越它。另一种可能且必要的机制是保存人工智能所有操作的详细记录,这样如果发生错误,每一步骤都可以被追溯。在KYC和欺诈检测等领域,几个月后可能会出现有关客户的问题,因此银行绝对需要保留人工智能助手逻辑的完整记录。人工智能行为也可以在沙盒中进行测试。例如,英格兰银行已经开始模拟人工智能交易会话,以了解代理如何相互交互以及如何与真实市场交互。这种测试有助于确定代理在哪里犯了错误并在其公开之前解决问题。最终,必须记住,任何人工智能决策都必须由人类确认,人类仍然对其负责。在发生损失的情况下,没人会接受“因为模型决定了”的答案,一位高级经理仍然必须批准人工智能的行为并对其负责。从“银行vs金融科技”到“快vs慢”人工智能监管也塑造了金融市场的竞争。客户可能会因为他们的文件被处理得更快而感到高兴,但如果人工智能机器人损害了他们的信用记录或让他们损失钱财,他们绝对不会高兴。为了避免这些问题,他们更有可能将钱交给那些透明和诚实地解释其人工智能战略的公司。当然,这些公司也更擅长管理人工智能。金融科技公司在这里有明显的优势,因为它们不受传统系统的负担。现代金融科技公司可以从一开始就围绕人工智能构建其服务,并立即自动化所有流程。建立新事物可能比尝试将人工智能代理集成到仍然依赖传真机和几十年前的COBOL系统的组织中更容易。难怪几乎有一半的金融科技公司已经达到了人工智能采用的高级阶段,而传统金融机构中只有不到三分之一。银行并没有注定要灭亡。毕竟,它们已经经历了大萧条、1970年代、伟大衰退和更多。它们知道如何适应变化。由于它们的传统,它们积累了大量的客户数据、资本和声誉。然而,要有效地利用这些优势,它们应该将人工智能完全集成到其流程中,因为简单地将其添加到一个副产品中不会有太大的帮助。


去年,S&P Global 报告 表示,放弃大多数AI项目的公司比例从17%增加到42%。此前,Gartner 发布了一份关于代理AI项目的预测:2027年底前,40%的项目将被关闭。根据麦肯锡公司 的说法,几乎有一半的公司正在尝试使用AI代理。但是,有多少公司已经从试验阶段转移到实际运营?大约十分之一。行业中有很多解释:模型的幻觉,缺乏治理,高GPU成本,专家短缺。所有这些都是真正的挑战。但是在与知识管理系统和AI代理合作三年后,我越来越多地看到一种不同的模式:公司向代理提供不完整的数据。作为教育科学博士,我认为这是一个知识转移问题。如果一个人无法解释他们如何做出决定,他们的逻辑无法转移到新员工身上,更不用说转移到AI代理身上。让我们探讨为什么会发生这种情况以及如何解决它。公司实际运营知识的存储位置问一个大公司员工知识存储在哪里,你会得到一个长长的列表:Confluence,SharePoint,LMS平台,FAQ机器人,Slack存档。看起来这似乎是RAG系统可以用来检索所有必要信息的栈。但是,缺少一个至关重要的元素——存在于人们脑海中的知识。从未被写下来的知识。为什么这是一个问题?因为AI代理需要不仅仅是访问知识库,还需要理解上下文,选择行动,并完成任务——它需要经验丰富的专家的决策逻辑。想象一个新支持代理接收到一个请求:客户声称已经为一项服务付费,但尚未激活。脚本包括一套标准步骤,最后一步是询问客户等待。但是,代理注意到这种情况很不寻常:客户已经联系过支持团队两次,系统中有多个类似案例。他们联系了一位更有经验的同事,同事解释说,他们以前见过这种情况,问题很可能是支付网关、银行和内部激活系统之间的故障——因此,应将该案例升级到另一个部门。对于AI代理来说,这种逻辑是不可见的。它可能可以访问脚本、票据历史和支付状态(如果这些数据源连接),但它不知道经验丰富的操作员认为哪些信号是决定性的。专家并不是故意隐瞒这种知识,他们只是无法正式化或将其分解为步骤:哪些选项被排除,为什么选择了某个操作,在什么时候很明显标准场景不适用。认知科学家称这种现象为 隐性知识 —— 即使其持有者可能没有完全意识到的隐含知识。这是为什么瓶颈不在文档访问层面,而是在将专家经验转换为适合训练AI代理的格式的阶段。如何解决这个问题要使AI代理有效工作,仅仅将LLM连接到企业知识库是不够的,因为成功的决策往往依赖于隐性知识。首先,必须创建一个知识层,包括结构化的决策标准。在知识管理中,这个过程被称为 外化 —— 将隐性知识转换为显性知识。换句话说,公司需要了解不仅仅是专家做什么,还有他们的思考过程。这通常是通过与顶级专家进行一系列深入的采访来完成的。与他们一起应该是有人擅长提问:方法论师、知识工程师或教学设计专家。他们的任务不是写下“基于专家说的话的指令”,而是重建选择选项的标准,分解边缘案例,并揭示专家已经自动处理的典型错误。这里,AI可以提供显著的帮助:转录采访,分组类似案例,将专家解释转换为草稿场景,并生成验证情景。然而,最后的结构仍需要由专家审查和批准。结果应该是一个可用的知识库。它可以同时用于两个方向:培训新员工和配置AI代理。两个场景都依赖于同一基础:来自顶级专家的结构化经验。另一种选择是继续依赖于RAG在Confluence上某种方式重建从未记录的逻辑的假设。在实践中,这几乎从不奏效:系统可能会检索相关文档,但它不会学习如何在依赖于上下文和经验的情况下做出决定。如何检查代理是否准备好工作您已经将专家知识转换为场景并配置了代理。但是,代理的合理答案和实际操作性能之间存在差距——这种差距只会在验证过程中变得明显。在这个阶段,确定是否已经捕获了所有必要的知识至关重要。一种实用的方法是基于场景的测试。您为代理提供来自专家日常工作的真实案例:客户对收费提出异议,收到一封不寻常的电子邮件,或出现不符合基本脚本的请求。结果不应由另一个LLM评估,而应由帮助构建知识库的同一位专家评估。如果代理采取的路径与经验丰富的专家不同,这并不总是意味着模型很弱。更常见的是,意味着一个关键规则、异常或示例缺失。在这种情况下,过程从头开始:方法论师与专家澄清逻辑,知识库更新,指令完善,测试重复。这个周期不是一个可选步骤,而是一个定义代理之间差异的阶段:一个仅仅“展示潜力”的代理和一个真正执行工作的代理。这是一个缓慢且不太令人印象深刻的过程:它不会产生一个令人惊艳的演示,并且需要专家的参与。但是,系统地完成这个过程的人最终会拥有真正减轻专家日常工作量的代理。那些跳过这一步的人,六个月后经常会发现自己处于Gartner预测的统计中:40%的项目将被取消。代理AI不会因为技术而失败——现代模型已经能够执行复杂的任务。它失败是因为公司“喂”它不完整的知识。在2024-2025年,这仍然可以被解释为实验阶段。在2026年,这个错误已经带来了巨大的成本。