融资
Protege 获得 3000 万美元 A 轮扩展融资,由 a16z 领投,以扩大对真实世界数据的访问

Protege,一家专注于解锁可信的真实世界数据集以用于 AI 开发的 AI 数据平台,已获得由 Andreessen Horowitz 领投的 3000 万美元 A 轮扩展融资。这笔新融资扩展了公司于 2025 年 8 月宣布的 2500 万美元 A 轮融资,总融资金额达到 6500 万美元,自 2024 年成立以来。
投资者包括 Footwork、CRV、Bloomberg Beta、Flex Capital 和 Shaper Capital,反映了投资者对 Protege 解决人工智能领域最顽固挑战之一——高质量非公开数据访问的方法的日益增长的信心。
解决人工智能日益增长的数据约束
随着人工智能模型的进步,限制因素越来越不是计算能力或算法,而是数据。公共数据集已经饱和,而许多最有价值的信息来源,例如医疗记录、媒体档案、音频数据和运动捕捉数据,仍然分散、专有或难以负责任地访问。
Protege 位于数据持有者和 AI 开发者之间的交叉点,实现对真实世界数据集的许可访问,同时确保它们结构化、策划和针对现代 AI 工作流程进行优化。这种类型的数据需求正在各个行业中迅速增长,特别是当 AI 系统从实验转向生产环境时。
真实世界数据的许可优先模型
Protege 不依赖于爬取或无结构聚合,而是通过许可协议直接与可信的数据提供者合作。这些合作伙伴贡献私有和专有数据集,可能包括去识别的健康记录、医疗成像、音频录音和媒体内容。
Protege 应用技术专长来清洁、策划和包装这些数据,以便它们可以有效地用于训练和评估。数据提供者通过与使用情况相关的收入分成安排参与,创建一个可重复的模型,该模型围绕负责任的数据访问和重用对齐激励因素。
该公司与全球的 AI 组织和机构合作,包括许多世界上最大的科技公司,支持跨多个领域的下一代 AI 系统的开发。
经验丰富的领导和战略支持
Protege 由 CEO 和联合创始人 Bobby Samuels 领导,Travis May —— 以前是 Datavant 和 LiveRamp 的 CEO —— 担任董事长和联合创始人。领导团队在数据密集型行业中拥有深厚的经验,这些行业的隐私、合规性和规模至关重要。在最近与 Unite.AI 的采访中,Samuels 讨论了他在数据治理和隐私方面的背景如何塑造了他对一个连接数据持有者和 AI 开发者的平台的愿景,这个平台以透明和道德的方式运作,强调了在更广泛的 AI 生态系统中治理数据访问的日益增长的重要性。 –
从投资者的角度来看,Andreessen Horowitz 认为,访问专有、真实世界的数据是下一阶段 AI 的决定性优势。随着模型架构变得更加标准化,具有明确来源和道德许可的差异化数据正在成为性能和竞争防御性的关键驱动因素。
Protege 计划如何使用新资金
A 轮扩展融资将支持扩展产品开发、将数据合作伙伴网络扩展到新的领域和格式,以及与持有有价值的真实世界数据的机构进行更深入的合作。该公司还计划扩大其基础设施和团队,以满足 AI 研究和开发团队日益增长的需求。
这一重点反映了整个行业的转变,AI 进步越来越多地与数据质量、来源和相关性挂钩,而不仅仅是模型大小。
人工智能未来发展的影响
Protege 的发展势头表明,人工智能系统的构建方式正在发生结构性的变化。随着容易访问的数据源被耗尽,未来突破可能来自于负责任地解锁私有的、真实世界的数据,这些数据是通过日常活动生成的。
像 Protege 这样的平台表明,未来数据访问将受到治理、补偿和透明度的制约。对于 AI 开发者来说,这可能意味着更可靠和特定领域的模型。对于数据持有者来说,它创造了一个可持续的参与 AI 开发的途径,而无需放弃控制权。
随着时间的推移,这种方法可能会影响行业和监管机构如何思考数据所有权、重用和价值创造。人工智能开发可能越来越多地依赖于平衡创新与责任的信任网络,而不是将数据视为需要提取的东西。












