思想领袖
公平使用和人工智能破坏市场中的竞争

一项两党法案,人工智能网络透明度和责任法(TRAIN),于2026年1月提出,将赋予内容创作者传票权力,迫使人工智能公司披露信息。如果该法案通过,更多的版权持有者将拥有法律机制来确定他们的作品是否被用于人工智能训练。
乍一看,这似乎是一种权力,能够让更多的版权持有者从人工智能开发者那里获得付款。然而,实际上,仅仅知道自己的作品被未经许可使用还远远不够。
在决定公平使用案件时,法院会权衡四个关键因素:使用目的、原作品性质、使用量以及对材料市场价值的影响。最近在美国法院的判决重申,公平使用仍然是创新的一项支柱,不能轻易被驳回。焦点尤其集中在市场损害因素和证明它的方面。
市场损害作为主要战场
来自加利福尼亚州北区法院的人工智能版权判决显示,法院在公平使用分析中采取了不同的方法。在 Kadrey v. Meta 中,Chhabria 法官称市场损害为“公平使用的最重要元素”。Alsup 法官在 Bartz v. Anthropic 中,则更均匀地权衡了所有四个因素。但两位法官都同意:原告不能仅仅声称损害——他们需要证明损害已经发生或是可能发生的。
对于人工智能开发者,尤其是资金不足的初创公司,证据要求至关重要。如果损害必须被证明而不是假设,开发者可以做出设计选择以避免损害。判决表明,开发者可以通过从合法来源获取数据、设计具有不同于受版权保护作品的目的的产品以及实施防护措施来防止大量文本被复制,从而降低风险。
两家法院,Bartz 和 Kadrey ,都发现人工智能训练符合版权法下的“变革性使用”标准。因此,焦点越来越集中在第四个公平使用因素:市场损害。 最近的人工智能版权战 说明了这一点。诉讼越来越多地集中在这样一个观点上:对受版权保护作品的逐字复制会损害出版商的市场价值。
这些案件仍在等待判决。重要的是,出版商越来越清楚,如果他们想赢,他们需要声称两件事:人工智能输出有效地取代了对原始作品的访问需求,并且因此,版权持有者遭受了具体的经济损害。
证据要求
Bartz 和 Kadrey 都强调,市场损害必须被证明,而不是假设。在 Kadrey 中,广泛的测试显示,Meta 的 Llama 即使在经过设计的提示下,也只复制了原告作品中的不超过 50 个令牌,而且只有 60% 的时间是在被诱导的提示下。
Alsup 法官在 Bartz 中关注的是 Anthropic 的 Claude 是否实际上向用户提供了侵权文本——原告并没有声称这一点已经发生。如果没有复制,很难声称替代原始作品。
这种证据方法表明,即使版权持有者证明他们的作品被用于训练,他们也不一定有一个强有力的侵权诉讼案件。如果由人工智能系统产生的输出不会造成可识别的市场损害,那么仅仅使用它在法律下就没有太大的意义。
何时承认市场损害
在 Thomson Reuters Enterprise Centre GmbH v. Ross Intelligence Inc. 中,特拉华州地区法院拒绝了 Ross Intelligence 的公平使用辩护,因为 Ross 使用了 Thomson Reuters 的 Westlaw 头条来训练一个直接与 Westlaw 竞争的 AI 法律研究工具。公平使用分析中的第一个因素(目的和特征)和第四个因素(市场影响)对于该裁决至关重要。
巡回法官 Stephanos Bibas 发现 Ross 的使用并非变革性,因为它创建了一个直接的市场替代品。Ross 最初试图获得 Westlaw 内容的许可,但 Thomson Reuters 因为 Ross 是其竞争对手而拒绝。原始材料的目的与 AI 产品的目的之间的对齐也支持潜在损害的主张。
相反,当 AI 产品针对与训练数据不同的市场时,建立市场替代变得困难。在 Bartz 和 Kadrey 中,通用语言模型服务于与用于训练的单个书籍根本不同的功能。这一区别可能至关重要——人工智能系统的目的与其训练数据源之间的差异越大,证明市场替代就越困难。
“许可市场”论点被驳回
两家法院都明确驳回了这样一个论点:人工智能开发者损害了训练数据的潜在许可市场。Chhabria 法官 解释 说,将丧失的许可费视为损害将使公平使用分析变得循环,自动偏向于版权持有者。Alsup 法官发现,针对人工智能训练的书籍许可市场“不是版权法赋予作者利用的市场”。
法院拒绝将自愿许可安排视为建立法律上获得许可费的权利,至少在使用足够变革性的情况下。这些裁决表明,新兴的许可市场并不自动赋予版权持有者禁止其作品的公平使用的权利。
战略影响
对于版权持有者来说,最强的案件将是那些市场替代明显可识别的案件。他们可能会战略性地专注于那些输出最接近其原始作品的 AI 系统,而不是对训练本身提出广泛的挑战。
如果 TRAIN 法案成为法律,版权持有者将获得发现工具来调查其作品如何被使用。然而,获得信息只是第一步。证明市场损害将仍然是任何侵权诉讼成功的关键。
对于人工智能开发者,最近的判决提供了一个降低风险的框架。首先,确保数据来源合法。 Bartz 和 Kadrey 都区分了使用作品进行训练(可能是公平使用)和通过盗版获取它们。Alsup 法官发现 Anthropic 从盗版网站下载是“固有且不可救赎的侵权”,即使后续的训练可能是公平使用。
第二,设计产品的目的是与训练数据源不同的。一个帮助用户撰写文档的 AI 系统服务于与其训练数据中的小说或文章不同的目的。一个仅检索或复制这些作品的系统与其训练数据中的作品服务于相同的目的。
第三,实施防护措施以防止大量的逐字复制。 Kadrey 法院注意到 Meta 的系统即使在对抗性测试下也只复制了最小的内容,这支持了公平使用。允许系统大量复制受版权保护的作品的开发者可能面临着显著更大的法律风险。
结论
TRAIN 法案可能很快会给版权持有者提供工具来发现他们的作品是否被用于人工智能训练。然而,最近的判决明确表明,这样的发现只是开始。新兴的美国框架集中在市场损害上,要求证明可识别的经济损害,而不仅仅是训练使用。
人工智能开发者应该关注三件事:合法获取数据,构建服务于超出训练材料目的的产品,并防止系统逐字复制大量文本。另一方面,版权持有者将拥有最强的案件,当他们能够证明一个 AI 产品实际上取代了他们的作品在市场中的地位。












