AI 模型与平台

从训练好的LLM中去除版权数据——是否可行?

mm
Blog Image of Copyright Symbols

在人工智能(AI)和机器学习(ML)领域,大型语言模型(LLMs)展示了成就和挑战。在大量文本数据集上训练,LLM模型涵盖了人类语言和知识。

然而,它们吸收和模仿人类理解的能力带来了法律、道德和技术挑战。另外,驱动LLM的巨大数据集可能包含有毒材料、版权文本、不准确或个人数据。

使LLM忘记选定的数据已成为一个紧迫的问题,以确保法律合规和道德责任。

让我们探索使LLM忘记版权数据的概念,以解决一个基本问题:是否可行?

为什么需要LLM的去学习?

LLM通常包含有争议的数据,包括版权数据。在LLM中拥有此类数据会带来与私人信息、偏见信息、版权数据和虚假或有害元素相关的法律挑战。

因此,去学习对于确保LLM遵守隐私法规和遵守版权法律至关重要,促进负责任和道德的LLM。

版权法和知识产权的股票图像

然而,从这些模型获得的巨大知识中提取版权内容是一个挑战。以下是一些去学习技术,可以帮助解决这个问题:

  • 数据过滤:它涉及系统地识别和删除版权元素、噪音或偏见数据,从模型的训练数据中。然而,过滤可能会导致在过滤过程中丢失有价值的非版权信息。
  • 梯度方法:这些方法根据损失函数的梯度调整模型的参数,以解决ML模型中的版权数据问题。然而,调整可能会对模型在非版权数据上的整体性能产生不利影响。
  • 上下文去学习:这种技术通过更新其参数来有效地消除特定训练点对模型的影响,而不会影响无关的知识。然而,该方法在实现精确的去学习方面面临限制,特别是在大型模型中,其有效性需要进一步评估。

这些技术是资源密集型和耗时的,使得它们难以实施。

案例研究

为了了解LLM去学习的重要性,这些真实案例强调了公司如何面临与大型语言模型(LLM)和版权数据相关的法律挑战。

OpenAI诉讼: OpenAI,一家著名的AI公司,已被多起诉讼针对LLM的训练数据。这些法律行动质疑LLM训练中使用版权材料,并引发了对模型获取每个版权作品许可的机制的调查。

萨拉·西尔弗曼诉讼: 萨拉·西尔弗曼案涉及一项指控,ChatGPT模型在未经授权的情况下生成了她书籍的摘要。这一法律行动凸显了AI和版权数据的未来所面临的重要问题。

更新法律框架以适应技术进步,确保AI模型的负责任和合法使用。此外,研究社区必须全面解决这些挑战,以使LLM变得道德和公平。

传统LLM去学习技术

LLM去学习就像从复杂的食谱中分离特定的成分,确保只有期望的成分贡献于最终的菜肴。传统的LLM去学习技术,例如使用精心策划的数据进行微调和重新训练,缺乏删除版权数据的直接机制。

它们的宽泛方法通常被证明对于选择性去学习的复杂任务来说效率低下且耗费资源,因为它们需要大量的重新训练。

虽然这些传统方法可以调整模型的参数,但它们难以精确地针对版权内容,冒着意外数据丢失和次优合规性的风险。

因此,传统技术的局限性和强大的解决方案需要用替代的去学习技术进行实验。

新技术:去学习训练数据的一个子集

微软研究论文介绍了一种开创性的技术,用于从LLM中去学习版权数据。以Llama2-7b模型和哈利·波特书籍为例,该方法包括三个核心组件,使LLM忘记哈利·波特的世界。这些组件包括:

  • 增强模型识别:创建增强模型涉及微调目标数据(例如哈利·波特),以加强其对要去学习的内容的知识。
  • 替换特异性表达式:目标数据中的独特哈利·波特表达式被替换为通用表达式,促进了更广泛的理解。
  • 基于替代预测的微调:基线模型根据这些替代预测进行微调。基本上,它有效地从其记忆中删除原始文本,当遇到相关上下文时。

虽然微软技术仍处于初期阶段,可能存在局限性,但它代表了向更强大、更道德和更适应性LLM迈出的一步。

新技术的结果

微软研究论文中提出的使LLM忘记版权数据的创新方法,是朝着负责任和道德的模型迈出的一步。

新技术涉及从Meta的Llama2-7b模型中删除与哈利·波特相关的内容,该模型已知是在包含版权作品的“books3”数据集上进行训练的。值得注意的是,模型的原始响应表明,即使使用通用提示,也对J.K.罗琳的宇宙有着细致的理解。

然而,微软提出的技术显著改变了其响应。以下是提示的示例,展示了原始Llama2-7b模型和微调版本之间的显著差异。

微调提示与基线比较

图像来源

该表格说明了微调的去学习模型在不同基准(如Hellaswag、Winogrande、piqa、boolq和arc)上保持其性能。

新技术基准评估

图像来源

评估方法依赖于模型提示和随后的响应分析,证明是有效的,但可能会忽略更复杂的对抗性信息提取方法。

虽然该技术很有前景,但需要进一步的研究来改进和扩展,特别是在LLM中解决更广泛的去学习任务。

新去学习技术的挑战

虽然微软的去学习技术显示出希望,但存在一些AI版权挑战和限制。

关键限制和改进领域包括:

  • 版权信息泄露:该方法可能无法完全减轻版权信息泄露的风险,因为模型在微调过程中可能会保留一些目标内容的知识。
  • 评估各种数据集:为了衡量其有效性,需要在多个数据集上评估该技术,因为初始实验仅关注哈利·波特书籍。
  • 可扩展性:测试更大的数据集和更复杂的语言模型对于评估该技术在现实场景中的适用性和适应性至关重要。

AI相关的法律案件,特别是针对LLM的版权诉讼的增加,凸显了明确指南的必要性。像微软提出的去学习方法这样的有前途的发展,为道德、合法和负责任的AI铺平了道路。

不要错过AI和ML的最新新闻和分析——今天访问unite.ai

Haziqa 是一名具有丰富经验的数据科学家,擅长为 AI 和 SaaS 公司撰写技术内容。