人工智能

AI开发安全：解决由幻觉代码引起的漏洞

发布于 2024年5月21日

更新于 2026年5月21日

作者

Dr. Assad Abbas

Learn about current mitigation efforts, future strategies, and the importance of ethical considerations in AI-generated code reliability

在人工智能（AI）发展的同时，软件开发领域也正在经历着重大转变。传统上，开发人员依赖于像Stack Overflow这样的平台来解决编码挑战。然而，随着大型语言模型（LLMs）的出现，开发人员在编程任务中得到了前所未有的支持。这些模型在生成代码和解决复杂编程问题方面表现出色，具有潜力简化开发工作流程。

然而，最近的发现引发了人们对这些模型生成的代码可靠性的担忧。AI“幻觉”的出现尤其令人担忧。这些幻觉发生在AI模型生成虚假或不存在的信息时，这些信息看起来很真实。Vulcan Cyber的研究人员强调了这个问题，展示了AI生成的内容如何无意中促进网络攻击，例如推荐不存在的软件包。这些漏洞将新的威胁向量引入软件供应链，允许黑客通过将恶意代码伪装成合法推荐来渗透开发环境。

安全研究人员进行了实验，揭示了这一威胁的令人震惊的现实。通过向AI模型（如ChatGPT）提出Stack Overflow中的常见查询，他们观察到不存在的包被建议的情况。随后尝试发布这些虚构的包确认了它们在流行的包安装程序上的存在，突出了风险的即时性。

这个挑战变得更加关键，因为现代软件开发中代码重用的做法很普遍。开发人员经常将现有的库集成到他们的项目中，而没有进行严格的审查。当与AI生成的推荐结合时，这种做法变得风险很高，可能会使软件暴露于安全漏洞之下。

随着AI驱动的开发扩展，行业专家和研究人员强调了强大的安全措施的必要性。安全编码实践、严格的代码审查和代码来源的认证是必不可少的。另外，从可靠的供应商获取开源工件有助于减轻AI生成内容相关的风险。

理解幻觉代码

幻觉代码是指由AI语言模型生成的代码片段或编程结构，它们在语法上看起来正确，但在功能上存在缺陷或不相关。这些“幻觉”源于模型根据从大量数据集学习的模式来预测和生成代码的能力。然而，由于编程任务的固有复杂性，这些模型可能会生成缺乏对上下文或意图的真正理解的代码。

幻觉代码的出现根植于神经语言模型，如基于变换器的架构。这些模型，如ChatGPT，是在多样化的代码仓库上训练的，包括开源项目、Stack Overflow和其他编程资源。通过上下文学习，模型变得擅长根据前面的标记（单词或字符）预测序列中的下一个标记。因此，它识别了常见的编码模式、语法规则和习惯用语。

当模型被部分代码或描述提示时，它会通过根据学习的模式完成序列来生成代码。然而，尽管模型能够模仿语法结构，但生成的代码可能缺乏语义连贯性或不能满足预期的功能，因为模型对更广泛的编程概念和上下文细微差别的理解有限。因此，虽然幻觉代码乍一看可能与真正的代码相似，但在仔细检查时往往会显示出缺陷或不一致性，这对依赖AI生成的解决方案的开发人员来说是一个挑战。另外，研究表明，包括GPT-3.5-Turbo、GPT-4、Gemini Pro和Coral在内的各种大型语言模型都表现出高倾向于生成幻觉包，这种现象在不同的编程语言中都存在。这种包幻觉现象的普遍存在要求开发人员在将AI生成的代码推荐集成到软件开发工作流中时要谨慎。

幻觉代码的影响

幻觉代码对软件开发构成了重大安全风险。其中一个风险是恶意代码注入的可能性，即AI生成的代码片段无意中引入了攻击者可以利用的漏洞。例如，一个看似无害的代码片段可能会执行任意命令或无意中暴露敏感数据，导致恶意活动。

此外，AI生成的代码可能会推荐不安全的API调用，缺乏适当的身份验证或授权检查。这种疏忽可能导致未经授权的访问、数据泄露，甚至远程代码执行，从而放大安全漏洞的风险。另外，幻觉代码可能会由于不正确的数据处理实践而泄露敏感信息。例如，一个有缺陷的数据库查询可能会无意中暴露用户凭据，从而进一步加剧安全问题。

除了安全影响外，依赖幻觉代码的经济后果可能非常严重。将AI生成的解决方案集成到开发过程中的组织可能会因安全漏洞而面临巨大的经济损失。补救成本、法律费用和声誉损害可能会迅速升级。此外，信任侵蚀是一个重大问题，它源于对幻觉代码的依赖。

此外，开发人员可能会失去对AI系统的信心，如果他们遇到频繁的错误或安全漏洞。这种情况可能会产生深远的影响，破坏AI驱动的开发过程的有效性，并降低整个软件开发生命周期的信任度。因此，解决幻觉代码的影响对于维护软件系统的完整性和安全性至关重要。

当前缓解努力

当前缓解幻觉代码相关风险的努力涉及多方面的方法，旨在提高AI生成的代码推荐的安全性和可靠性。以下是几个简要描述：

将人工审查集成到代码审查过程中至关重要。人工审查员凭借他们的细致理解，可以识别漏洞并确保生成的代码满足安全要求。
开发人员优先理解AI的局限性，并将特定领域的数据纳入代码生成过程，以提高AI生成代码的可靠性。这种方法通过考虑更广泛的上下文和业务逻辑来增强AI生成代码的可靠性。
另外，测试程序，包括全面测试套件和边界测试，对于早期问题识别是有效的。这种方法确保AI生成的代码经过彻底的功能和安全验证。
同样，通过分析AI生成的代码推荐导致安全漏洞或其他问题的真实案例，开发人员可以获得对潜在陷阱和风险缓解最佳实践的宝贵见解。这些案例研究使组织能够从过去的经验中学习，并主动实施措施以防止未来出现类似的风险。

未来确保AI开发的策略

未来确保AI开发的策略包括高级技术、协作和标准，以及伦理考虑。

在高级技术方面，需要强调提高训练数据的质量而不是数量。通过从多样化的来源（如代码仓库和真实项目）来整理数据集，以最小化幻觉并增强上下文理解，这是至关重要的。对抗性测试也是一个重要的技术，它涉及对AI模型进行压力测试以揭示漏洞，并通过开发健壮性指标来指导改进。

同样，跨行业的协作对于分享有关幻觉代码相关风险的见解和开发缓解策略至关重要。建立信息共享平台将促进研究人员、开发人员和其他利益相关者之间的合作。这一集体努力可以带来行业标准和安全AI开发的最佳实践的发展。

最后，伦理考虑也是未来策略的重要组成部分。确保AI开发遵循伦理指南有助于防止滥用并促进对AI系统的信任。这不仅涉及确保AI生成的代码的安全，还涉及解决AI开发中的更广泛的伦理影响。

结论

总之，AI生成的解决方案中幻觉代码的出现为软件开发带来了重大挑战，包括安全风险、经济后果和信任侵蚀。当前的缓解努力侧重于将安全的AI开发实践、严格的测试和上下文意识纳入代码生成过程。另外，使用真实案例和实施主动管理策略对于有效缓解风险至关重要。

展望未来，未来策略应该强调高级技术、协作和标准，以及伦理考虑，以增强AI生成代码在软件开发工作流中的安全性、可靠性和道德完整性。

Dr. Assad Abbas

阿萨德·阿巴斯博士（Dr. Assad Abbas）是巴基斯坦伊斯兰堡COMSATS大学的终身副教授，他在美国北达科他州立大学获得了博士学位。他的研究重点是包括云计算、雾计算、边缘计算、大数据分析和人工智能在内的先进技术。阿巴斯博士在著名的科学期刊和会议上发表了大量的论文，并做出了重要的贡献。他也是 MyFastingBuddy 的创始人。

Unite.AI

AI开发安全：解决由幻觉代码引起的漏洞

理解幻觉代码

幻觉代码的影响

当前缓解努力

未来确保AI开发的策略

结论

发现更多