人工智能

云flare的AI机器人阻塞的影响

mm

云flare的AI机器人阻塞的影响

云flare,一家最大的互联网基础设施提供商,推出了一个新的AI机器人阻塞功能,被誉为内容创作者和更广泛的网络的潜在“游戏规则改变者”。这个创新系统旨在自动检测和减轻不想要的AI机器人爬虫,从根本上重新定义了网站所有者和AI公司之间的关系。

云flare现在是第一个互联网基础设施提供商,它默认阻止AI机器人爬虫访问内容,而不需要许可或补偿。这个功能使网站所有者能够决定是否允许AI机器人爬虫访问他们的内容,以及如何使用这些内容。这改变了内容抓取的方式,从“选择退出”变成了“选择加入”。现有的客户可以通过在云flare控制面板中单击一个按钮来启用此功能。

该功能适用于所有客户,包括免费计划的客户,使其对所有规模的网站都可用。

云flare的AI机器人阻塞如何运作

核心功能和默认阻塞

云flare已经看到超过100万客户在2024年7月激活了一个类似的功能,当时它成为一个选项。但是,该公司宣布它将默认阻止AI机器人爬虫访问其客户的网站。这个新功能使网站所有者能够决定是否允许AI机器人爬虫访问他们的内容,以及如何使用这些内容。

该功能是通过HTTP状态代码402(“需要付款”)与现有的Web基础设施集成的。当AI机器人爬虫请求内容时,它要么通过请求头提供付款意图,要么收到一个402响应,指示需要付款。

高级机器人管理工具

云flare现在为客户提供创建和管理robots.txt文件的功能,自动包含指令,指示流行的AI机器人操作员不要将内容用于AI模型训练。这对于许多网站来说至关重要,因为robots.txt是一个“荣誉系统”,但许多网站并没有有效地利用它。

网站所有者现在可以选择阻止AI机器人爬虫访问他们网站的某些部分,这些部分通过广告进行了盈利。激活此设置将阻止经过验证的机器人爬虫,这些机器人被归类为AI相关类别,例如AI助手、AI机器人爬虫或存档器,以及一些未经验证的机器人爬虫,它们表现出类似的行为。

对云flare覆盖的网站的影响

重新控制和评估内容

云flare的新工具被视为给予出版商“他们应得的控制权”,对于互联网的生存至关重要。传统的互联网模型,即搜索引擎驱动流量和广告收入,被认为是“破碎的”,因为使搜索引擎索引内容的爬虫也是使AI机器人爬虫能够收集内容的爬虫,例如文本、文章和图像,以生成答案,而不将访问者发送到原始来源,从而剥夺创作者的收入和认可。

出版商已经庆祝云flare的新计划,认为这是一个罕见的决定性胜利和一个改变游戏规则的举动,能够防止他们的内容被数百万未经识别的AI机器人爬虫免费掠夺。行业领袖将其描述为重建可行的互联网经济的第一步,强调内容创作者应该为他们的工作获得补偿。

解决财务和运营挑战

AI机器人爬虫的大规模内容抓取对网站所有者产生了重大财务影响,破坏了公司在创建和发布网络内容方面的巨大投资。未经控制的机器人爬虫活动还可能对网站性能产生不利影响,导致服务器过载、网站速度变慢、分析数据失真以及运营成本增加。

出版商报告了“无效流量”标志的问题,这可能导致主要的供应商平台阻止域名,导致需求和定价压力大幅下降。云flare的解决方案通过有效地阻止未经授权的机器人爬虫来解决这个问题,这比robots.txt的“荣誉系统”要好得多。

证实的影响和广泛的出版商采用

多家大型出版商,包括康泰纳仕、时代杂志、美联社、大西洋月刊、Adweek和财富杂志,已经与云flare合作,通过默认方式阻止AI机器人爬虫。激活此功能后,立即产生了重大影响,一些出版商在激活功能后几个小时内就阻止了来自未经授权公司的数百万个AI请求。

对于许多出版商来说,需要此功能是明确的,因为他们的知识产权被大型科技公司通过AI和中国的方式剥削,而AI驱动的搜索对网站流量的负面影响不断加剧。2025年初,Open AI的机器人爬虫返回的每250个页面只对应一个访客,而到6月份,这个比例已经下降到每1500个页面对应一个访客。

更广泛的网络生态系统涟漪效应和未来

对AI开发者和模型训练的影响

默认阻止AI机器人爬虫访问内容而不需要许可或补偿的决定可能会对AI开发者的模型训练能力产生重大影响。这可能会对AI模型训练产生短期影响,并可能在长期内影响某些模型的可行性。

当云flare预览其计划以默认方式阻止AI机器人爬虫时,OpenAI拒绝参与,理由是内容分发网络正在将中间人添加到系统中。

SEO影响和搜索引擎区别

对于实施云flare的AI机器人阻塞的网站所有者来说,了解AI机器人爬虫和传统搜索引擎机器人爬虫之间的区别至关重要。谷歌并不关心你是否阻止其他机器人爬虫,AI机器人爬虫服务于一个完全不同的目的:收集信息以训练或更新语言模型,而搜索引擎机器人爬虫则用于索引内容以进行排名。这意味着通过云flare的系统阻止AI机器人爬虫不会对SEO或排名产生负面影响,这意味着SEO策略,如反向链接,仍然很重要。

然而,随着搜索引擎将AI功能集成到其结果中,SEO格局正在演变。阻止特定的机器人爬虫可能会影响网站在搜索结果中的可见性,可能会影响可发现性,特别是当搜索引擎开发AI驱动的功能时。云flare方法的主要优势在于其细粒度控制,允许出版商在阻止AI机器人爬虫的同时保持传统搜索引擎的SEO优势。

行业特定影响

新闻出版商

这个系统为新闻出版商提供了一个潜在的、急需的持久系统,他们正面临生存问题,因为谷歌搜索流量正在下降,AI聊天机器人正在流行。它为他们提供了一种机制来使他们的内容盈利,而无需与大型出版商签订单独的许可协议。

电子商务平台

云flare系统的普遍好处,例如减少服务器负载、防止分析数据失真以及减轻内容盗窃,对任何网站都适用,包括电子商务平台。这些平台严重依赖于一致的性能、准确的用户数据以及对未经授权的数据抓取的保护。

API服务

受控访问和数字资产盈利的核心原则,尽管目前专注于网络内容,但在未来可能扩展到保护和盈利通过API访问的数据。

竞争格局和未来展望

云flare被20%的网络使用,据估计,全球16%的互联网流量直接通过云flare,这使其能够实施如此大规模的系统。内容市场的愿景面临挑战,因为说服AI公司为他们目前免费抓取的内容付费可能很困难。

虽然许多人欢迎云flare的工具,但也有人认为它只是一个部分的解决方案,而不是一个完整的解决方案,重点应该放在整个互联网上加强法律保护,以防止AI公司盗窃内容。

结论

云flare的AI机器人阻塞代表了一种多方面的方法,旨在赋予内容创作者权力,并重塑网络出版商和AI之间的关系。通过提供强大的控制机制和新的经济模型,如每次抓取付费,它旨在为创作者和AI公司建立一个更加公平的互联网。虽然面临挑战和更广泛的行业适应的需要,但这一举措标志着保护网络内容创作未来的一项重大步骤。通过机制和新的经济模型,如每次抓取付费,它旨在为创作者和AI公司建立一个更加公平的互联网。虽然面临挑战和更广泛的行业适应的需要,但这一举措标志着保护网络内容创作未来的一项重大步骤。

Gary 是一位拥有超过 10 年软件开发、网页开发和内容策略经验的专家作家。他专门创作高质量、引人入胜的内容,能够驱动转化和建立品牌忠诚度。他热衷于编织能够吸引和告知受众的故事,并且总是寻找新的方式来吸引用户。