存根 SEO 优化:Google 的 AI 工作原理(2024 年 XNUMX 月)
关注我们.

搜索引擎优化

SEO 优化:Google 的 AI 工作原理(2024 年 XNUMX 月)

mm
更新 on

搜索引擎优化 (SEO) 是优化页内和页外因素的过程,这些因素会影响特定搜索词的网页排名。 这是一个多方面的过程,包括优化页面加载速度、生成链接构建策略、使用 SEO工具,以及学习如何使用逆向工程谷歌的人工智能 计算思维.

计算思维是计算机程序员在编写代码和算法时使用的一种高级分析和解决问题的技术。 计算思想家将通过分解问题并使用第一原理思维进行分析来寻求真相。

由于谷歌不会向任何人透露他们的秘密武器,因此我们将依赖计算思维。 我们将回顾谷歌历史上的一些关键时刻,这些时刻塑造了所使用的算法,我们将了解为什么这很重要。

如何创造心灵

我们将从 2012 年出版的一本书开始,名为“如何建立思想:揭示人类思想的秘密” 著名未来学家、发明家雷·库兹韦尔 (Ray Kurzweil) 提出。 这本书剖析了人脑,并分解了它的工作方式。 我们从头开始学习大脑如何使用模式识别来训练自己成为预测机器,始终致力于预测未来,甚至预测下一个单词。

人类如何识别日常生活中的模式? 这些连接是如何在大脑中形成的? 本书从理解层次思维开始,这是理解由多种元素组成的结构,这些元素以某种模式排列,然后这种排列代表一个符号,例如字母或字符,然后进一步排列成更高级的模式例如一个单词,最后是一个句子。 最终这些模式形成想法,而这些想法又转化为人类负责构建的产品。

通过模拟人脑,揭示了一种创建先进人工智能的途径,超越了发布时神经网络的当前能力。

这本书是创建人工智能的蓝图,该人工智能可以通过吸收世界数据来扩展,并使用其多层模式识别处理来解析文本、图像、音频和视频。 由于云及其并行处理能力的优势,该系统针对升级进行了优化。 换句话说,数据输入或输出不会有最大值。

这本书如此重要,以至于在其出版后不久,作者 雷·库兹韦尔 (Ray Kurzweil) 被谷歌聘用 成为专注于机器学习和语言处理的工程总监。这个角色与他写的书完美契合。

无法否认这本书对谷歌的未来以及他们如何对网站进行排名的影响有多大。 这 人工智能书 对于任何希望成为 SEO 专家的人来说,这应该是必读的内容。

DeepMind

DeepMind 成立于 2010 年,是一家炙手可热的初创公司,它使用了一种席卷全球的革命性新型人工智能算法,即强化学习。 DeepMind 对它的最佳描述是:

“我们提出了第一个深度学习模型,可以使用强化学习直接从高维感官输入中成功学习控制策略。该模型是一个卷积神经网络,采用 Q 学习的变体进行训练,其输入是原始像素,其输出是估计未来奖励的价值函数。”

通过将深度学习与强化学习相融合,它成为 深度强化学习 系统。 到 2013 年,DeepMind 已使用这些算法在 Atari 2600 游戏中战胜人类玩家——这是通过模仿人脑及其从训练和重复中学习的方式来实现的。

类似于人类通过重复学习的方式,无论是踢球还是玩俄罗斯方块,人工智能也会学习。 人工智能的神经网络跟踪表现,并会逐步自我改进,从而在下一次迭代中产生更强的移动选择。

DeepMind 在技术方面占据主导地位,以至于谷歌不得不购买该技术。 DeepMind 被收购 500 年销售额超过 2014 亿美元。

收购后,人工智能产业接连突破,前所未有 11年1997月XNUMX日,棋时 棋圣 加里·卡斯帕罗夫输了 与深蓝(IBM 科学家开发的国际象棋计算机)进行的六场比赛中的第一场比赛。 

2015 年,DeepMind 改进了算法,并在 Atari 的 49 款游戏上进行了测试,机器在其中 23 款游戏中击败了人类。

这只是开始,2015 年晚些时候 DeepMind 开始专注于 AlphaGo,该计划的既定目标是击败职业围棋世界冠军。 围棋这种古老的游戏大约 4000 年前首次出现在中国,被认为是人类历史上最具挑战性的游戏,具有巨大的潜力 10360 可能的举动。

DeepMind 使用监督学习通过向人类棋手学习来训练 AlphaGo 系统。 不久之后,AlphaGo 击败 DeepMind 成为头条新闻 李世石2016年XNUMX月,世界冠军在一场五局比赛中。

DeepMind 也不甘示弱,2017 年 XNUMX 月发布了 AlphaGo Zero,这是一个新模型,其关键区别在于它需要零 人类训练。 由于它不需要人工训练,也不需要数据标签,该系统本质上使用 无监督学习。 AlphaGo Zero 迅速超越了它的前身, DeepMind 描述.

“早期版本的 AlphaGo 最初是在数千场人类业余和职业比赛中进行训练来学习如何下围棋。 AlphaGo Zero 跳过了这一步,只是从完全随机的对弈开始,通过与自己对弈来学习对弈。 通过这样做,它很快超越了人类的游戏水平并击败了 先前发表 以 100 比 0 击败冠军版 AlphaGo。”

与此同时,SEO 世界高度关注 PageRank,即 Google 的支柱。 故事开始于 1995 年,当时拉里·佩奇 (Larry Page) 和谢尔盖·布林 (Sergey Brin) 是该校的博士。 斯坦福大学的学生。 两人开始合作开展一个名为“BackRub的”。 目标是通过转换网页的反向链接数据来对网页进行重要性衡量。 反向链接很简单,就是从一个页面到另一个页面的任何链接,与此类似 链接.

该算法后来更名为 PageRank,以术语“网页”和联合创始人拉里·佩奇 (Larry Page) 命名。 拉里·佩奇(Larry Page)和谢尔盖·布林(Sergey Brin)有着雄心勃勃的目标,即建立一个可以纯粹通过反向链接为整个网络提供动力的搜索引擎。

它奏效了。

PageRank 占据头条新闻

SEO 专业人士立即了解 Google 如何使用 PageRank 计算网页质量排名的基础知识。 一些精明的黑帽 SEO 企业家更进一步,他们明白,为了扩展内容,购买链接而不是等待有机地获取链接可能是有意义的。

围绕反向链接出现了一种新经济。 渴望影响搜索引擎排名的网站所有者会购买链接,作为回报,渴望通过网站获利的网站会向他们出售链接。

购买链接的网站通常会在一夜之间入侵谷歌,排名超过知名品牌。

使用这种方法进行排名在很长一段时间内都非常有效——直到它停止工作,可能大约在同一时间机器学习开始发挥作用并解决了根本问题。随着深度强化学习的引入,PageRank 将成为一个排名变量,而不是主导因素。

到目前为止,SEO 社区对于链接购买策略存在分歧。 我个人认为,链接购买提供了次优结果,并且获取反向链接的最佳方法基于行业特定的变量。 我可以推荐的一项合法服务称为 HARO (帮助记者)。 HARO 的机会是通过满足媒体请求来获取反向链接。

知名品牌永远不必担心采购环节,因为他们可以享受到对自己有利的时间工作的好处。 网站越老,收集高质量反向链接的时间就越多。 换句话说,如果使用指标进行计算,搜索引擎排名在很大程度上取决于网站的年龄 时间=反向链接.

例如,CNN 自然会收到一篇新闻文章的反向链接,因为它的品牌、信任度以及它一开始的排名就很高——因此它自然会从研究文章并链接到他们发现的第一个搜索结果的人们那里获得更多的反向链接。

这意味着排名较高的网页自然会收到更多的反向链接。 不幸的是,这意味着新网站经常被迫转向反向链接市场来滥用反向链接算法。

在 2000 年代初,购买反向链接效果非常好,而且过程很简单。 链接购买者从高权威网站购买链接,通常是站点范围的页脚链接,或者可能是在每篇文章的基础上(通常伪装成客座帖子),而迫切希望通过其网站获利的卖家很乐意帮忙 - 不幸的是,往往会牺牲质量。

最终,Google 机器学习工程师人才库明白,手动编码搜索引擎结果是徒劳的,而且很多 PageRank 都是手写编码。 相反,他们明白人工智能最终将负责在没有或很少人为干扰的情况下完全计算排名。

为了保持竞争力,谷歌使用了他们武器库中的所有工具,其中包括 深度强化学习 – 世界上最先进的机器学习算法。

该系统分层于 谷歌收购 MetaWeb 是一个游戏规则改变者。 2010 年 MetaWeb 收购之所以如此重要,是因为它降低了 Google 对关键词的重视程度。 上下文突然变得很重要,这是通过使用称为“实体”的分类方法来实现的。 作为 Fast Company 描述:

一旦 Metaweb 弄清楚您所指的是哪个实体,它就可以提供一组结果。 它甚至可以组合实体进行更复杂的搜索——“40 岁以上的女演员”可能是一个实体,“居住在纽约市的女演员”可能是另一个实体,“正在播放电影的女演员”可能是另一个实体。 ”。

这项技术被纳入一个名为“算法更新”的主要算法中 RankBrain 该项目于 2015 年春季推出。RankBrain 专注于理解上下文而不是纯粹基于关键字,RankBrain 还将考虑环境上下文(例如搜索者位置)并推断出以前没有的含义。 这是一个重要的更新,特别是对于移动用户而言。

现在我们了解了谷歌如何使用这些技术,让我们使用计算理论来推测它是如何完成的。

什么是深度学习?

深入学习 是最常用的机器学习类型——谷歌不可能不使用这种算法。

深度学习受到人类大脑运作方式的显着影响,它试图通过使用模式识别来识别和分类对象来反映大脑的行为。

例如,如果您看到这封信 a,你的大脑会自动识别线条和形状,然后将其识别为字母 a。 字母也同样适用 ap,你的大脑会自动尝试通过想出潜在的词语来预测未来,例如 应用 or 苹果。 其他模式可能包括数字、路标或在拥挤的机场中识别亲人。

您可以将深度学习系统中的互连视为类似于人脑通过神经元和突触连接进行操作的方式。

深度学习最终是指将许多多层感知器连接在一起的机器学习架构,因此不仅有一个隐藏层,而且有许多隐藏层。 深度神经网络越“深”,网络可以学习的模式就越复杂。

全连接网络可以与其他机器学习功能相结合,创建不同的深度学习架构。

谷歌如何使用深度学习

谷歌通过跟踪将网站相互连接的超链接(想想神经元)来抓取世界上的网站。 这是谷歌从第一天起就使用的原始方法,并且仍在使用。 一旦网站被索引,就会使用各种类型的人工智能来分析这个数据宝库。

谷歌的系统根据各种内部指标对网页进行标记,只需要少量的人工输入或干预。 干预的一个例子是由于以下原因手动删除特定 URL: DMCA 删除请求.

谷歌工程师因让与会者感到沮丧而闻名 搜索引擎优化会议,这是因为谷歌高管永远无法正确阐明谷歌的运营方式。 当被问到为什么某些网站无法排名时,几乎总是同样的表达不清的回答。 响应如此频繁,以至于与会者常常先发制人地表示,他们已经承诺连续数月甚至数年创造优质内容,但没有取得积极成果。

可以预见的是,网站所有者被指示专注于构建有价值的内容——这是一个重要的组成部分,但远非全面。

缺乏答案是因为高管们无法正确回答这个问题。 谷歌的算法在黑匣子中运行。 先有输入,然后有输出——这就是深度学习的工作原理。

现在让我们回到排名惩罚上来,这种惩罚通常在网站所有者不知情的情况下对数百万个网站产生负面影响。

网页速度洞察

Google 通常并不透明,PageSpeed Insights 是个例外。 未通过此速度测试的网站将因加载缓慢而被发送至惩罚箱 - 特别是在移动用户受到影响的情况下。

怀疑的是,在该过程的某个时刻,有一个决策树可以解析快速网站,而不是解析加载缓慢(PageSpeed Insights 失败)的网站。决策树本质上是一种算法方法,它根据不同的标准将数据集分割成单独的数据点。该标准可能会对移动用户与桌面用户的页面排名产生负面影响。

假设可以对自然排名分数进行惩罚。 例如,一个在没有惩罚的情况下排名第 5 的网站可能有 -20、-50 或一些其他未知变量,这些变量会将排名降低到 #25、#55 或 AI 选择的其他数字。

将来,当谷歌对他们的人工智能变得更有信心时,我们可能会看到 PageSpeed Insights 的终结。 谷歌目前对速度的干预是危险的,因为它可能会消除本来最佳的结果,并且歧视不太懂技术的人。

要求每个经营小型企业的人都具备成功诊断和解决速度测试问题的专业知识是一个很大的要求。 一个简单的解决方案是 Google 为 WordPress 用户发布一个速度优化插件,例如 WordPress 的力量 43% 互联网

不幸的是,如果一个网站未能通过,所有的SEO努力都是徒劳的 谷歌的 PageSpeed Insights。 其风险无异于网站从谷歌中消失。

如何通过此测试将是另一篇文章的内容,但至少您应该验证您是否 网站通行证.

另一个需要担心的重要技术指标是名为 SSL (安全链路层)。 这会将域的 URL 从 http 更改为 https,并确保数据的安全传输。 任何未启用 SSL 的网站都会受到处罚。 尽管此规则有一些例外,但电子商务和金融网站将受到最严重的影响。

低成本网络主机收取 SSL 实施年费,同时优质网络主机如 Siteground 免费颁发 SSL 证书并自动集成。

元数据

网站上的另一个重要元素是元标题和元描述。 这些内容字段具有极大的重要性顺序,其对页面成功或失败的贡献可能与该页面的整个内容一样大。

这是因为 Google 有很高的概率选择元标题和元描述在搜索结果中展示。 这就是为什么尽可能仔细地填写元标题和元描述字段很重要。

另一种选择是,谷歌可能会选择忽略元标题和元描述,而是自动生成预计会带来更多点击的数据。 如果谷歌对自动生成的标题预测不佳,这将导致搜索者的点击量减少,从而导致搜索引擎排名下降。

如果谷歌认为包含的元描述经过优化以接收点击,它将在搜索结果中展示它。 如果失败,谷歌会从网站上随机抓取一段文本。 通常,谷歌会选择页面上最好的文本,问题是这是抽签系统,而谷歌在选择描述方面一直表现不佳。

当然,如果您认为页面上的内容确实不错,有时允许 Google 选择最适合用户查询的优化元描述是有意义的。 我们将选择不为本文提供元描述,因为它内容丰富,并且 Google 可能会选择一个好的描述。

与此同时,数十亿人正在点击最佳搜索结果——这就是 人在环,谷歌最后的反馈机制——这就是强化学习发挥作用的地方。

什么是强化学习?

强化学习 是一种机器学习技术,涉及通过重复动作和相关奖励来训练人工智能代理。 强化学习代理在环境中进行实验,采取行动并在采取正确行动时获得奖励。 随着时间的推移,代理 学会采取能够最大化其回报的行动。

奖励可以基于计算在推荐页面上花费的时间的简单计算。

如果将此方法与人机交互子例程结合起来,这听起来非常像控制我们数字生活各个方面的现有推荐引擎,例如 YouTube、Netflix、Amazon Prime – 如果听起来像这样搜索引擎应该操作你是正确的。

谷歌如何使用强化学习

谷歌飞轮随着每次搜索而改进,人类通过选择最能回答他们的查询的最佳结果以及数百万其他用户的类似查询来训练人工智能。

强化学习代理通过仅强化搜索和交付的搜索结果之间最积极的交互来不断进行自我改进。

Google 会测量用户扫描结果页面、他们点击的 URL 所花费的时间,并测量在访问的网站上花费的时间,并记录返回点击。 然后,针对提供类似数据匹配或用户体验的每个网站,对这些数据进行编译和比较。

然后,强化学习系统会向保留率(在网站上花费的时间)较低的网站提供负值,并测试其他竞争网站以提高所提供的排名。 谷歌是公正的,假设没有人工干预,谷歌最终会提供所需的搜索结果页面。

用户是为谷歌提供免费数据的人在循环中,成为深度强化学习系统的最终组成部分。 作为这项服务的交换,Google 为最终用户提供了点击广告的机会。

除了产生收入之外的广告充当次要排名因素,提供更多有关用户想要点击的数据。

谷歌本质上是了解用户想要什么。 这可以粗略地与视频流服务的推荐引擎进行比较。 在这种情况下,推荐引擎会向用户提供针对其兴趣的内容。 例如,习惯性喜欢一系列浪漫喜剧的用户如果共享相同的喜剧演员,可能会喜欢一些模仿作品。

这对 SEO 有什么帮助?

如果我们继续进行计算思维,我们可以假设谷歌已经训练自己以提供最佳结果,而这通常是通过概括和满足人类偏见来实现的。 事实上,谷歌的人工智能不可能不优化迎合这些偏见的结果,如果这样做的话,结果将是次优的。

换句话说,没有神奇的公式,但有一些最佳实践。

SEO 从业者有责任认识到 Google 寻求的针对其行业的偏见,并消除这些偏见。 例如,有人在没有指定日期的情况下搜索选举民意调查结果,很可能是在搜索最新的结果——这是新近度偏差。 搜索菜谱的人很可能不需要最新的页面,并且实际上可能更喜欢经受时间考验的菜谱。

SEO 从业者有责任为访问者提供他们正在寻找的结果。 这是 Google 中最可持续的排名方式。

网站所有者必须放弃以特定关键字为目标,期望他们可以向最终用户提供他们想要的任何内容。 搜索结果必须准确匹配用户的需求。

什么是偏见? 可能是拥有一个看起来权威性很高的域名,换句话说,该域名是否与您所服务的市场相匹配? 由于信任源自用户居住国的结果的民族主义偏见,包含印度一词的域名可能会阻止美国用户点击该 URL。 拥有一个单词域名也可能会给人一种权威的错觉。

最重要的偏见是用户想要匹配他们的搜索查询的内容是什么? 是常见问题解答、前 10 个列表还是博客文章? 这是需要回答的,而且答案很容易找到。 您只需要通过在目标市场中执行 Google 搜索来分析竞争情况即可。

黑帽 SEO 已死

将此与黑帽 SEO 进行比较,黑帽 SEO 是一种利用狡猾的垃圾邮件技术对网站进行排名的激进方法,包括购买反向链接、伪造反向链接、黑客网站、大规模自动生成社交书签以及通过黑帽工具网络应用的其他黑暗方法。

这些工具经常在各种搜索引擎营销论坛上被重新利用和转售,这些产品几乎没有价值,成功的可能性很小。 目前,这些工具使卖家变得富有,但它们为最终用户提供的价值却微乎其微。

这就是为什么我建议放弃黑帽。 将您的 SEO 重点放在从机器学习的角度来看待它。 重要的是要明白,每次有人跳过搜索结果并点击埋藏在下面的结果时,都是人机循环与深度强化学习系统的协作。 人类正在协助人工智能自我完善,随着时间的推移变得无限更好。

这是一种机器学习算法,其训练的用户数量比人类历史上任何其他系统都多。

Google 在全球范围内平均每分钟处理 3.8 万次搜索。 每小时搜索量达到 228 亿次, 每天5.6亿次搜索。 这是大量的数据,这就是为什么尝试黑帽 SEO 是愚蠢的。 假设谷歌的人工智能将保持停滞状态是愚蠢的,该系统正在使用 加速回报法则 以指数方式自我提升。

谷歌的人工智能正变得如此强大,可以想象它最终可能成为第一个达到这一目标的人工智能 人工智能 (通用人工智能)。 AGI 是一种能够使用 转移学习 掌握一个领域,然后将学到的知识应用到多个领域。 虽然探索谷歌未来的 AGI 努力可能很有趣,但应该理解的是,一旦这个过程开始,就很难停止。 这当然是对未来的推测,因为谷歌目前是一种狭义人工智能,但这是另一篇文章的主题。

要知道在黑帽上多花一秒钟是一件愚蠢的事。

白帽SEO

如果我们承认谷歌的人工智能会不断自我改进,那么我们别无选择,只能放弃智胜谷歌的尝试。 相反,应该专注于优化网站,以最佳方式向 Google 提供其所需的具体内容。

如上所述,这涉及启用 SSL、优化页面加载速度以及优化元标题和元描述。 为了优化这些字段,必须将元标题和元描述与竞争网站进行比较 - 确定导致高点击率的获胜元素。

如果您优化了点击,下一个里程碑就是创建最佳着陆页。 我们的目标是建立一个能够极大地优化用户价值的登陆页面,使得用户在页面上花费的平均时间超过那些争夺顶级搜索引擎结果的类似竞争对手。

网页只有提供最佳的用户体验才能提高排名。

到目前为止,我们已经确定这些指标是最重要的:

  • 装车速度
  • 启用 SSL
  • 元标题和元描述
  • 登陆页面

当您与世界竞争时,着陆页是最困难的元素。 登陆页面必须快速加载,并且必须提供预期的一切,然后给用户带来更多惊喜。

最后的思考

很容易用另外 2000 个单词来描述 Google 使用的其他人工智能技术,并进一步深入挖掘 SEO 的兔子洞。 这里的目的是将注意力重新集中在最重要的指标上。

SEO 分区者如此专注于游戏系统,以至于他们忘记了归根结底,SEO 最重要的元素是为用户提供尽可能多的价值。

实现这一目标的一种方法是永远不要让重要内容变得陈旧。 如果一个月后我想到一个重要的贡献,它将添加到本文中。 然后,谷歌可以识别内容的新鲜程度,并与页面提供价值的历史相匹配。

如果您仍然担心获取反向链接,解决方案很简单。 尊重访客的时间并赋予他们价值。 反向链接会自然而然地出现,因为用户会发现分享您的内容的价值。

然后问题就转移到网站所有者如何提供最佳的用户价值和用户体验。

Unite.AI 创始合伙人 & 会员 福布斯技术委员会, 安托万是一个 未来学家 他对人工智能和机器人技术的未来充满热情。

他也是 证券,一个专注于投资颠覆性技术的网站。