通用人工智能

谁将赢得2024年的AI竞赛？科技巨头的AGI之旅

发布于 2024年8月8日

更新于 2026年5月21日

作者

Aayush Mittal Mittal

Who is Winning the AI Race? Big Tech's Race to AGI

div]：bg-bg-300 [&_pre]：-mr-4 md：[&_pre]：-mr-9″>

_*]：min-w-0″>

人工智能（AI）已经成为本十年最受关注的技术进步。随着我们推动机器的能力边界，许多科技巨头的最终目标是实现人工通用智能（AGI）——一种可以理解、学习和应用其智能来解决任何问题的假设性AI形式，类似于人类的大脑。

AGI竞赛不仅仅是技术上的霸主地位；它是一场可以重塑我们社会基本结构的探索。AGI的潜在应用范围广泛且具有变革性，从解决复杂的全球问题到跨行业的革命。因此，世界领先的科技公司正在将数十亿美元和无数小时投入到AI研究和开发中。

在本文中，我们将探讨包括谷歌、NVIDIA、微软、OpenAI、Meta等关键玩家在AI竞赛中的努力。我们将讨论他们的策略、成就和他们正在采取的独特方法，以推动AI技术的边界。

理解AGI

什么是AGI？

AGI，通常被描述为人工智能的“圣杯”，被设想为一种能够执行任何人类可以执行的智力任务的系统。然而，定义AGI已被证明与实现它一样难以捉摸。人工智能领域的先驱Geoffrey Hinton指出，虽然AGI是一个“严肃的，但不明确定义的概念”，但对它的具体含义没有达成共识。Hinton更喜欢使用“超级智能”来描述将超越人类认知能力的AGI系统。

AGI的难以捉摸的性质

领先的科技巨头，包括OpenAI、谷歌、Meta、微软和亚马逊，都处于这一竞赛的前沿。每家公司都带来了其独特的优势和战略目标。例如，OpenAI致力于确保AGI，一旦开发出来，就能造福所有人类。该组织已建立了一个治理结构，其董事会将决定他们的系统何时实现AGI，这将对他们与微软的合作产生重大影响。

谷歌

谷歌长期以来一直是AI研究和开发的先驱，其努力主要由两个部门领导：DeepMind和谷歌大脑。

A. DeepMind及其成就

DeepMind，于2014年被谷歌收购，负责了AI领域的一些最开创性的成就。他们的AlphaGo程序在2016年以一场复杂的围棋比赛击败了世界冠军，这是许多人认为几十年后才会实现的壮举。这之后是AlphaZero，它通过自我强化学习在国际象棋、将棋和围棋中实现了超人类的性能。

最近，DeepMind在蛋白质折叠方面取得了显著进展，使用AlphaFold。该AI系统可以以惊人的准确性预测蛋白质结构，可能会革命性地改变药物发现和我们对疾病的理解。

B. 谷歌大脑和TensorFlow

谷歌大脑，公司的内部AI研究团队，在开发了加速全球AI研究的工具和框架方面发挥了重要作用。由谷歌大脑开发的开源机器学习库TensorFlow，已成为构建AI模型最广泛使用的工具之一。

谷歌大脑还在自然语言处理方面做出了重大贡献，使用了像BERT（双向编码器表示从变压器）这样的模型，这提高了谷歌的搜索结果和语言理解能力。

C. 最近的发展和未来计划

谷歌继续通过项目如LaMDA（语言模型用于对话应用）推动AI的边界，该项目旨在使对话式AI更加自然和上下文感知。该公司还一直致力于将AI更深入地集成到其产品中，从谷歌搜索到Gmail再到谷歌照片。

在硬件方面，谷歌开发了自己的AI芯片，称为Tensor Processing Units（TPU），专为机器学习工作负载进行了优化。这些芯片为许多谷歌的AI服务提供动力，并通过谷歌云提供给客户。

展望未来，谷歌的AI战略似乎专注于开发更通用和多功能的AI系统，可以处理广泛的任务，逐渐接近AGI的概念。该公司还在量子计算研究上投入了大量资金。

NVIDIA在AI生态系统中的作用

虽然NVIDIA可能不是像谷歌或微软那样家喻户晓的名字，但它在AI生态系统中发挥着至关重要的作用，作为AI计算的主要硬件提供商。

A. GPU在AI硬件中的主导地位

NVIDIA的图形处理单元（GPU）已成为训练和运行AI模型的事实标准。最初为视频游戏中的图形渲染而设计，GPU被证明对于AI计算中所需的并行处理特别适用。

NVIDIA的数据中心收入，主要由AI相关销售驱动，增长迅速。2022年，该公司推出了基于新Hopper架构的H100 GPU，承诺为AI工作负载带来显著的性能改进。

B. NVIDIA的AI软件栈

除了硬件之外，NVIDIA还开发了一个全面的AI开发软件栈。其中包括CUDA，一种并行计算平台和编程模型，允许开发人员利用NVIDIA GPU进行通用计算。

NVIDIA还提供了诸如cuDNN（CUDA深度神经网络库）和TensorRT等工具，这些工具可以优化NVIDIA GPU上的深度学习性能。这些工具被AI社区广泛使用，并有助于NVIDIA在AI硬件市场中的主导地位。

C. 合作伙伴关系和合作

NVIDIA与许多领先的科技公司和研究机构建立了战略合作伙伴关系。例如，它与自动驾驶汽车制造商合作，为自驾车提供AI驱动的解决方案。该公司还与医疗机构合作，将AI应用于医疗成像和药物发现。

2022年，NVIDIA宣布与Booz Allen Hamilton合作，开发AI启用的网络安全解决方案，用于美国政府和关键基础设施。这凸显了AI在国家安全和国防应用中的日益重要性。

微软的AI战略

微软通过利用合作伙伴关系和投资关键的AI初创公司，战略性地将自己定位为AI领域的领导者。该公司对OpenAI的130亿美元投资为其提供了对OpenAI模型的独家访问权，这些模型已被集成到微软的产品中，如GitHub Copilot和Azure AI平台。

A. Azure AI和云服务

微软的云平台Azure提供了一系列AI服务，允许企业将AI集成到其应用程序中。这些服务涵盖了机器学习、计算机视觉、自然语言处理和语音识别等领域。

Azure机器学习是一个基于云的环境，用于训练、部署和管理机器学习模型，已成为企业实施AI解决方案的热门选择。微软提供易于使用的AI工具的策略有助于民主化AI开发，并加速了AI在各个行业的采用。

B. 跨微软产品的AI集成

微软一直在其产品线中稳步集成AI功能。在微软365（以前称为Office）中，AI驱动了Outlook中的智能撰写、PowerPoint中的自动幻灯片设计和Excel中的数据分析等功能。

Windows 11也在Windows Studio Effects中集成了AI功能，使用AI进行视频通话中的背景模糊、眼神接触和自动框选。该公司还在其Edge浏览器和Bing搜索引擎中引入了AI驱动的功能，利用大型语言模型提供更具交互性和信息量的搜索体验。

OpenAI的快速进展

OpenAI仍然是AI领域的核心人物，尤其是在开发AGI方面。该公司一直是创建最先进的语言模型的先驱，包括GPT-4和即将推出的GPT-5。OpenAI的模型不仅在技术能力方面领先，而且在商业集成方面也领先，得益于其与微软的深度合作。

OpenAI的AGI雄心壮志是有据可查的，CEO Sam Altman表示，实现AGI将代表“人类迄今为止发明的最强大的技术”。该公司的AI开发方法平衡了尖端创新和对伦理考虑以及社会影响的强烈关注。然而，训练大型模型的高成本需要大量外部资金，包括与投资者如阿联酋政府的谈判，以确保未来AI芯片制造项目高达7万亿美元。

A. GPT系列及其影响

OpenAI最值得注意的成就是开发了GPT（生成式预训练变换器）系列语言模型。2020年发布的GPT-3在自然语言处理领域是一个游戏规则的改变者，展示了前所未有的生成类似人类文本的能力。

2023年发布的GPT-4进一步推动了语言模型的可能性。GPT-4展示了改进的推理能力、减少的幻觉以及处理多模态输入（文本和图像）的能力。这些模型已在内容创作、代码生成和自动客户服务等各个领域找到应用。

B. DALL-E和多模态AI

除了文本生成外，OpenAI还在图像生成方面取得了显著进展，使用DALL-E。该AI系统可以根据文本描述创建独特的图像，展示了AI在创意领域的潜力。最新版本DALL-E 3提高了生成图像的质量和准确性，同时引入了图像修饰和外延等功能。

这些多模态AI（可以处理不同类型数据的系统，如文本和图像）的发展代表了迈向更通用AI系统的重大一步。

Meta的AI计划

Meta在马克·扎克伯格的领导下，将其重点转向开发人工通用智能（AGI）。Meta的策略包括构建能够执行广泛复杂任务的AGI系统，既能像人类一样，也能更好地执行这些任务。这个雄心壮志的目标反映了Meta将高级AI集成到其庞大的应用和服务生态系统中的更广泛愿景。

为了支持这一努力，Meta正在大量投资计算能力，计划到2024年底收购超过34万个NVIDIA的H100 GPU。这一巨大的计算能力对于训练大型AI模型（如最近推出的LLaMA 3）至关重要。

A. PyTorch和开源贡献

Meta对AI社区最重要的贡献之一是PyTorch，一个开源的机器学习库。PyTorch由于其灵活性和易用性，尤其是在深度学习应用中，已被研究社区广泛采用。

Meta AI，公司的AI研究部门，定期发布其研究成果并发布开源工具，为更广泛的AI生态系统做出贡献。这一开放的方法帮助Meta吸引了顶级AI人才，并保持了AI研究的领先地位。

B. 社交媒体和元宇宙中的AI

Meta在其社交媒体平台（Facebook、Instagram、WhatsApp）中大量使用AI，用于内容推荐、广告定位和内容审核。公司的推荐算法处理大量数据，以个性化用户体验。

C. 最近的突破和挑战

2024年，Meta宣布了多项AI突破，包括Segment Anything Model（SAM），一种新的AI模型，用于图像分割，可以以惊人的准确性识别和勾画图像和视频中的对象。他们还推出了一个名为LLaMA（Large Language Model Meta AI）的流行开源LLM系列。

然而，Meta也面临着挑战，特别是在内容审核方面。该公司一直难以有效地使用AI来对抗其平台上的虚假信息和仇恨言论，凸显了将AI应用于现实世界社会问题的复杂性。

其他值得注意的玩家

IBM继续通过其WatsonX平台成为AI领域的主要参与者，该平台已经从其诞生时起发生了显著变化。IBM的重点已经转向使AI更加开放、可访问和可扩展，以满足企业需求。WatsonX平台现在包括一套AI驱动的自动化工具和治理能力，允许企业更有效地跨IT运营、网络安全和客户服务等各个领域管理和集成AI解决方案。

最近，IBM推出了基于生成式AI的新网络威胁检测和响应服务，其中包括一个新的AI驱动的网络安全助手，旨在简化和加速对安全威胁的调查和响应，进一步利用IBM更广泛的AI能力，基于WatsonX平台（IBM Newsroom）（IBM Newsroom）。

IBM还与包括AWS、Adobe、Meta和Salesforce在内的公司建立了战略合作伙伴关系，以将其AI解决方案集成到更广泛的生态系统中，确保其AI技术在各个行业中既通用又广泛采用（IBM TechXchange Community）（IBM – United States）。

B. 亚马逊的AI服务

亚马逊通过其亚马逊网络服务（AWS）平台仍然是AI领域的主导力量，AWS提供了一套全面的AI和机器学习工具。亚马逊的Amazon SageMaker是一个关键产品，允许开发人员大规模构建、训练和部署机器学习模型。

除了企业AI服务，亚马逊还继续在消费者AI产品中创新，例如其虚拟助手Alexa，该助手利用先进的自然语言处理和机器学习与用户交互。该公司将AI无缝集成到其电子商务和云服务中的关注点使其成为AI领域的领导者。

C. 苹果的设备AI方法

苹果对AI的独特方法强调设备上的处理，以优先考虑用户隐私。这体现在Face ID和Core ML框架中更广泛的机器学习模型使用中。苹果的定制芯片，包括A系列和M系列芯片，包含专用的神经引擎，能够在设备上高效地执行AI任务。

该公司还通过Siri和Live Text等功能增强了其AI产品，例如苹果智能和实时文本。

接下来是什么？通往AGI的道路

通往AGI的道路充满了技术、伦理和监管挑战。随着AI系统变得更加先进，人们对其对工作、隐私甚至人权的影响的担忧也越来越大。公司不仅在竞争开发更强大的AI，还在努力以负责任的方式部署这些技术。

例如，谷歌开发了Med-PaLM，一种能够通过美国医学执照考试的AI系统，凸显了AI在医疗保健等行业的革命性潜力。然而，这也提出了关于AI驱动决策的问责制和信任的问题。

微软将AI集成到其产品套件中，反映了将AI嵌入日常工具的更广泛趋势。这种方法可能会使AI民主化，使先进的功能更容易被更广泛的受众所接受。

来自Lex Fridman的播客的见解

Lex Fridman的播客为我们提供了来自该领域领先声音的宝贵见解。其中一次特别有启发性的讨论是与Yann LeCun，Meta的首席AI科学家，他广泛讨论了开发AGI的挑战。LeCun指出，当前的AI模型，特别是大型语言模型（LLM），在理解和与物理世界交互方面存在局限性，缺乏对直觉物理和常识推理的理解，这对于真正的AGI至关重要。这一差距凸显了在AI方面的持续进步的必要性，以复制人类般的理解和决策能力（Lex Fridman）。

在另一集中，Sam Altman，OpenAI的CEO，讨论了AGI对社会的更广泛影响。Altman强调了确保AGI的开发符合人类价值观和道德的重要性。他承认AGI有可能革新行业和改善人类生活，但也强调了与AI开发相关的风险。Altman的反思揭示了在追求AGI的过程中必须保持的微妙平衡（Lex Fridman）。

这些讨论表明，AGI竞赛不仅仅是技术挑战，也是哲学和伦理挑战。这种观点为我们理解Meta和OpenAI等公司如何在AI开发中应对这些问题提供了深刻的见解。

结论：AI竞赛才刚刚开始

开发AGI的竞赛是我们这个时代的决定性挑战，科技巨头如谷歌、微软、OpenAI、Meta和NVIDIA正在领导这项事业。每家公司都带来了其独特的优势和策略，共同推动着AI领域的快速发展。随着竞争的加剧，AGI对社会、经济和伦理治理的影响将至关重要。通往AGI的旅程不仅仅是技术进步，也是关于塑造一个AI为人类服务的未来。

Aayush Mittal, Mittal

我已经沉浸在了令人着迷的机器学习和深度学习世界中五年了。我的热情和专业知识让我为超过50个不同的软件工程项目做出了贡献，特别关注AI/ML。我的持续的好奇心也让我对自然语言处理产生了兴趣，这是一个我渴望进一步探索的领域。

Unite.AI