Connect with us

思想领袖

DeepSeek 干扰:为什么 AI 本土基础设施,而不是模型,将定义企业成功

mm

想象一下试图在破碎的道路上驾驶一辆法拉利。无论这辆车有多快,其全部潜力都将被浪费掉,如果没有一个坚实的基础来支持它。这是一个类比,总结了今天的企业 AI 景观。企业经常对新的模型,如 DeepSeek-R1 或 OpenAI o1 过度着迷,同时忽略了基础设施的重要性,以便从中获得价值。与其仅仅关注谁正在构建最先进的模型,企业需要开始投资于强大的、灵活的和安全的基础设施,以便能够有效地使用任何 AI 模型,适应技术进步,并保护其数据。

随着 DeepSeek 的发布,这是一个具有争议性起源的高级大型语言模型(LLM),该行业目前被两个问题所困扰:

  • DeepSeek 是真实的还是只是烟雾和镜子?
  • 我们是否过度投资于像 OpenAI 和 NVIDIA 这样的公司?

Twitter 上的调侃性评论意味着 DeepSeek 做了中国技术最擅长的事情:“几乎一样好,但价格要便宜得多。”其他人意味着它似乎太好以至于难以置信。一月后,NVIDIA 的市场价值下降了近 6000 亿美元,Axios 表示这可能是风险投资公司的 灭绝级事件。主要声音正在质疑是否需要 Project Stargate 的 5000 亿美元承诺 投向物理 AI 基础设施投资,只是在其宣布后的 7 天后。

而今天,阿里巴巴刚刚 宣布了一款 声称超越 DeepSeek 的模型!

AI 模型只是等式的一部分。它是新的闪亮物体,而不是企业的全部套餐。缺少的是 AI 本土基础设施。

一个基础模型只是一个技术——它需要有能力的、AI 本土工具来转化为一个强大的商业资产。随着 AI 以闪电般的速度演变,今天采用的一种模型可能会在明天变得过时。企业真正需要的不是“最佳”或“最新”的 AI 模型——而是工具和基础设施,以便能够无缝地适应新模型,并有效地使用它们。

无论 DeepSeek 代表了颠覆性的创新还是夸张的炒作,并不是真正的问题。相反,组织应该将他们的怀疑放在一边,问问自己是否拥有正确的 AI 基础设施,以便在模型改进和变化时保持韧性。并且他们是否可以轻松地在模型之间切换,以实现他们的商业目标,而无需重新设计一切?

模型与基础设施与应用程序

为了更好地理解基础设施的作用,考虑使用 AI 的三个组件:

  1. 模型:这些是您的 AI 引擎——大型语言模型(LLM)如 ChatGPT、Gemini 和 DeepSeek。它们执行诸如语言理解、数据分类、预测等任务。
  2. 基础设施:这是 AI 模型运行的基础。它包括将模型集成、管理和扩展所需的工具、技术和托管服务,同时将它们与业务需求保持一致。这通常包括专注于计算、数据、编排和集成的技术。像 Amazon 和 Google 这样的公司提供运行模型的基础设施,并提供将它们集成到企业技术栈中的工具。
  3. 应用程序/用例:这些是最终用户看到的应用程序,它们使用 AI 模型来实现业务结果。市场上有数百个产品正在涌现,从现有应用程序中添加 AI(例如 Adobe、Microsoft Office with Copilot)到 AI 本土的挑战者(Numeric、Clay、Captions)。

虽然模型和应用程序经常抢尽风头,但基础设施却在幕后默默地使一切顺利地运作,并为模型和应用程序的未来操作奠定了基础。它确保组织可以在模型之间切换并解锁 AI 的真正价值——而无需花费大量资金或破坏业务。

为什么 AI 本土基础设施至关重要

每个 LLM 都擅长不同的任务。例如,ChatGPT 适合对话式 AI,而 Med-PaLM 专为回答医疗问题而设计。AI 的格局竞争如此激烈,以至于今天的顶级模型可能会被明天更便宜、更好的竞争对手所超越。

没有灵活的基础设施,公司可能会发现自己被锁定在一个模型中,无法切换而不完全重建其技术栈。这是一个昂贵且低效的位置。通过投资于模型无关的基础设施,企业可以集成最适合其需求的工具——无论是从 ChatGPT 切换到 DeepSeek,还是采用下个月推出的全新模型。

一个今天处于前沿的 AI 模型可能会在几周内变得过时。考虑一下 GPU 的硬件进步——企业不会为最新的 GPU 而更换整个计算系统;相反,他们会确保其系统可以无缝地适应新的 GPU。AI 模型需要相同的适应性。适当的基础设施确保企业可以在不重新设计整个工作流的情况下一致地升级或切换其模型。

目前的大多数企业工具并非针对 AI 而设计。像传统分析栈的一部分的数据工具通常是为代码密集的、手动数据操作而设计的。在现有工具中回退式地添加 AI 通常会产生低效率,并限制高级模型的潜力。

另一方面,AI 本土工具专门设计为与 AI 模型无缝交互。它们简化了流程,减少了对技术用户的依赖,并利用了 AI 处理数据和提取可行见解的能力。AI 本土解决方案可以抽象复杂的数据,并使其可用于 AI 查询或可视化目的。

AI 基础设施成功的核心支柱

为了使您的业务未来化,请优先考虑以下 AI 基础设施的基础要素:

数据抽象层

将 AI 视为“超级强大的幼儿”。它非常有能力,但需要明确的界限和对数据的受控访问。AI 本土数据抽象层充当受控的网关,确保您的 LLM 仅访问相关信息并遵循适当的安全协议。它还可以实现对元数据和上下文的统一访问,无论使用哪些模型。

可解释性和信任

AI 输出通常感觉像黑盒——有用,但难以信任。例如,如果您的模型总结了六个月的客户投诉,您需要了解不仅是如何得出这个结论,还有哪些具体的数据点告知了这个总结。

AI 本土基础设施必须包括提供可解释性和推理的工具——允许人类将模型输出追溯到其源头,并理解输出的原因。这增强了信任,并确保了可重复和一致的结果。

语义层

语义层组织数据,使人类和 AI 都可以直观地与之交互。它抽象了原始数据的技术复杂性,并以有意义的商业信息形式呈现给 LLM,同时回答商业问题。一个良好的语义层可以显著减少 LLM 的幻觉。

例如,具有强大语义层的 LLM 应用程序不仅可以分析您的客户流失率,还可以解释为什么客户离开,基于客户评论中的情感标签。

灵活性和敏捷性

您的基础设施需要实现敏捷性——允许组织根据不断变化的需求切换模型或工具。具有模块化架构或管道的平台可以提供这种敏捷性。这些工具允许企业同时测试和部署多个模型,然后扩展那些表现出最佳 ROI 的解决方案。

AI 责任的治理层

AI 治理是 负责任的 AI 使用的骨干。企业需要强大的治理层来确保模型以道德、安全和符合监管指南的方式使用。AI 治理管理三件事。

  • 访问控制:谁可以使用该模型,它可以访问什么数据?
  • 透明度:输出如何生成,AI 的建议可以被审计吗?
  • 风险缓解:防止 AI 做出未经授权的决定或使用敏感数据不当。

想象一个场景,其中一个开源模型,如 DeepSeek,被授予访问 SharePoint 文档库的权限。没有治理层,DeepSeek 可以回答可能包含敏感公司数据的问题,可能导致灾难性的泄露或误导分析,这可能会损害业务。治理层减少了这种风险,确保 AI 在整个组织中以战略性和安全的方式部署。

为什么基础设施现在尤为关键

让我们重新审视 DeepSeek。虽然其长期影响仍不确定,但很明显,全球 AI 竞争正在加剧。经营这一领域的公司再也不能依赖于某个国家、供应商或技术将永远占据主导地位的假设。

没有强大的基础设施:

  • 企业更有可能陷入过时或低效的模型中。
  • 在工具之间切换变得耗时且昂贵的过程。
  • 团队缺乏清晰地审计、信任和理解 AI 系统输出的能力。

基础设施不仅使 AI 的采用更容易——它解锁了 AI 的全部潜力。

建造道路,而不是购买引擎

像 DeepSeek、ChatGPT 或 Gemini 这样的模型可能会吸引头条新闻,但它们只是更大 AI谜题的一部分。企业在这个时代的真正成功取决于强大的、面向未来的 AI 基础设施,使其具有适应性和可扩展性。

不要被 AI 模型的“法拉利”分散注意力。专注于建造“道路”——基础设施——以确保您的公司现在和将来都能蓬勃发展。

为了开始利用具有灵活、可扩展基础设施的 AI,这些基础设施是根据您的业务量身定制的,现在是采取行动的时候了。保持领先地位,并确保您的组织为 AI 景观带来的任何变化做好准备。

Rehan Refai 是 App Orchid 的市场和解决方案副总裁。自 2018 年以来,Rehan 在多家初创公司从事技术创新和商业化工作,此前他曾在咨询和电池及神经网络的研究生研究中工作了很长时间。在他目前的职位上,他回到人工智能/机器学习的根源,帮助客户使用 App Orchid 的人工智能技术解锁数据中隐藏的见解,并且一直在寻找使人工智能更容易被每个人接受的方法。