Victor Dey 是一名技术编辑和作家,报道人工智能、加密货币、数据科学、元宇宙和网络安全等领域。 他拥有半十年的媒体和人工智能经验,曾在 VentureBeat、Metaverse Post、Observer 等知名媒体机构工作。 Victor 曾在牛津大学和南加州大学等顶尖大学的加速器项目中指导学生创业者,并拥有数据科学和分析的硕士学位。
新兴的人工智能框架正在迈向一个激进的飞跃:机器可以自我改进,不需要人类的洞察。多年来,即使是最先进的人工智能模型仍然是被动的引擎,根据它们无法修改的训练数据预测响应。但今天,不是模型的大小决定了人工智能的下一章,而是模型是否可以自我演化。最近,麻省理工学院的研究人员推出了一个新的人工智能框架,称为 自适应大语言模型(SEAL)。这种方法允许大语言模型(LLM)自主改进自己,实现人工智能可以诊断其局限性并通过强化学习的内部反馈循环永久更新其自身的神经权重。与其需要研究人员发现错误、编写新提示或提供额外示例,模型完全拥有自己的演化。“大语言模型(LLM)很强大,但静态的;它们缺乏适应其权重以响应新任务、知识或示例的机制,”麻省理工学院的研究人员在博客文章中写道。“关于知识整合和少样本泛化的实验表明,SEAL是语言模型自主适应新数据的有前途的一步。”在早期测试中,这个自我编辑循环使模型从完全失败到复杂抽象推理谜题上取得成功,甚至超过了更大的模型,如GPT-4.1,成功率为72.5%,传统方法失败。此外,SEAL据称将人类监督减少了85%,同时提高了准确性和适应性。自我学习人工智能框架的崛起SEAL是自主机器智能更广泛趋势的一部分。例如,Sakana AI的研究人员推出了 达尔文-哥德尔机器——一种使用开放式进化策略重写其自身代码的AI代理。“它创建各种自我改进,例如补丁验证步骤、更好的文件查看、增强的编辑工具、生成和排名多个解决方案以选择最好的一个,并添加已尝试的内容历史记录(以及为什么失败)当做出新更改时,”Sakana AI在博客文章中写道。同样,Anthropic的AI代理, 由Claude 4提供支持,现在可以自主编排代码库和商业工具中的工作流程。“一个根据资产类型、环境和历史重新配置自身的系统,使我们能够从反应性响应转变为持续的预防策略,”Fracttal的CEO和联合创始人Christian Struve告诉我。“这不是关于更多层次或更多参数,而是关于更自主和更有用的系统。”这些努力的共同点是一个核心信念:人工智能不需要变得更大才能变得更聪明。它需要变得更适应性。“扩大规模带来了重大收益,但我们正在达到仅凭规模就能实现的极限。像SEAL这样的自适应学习模型提供了一个令人信服的下一步,实现系统可以随时间增长和改进,”Dataco的创始人和CEO Jorge Riera告诉我。“自我演化的模型还将进度指标从静态基准转移到适应性、学习效率和安全的长期改进的衡量标准。我们不仅可以测试模型在部署时知道什么,还可以评估它如何学习、保留和随时间演化。”人工智能生态系统和全球自治竞赛的影响这种自治水平还重写了人工智能部署的经济学。想象一下能够瞬间更新以应对新威胁的欺诈检测系统,或者能够根据学生行为改变其教学风格的AI导师。在机器人领域,自适应框架可以带来能够在无需重新编程的情况下学习新运动模式的自主机器。在中东,像阿联酋和沙特阿拉伯这样的国家正在迅速构建适应性基础模型。 阿联酋的猎鹰 和 G42的Jais 是具有区域相关性的开源LLM,而沙特阿拉伯的ALLaM和 阿拉姆科数字的Metabrain 正在推动自主人工智能代理的发展,应用于智能城市、医疗保健和物流。这些努力还没有达到与麻省理工学院的SEAL相当的自我编辑能力,但它们反映了一个共同的轨迹:从被动的人工智能系统到主动、演化的代理,可以在有限的人类指导下导航复杂性。就像SEAL一样,这些计划都有健全的治理框架,凸显了人工智能自治必须与责任相结合的日益增长的认识。“这是迈向自我管理系统的第一步,这些系统可以在没有不断干预的情况下修改其逻辑,”斯特鲁夫说。“我相信人工智能并不重新定义什么是智慧,但它迫使我们重新思考我们与智慧的关系。重要的不是模型演化,而是它按照我们定义的目标演化。”Gorilla Logic的CTO Jeff Townes也强调了治理与人工智能演化同步的重要性:“问题不是人工智能是否可以演化,而是企业是否可以与其同步演化。治理必须将每个人工智能适应锚定到明确的结果和KPI上,这样领导者可以衡量和信任它,创新可以带来信心而不是风险。”我们是否准备好迎接自我重写的人工智能?SEAL提出的最具挑战性的问题并非技术问题,而是如果模型可以决定如何教自己,我们在塑造其价值观、优先级和方向方面扮演什么角色?专家警告,随着自适应人工智能系统获得自治权,自我改进的步伐不应超过建立道德防护栏的步伐。“我认为所有人工智能系统都必须包含至少三个基本的道德原则,”Kryterion的CTO Jacob Evans说。“首先,这可能不言自明,但人工智能需要将自己识别为人工智能。第二,人工智能必须以人为中心,增强和不取代人类的判断力。最后,它必须承认其局限性和不确定性,同时拒绝提供可能促进严重伤害的信息。没有这些保障,人工智能可能成为操纵的工具,而不是可靠的支持。”“为了使模型能够在生产中自我改进,它们需要一个动态的反馈循环,而不是静态的训练。一个强大的方法是使用‘数字孪生’或一个复杂的沙盒环境,在部署到用户之前,人工智能可以在其中安全地测试和验证其自身的自我生成的改进,”Automotus的计算机视觉工程师Ganesh Vanama分享道。至于治理,Vanama补充说,“非协商控制是‘人在循环’监督。”他说,虽然我们希望模型适应,“你必须有持续的监控来检测‘对齐漂移’,即模型偏离其预期目标或安全约束。这一系统必须给人类审计员权力来否决或立即回滚任何自主更新,如果它未能通过安全或性能审查。”但其他专家认为,还有时间来开发这些保障措施,认为建立一个真正强大的、通用、自我改进的人工智能仍然是一个巨大的挑战。“这样的模型仍然缺乏可靠地在实时重新编程自己的能力。关键挑战包括防止错误强化、避免灾难性遗忘、确保更新期间的稳定性以及维持内部更改的透明度,”Riera说。“在这些问题得到解决之前,完全的自主适应仍然是一个前沿领域,而不是现实。”麻省理工学院的研究人员将SEAL视为必要的演化。正如麻省理工学院的领先科学家所说,这个框架目前比以往任何时候都更接近地模拟了人类的学习。“这些系统暗示了从静态、一次性模型到适应性架构的转变,这些架构可以从经验中学习、管理记忆并随时间追求目标。方向是明确的:朝着模块化、上下文感知的智能发展,这种智能可以连续地调整自己,”Riera告诉我。“虽然仍处于实验阶段,但这种方法标志着迈向更自主和更有弹性的人工智能系统的有意义的一步。”这是否会带来更个性化的系统,或者完全新的机器代理形式,尚待观察。自我学习的人工智能时代已经到来——它不仅重写了自己的代码,还在重写机器可以成为什么的规则。
医疗补助已经成为激烈的政治斗争的焦点,共和党议员正在推动对其进行大幅削减,以帮助资助税收减免。特朗普总统和共和党领导人旨在未来十年内削减8800亿美元的医疗补助支出,大约占该计划预算的10%。然而,后果可能非常严重,因为医疗补助为大约8300万低收入的美国人,包括老年人和残疾人提供了健康保险。为了确保医疗补助的未来,人工智能(AI)正在作为解决医疗保健成本上升的潜在解决方案而出现。今天,AI驱动的预测分析使医疗保健提供者能够在患者需要紧急护理之前识别出高风险患者。“随着医疗补助面临预算约束,AI可以在不牺牲质量的情况下降低成本,” Grace Chang,Kintsugi的首席执行官和创始人,告诉我。“运营效率低下,例如漏诊或患者随访不力,往往是不可见的,但却非常昂贵。AI可以识别出有医院过度使用或药物不遵守风险的患者——这些领域从系统中流失了数十亿美元,但可以通过正确的工具来解决。”总部位于加利福尼亚的AI医疗保健初创公司 Kintsugi 利用语音生物标志来自动化对抑郁症和焦虑症患者的早期筛查,从而减少临床评估时间。Chang坚称,大多数医疗保健系统已经人手不足,AI可以帮助优先考虑谁最需要关注,以及何时需要关注。根据创始人的说法,不使用AI来解决医疗保健最棘手的问题的真正风险是 “我们不会使用它来填补医疗保健中的关键差距。”人工智能如何降低医疗补助和医疗保健成本行政效率低下占医疗保健成本的很大一部分。然而,国家生物技术信息中心(NCBI)的一项研究估计,AI可以通过简化这些流程每年为医疗保健行业节省高达 1500亿美元。同样,国家经济研究局 估计,通过AI自动化,未来四年内医疗保健支出可以节省200-3600亿美元。今天,AI在医疗补助和医疗保健中发挥着至关重要的作用,预测疾病爆发和人口结构变化,实现主动资源分配。该技术还帮助提高预测分析,以预测患者结果,带来更有效的治疗策略和改善预防性护理。此外,AI可以推进个性化医学,根据个体患者的特点量身定制治疗方案,带来更好的效果。利用最近的技术创新,几家AI驱动的医疗保健初创公司正在推动AI在医疗补助中的采用,以加快诊断速度和改善治疗效果。例如,总部位于波士顿的 Quantivly 通过其AI平台提高了放射学的效率,优化了MRI和CT扫描仪的使用。AI可以识别成像工作流中的瓶颈,减少患者等待时间,提高扫描仪的吞吐量和医院收入。“医疗系统,尤其是那些服务于医疗补助人口的系统,被要求做更多事情,同时拥有更少的资源。他们需要进行更多的扫描来弥补利润率较低的现实,” Robert MacDougall,Quantivly的联合创始人,告诉我。“医疗成像中的运营AI可以帮助管理吞吐量,而不会给员工带来压力。AI可以部署在诸如安排等领域,安排任务对于任何一个人来说都太复杂,无法手动管理。”根据MacDougall的说法,大多数安排系统忽略了影响扫描持续时间的关键因素,例如扫描仪硬件、协议复杂性、患者活动能力和镇静需求。实时管理这些变量超出了人类的能力,使AI成为优化安排和效率的必备工具——并帮助医院的财务状况。同样,AI驱动的药物管理平台 Arine 通过优化药物方案和标记不必要的药物来减少处方错误。 “AI可以快速连接多个数据集(患者的药物史、社会决定因素数据和临床/医学文献)以对每个患者进行个性化推荐,” Yoona Kim,Arine的首席执行官和创始人,解释道。她补充说,如果患者被开具新药物而没有考虑到其对现有病况的潜在负面影响,AI可以实时标记该问题——在并发症导致急诊就诊之前预防其发生。 “AI可能会自动执行重复性任务(例如,文档、总结),但在患者护理方面,我们需要让临床医生保持控制,” Kim说。鉴于AI改善医疗保健效率和结果的潜力,立法者是否会优先考虑其采用,还是预算限制和财政政策会掩盖获取途径?这种辩论的结果尚不确定。“运营AI的目标是通过改善资源利用来扩大获取途径。如果我们可以在不增加员工负担的情况下在同一设备上扫描更多患者,我们正在改善获取途径——尤其是在资源不足的地区。关键是生产力,而不是限制,” MacDougall 强调。
2025年1月,安全社区经历了一次重大变化,多家竞争对手公司联合推出了Opengrep,这是一款静态应用安全测试工具的分支。曾经因其开源社区驱动的理念而受到赞誉的Semgrep,在2024年12月引发了争议,当时它改变了其许可模式,限制了第三方在商业产品中使用贡献规则,并将一些关键功能放在了付费墙后面。Semgrep曾经成为开发人员必备的工具,因为它能够检测多种编程语言中的漏洞。然而,公司的决定可能会扼杀现代网络安全领域的创新。在争议中,DevSecOps初创公司DeepSource推出了Globstar,这是一款新的开源代码安全工具包。Globstar由头开始构建,并在MIT许可下发布,声称提供无限制的商业和公共访问其代码。“通过Globstar,我们提供了一种新的定制静态分析方法,专为安全团队的需求而设计。它源自我们为威胁检测开发的内部框架,”Sanket Saurav,DeepSource的联合创始人和CEO告诉我。“Semgrep已经在有能力的团队手中,我们的目标是走一条不同的道路。我们不把自己看作是替代品,而是一种带来新视角的替代方案。”该公司已筹集了770万美元的资金,并获得了Y Combinator投资者的支持。使用Go编程语言开发并与Tree-sitter集成,Globstar支持20多种编程语言。该工具包具有用于创建自定义安全检查器的直观YAML接口和用于复杂跨文件分析的高级Go接口。“当一个项目被分叉时,它经常会走一条不同的轨迹——但当受到现有产品的限制时,创新可能会受到限制,”Sanket说。“我们创建了一个简化编写自定义代码检查器的系统。”商业必要性与开源保护2024年12月13日,Semgrep改变了其许可模式,限制第三方在商业产品中使用贡献规则,并将其开源版本重命名为“Semgrep CE”(社区版)。Semgrep声称,其许可变化是为了保护知识产权和确保可持续的收入。该公司认为,限制商业使用有助于防止未经授权的重新包装并支持长期创新。“当工程师编写代码解决问题时,静态分析在开发过程的早期检查代码,识别模式和潜在问题。Semgrep是该领域的受尊敬的玩家,我对他们有很高的评价,”Sanket说。“然而,他们的商业用户许可变化反映了一个更广泛的现实:风险投资支持的公司必须平衡开源原则和可持续的商业模式。”他指出,虽然这种变化并没有直接影响最终用户,但它引发了关于开源是否应该完全不受限制或为了长期可行性而演变的持续辩论。2025年1月,10家DevSec公司,包括Aikido Security、Arnica、Amplify Security、Endor Labs、Jit、Kodem、Legit Security、Mobb和Orca Security,联合成立了一个联盟来推出Opengrep。传统上是激烈的竞争对手,这个新的联盟直接挑战了Semgrep限制功能以获取商业利益的决定。在博客文章中,Endor Labs表示,静态代码分析“太重要了,不能被限制”。然而,目前尚不清楚Opengrep是否只是重新包装了遗留代码,还是提供了一个完全新的解决方案。开源替代方案的崛起DeepSource认识到开发人员对不继承遗留约束的工具的日益增长的需求。“企业客户不想处理多个工具——这会产生集成挑战并推动对全方位解决方案的需求,”Sanket解释说。“静态分析在理解代码架构方面发挥着至关重要的作用,这就是为什么我们将自己定位为一个统一的平台。”然而,DeepSource的Globstar并不是唯一的选择,Semgrep授权争议后,其他静态代码分析替代方案也获得了关注。例如,SonarQube是一个代码分析平台,提供免费的社区版和付费版,用于静态代码分析、集成支持和指标跟踪。同样,ShellCheck是另一个专门用于分析shell脚本的替代方案,帮助开发人员捕获可能导致重大错误或低效的脚本错误。它标记可能在不同shell环境中不可移植的命令或语法。由于其易用性——可以从命令行运行并轻松集成到CI/CD管道中,ShellCheck已成为越来越受欢迎的选择。虽然Opengrep试图保护遗留工具的开源根源,但其他替代方案,如SonarQube、Globstar和ShellCheck,也提供了新鲜、前瞻性的解决方案。随着开源辩论的展开,开发人员和企业面临着可能重新定义代码分析格局的关键选择。Opengrep试图保护遗留工具的开源根源,但其他替代方案,如SonarQube、Globstar和ShellCheck,也提供了新鲜、前瞻性的解决方案。随着开源辩论的展开,开发人员和企业面临着可能重新定义代码分析格局的关键选择。ngly popular choice. While Opengrep seeks to preserve a legacy tool’s open roots, other alternatives like SonarQube,...
Anthropic 的创新模型上下文协议(MCP)旨在解决数据碎片化问题并提高 AI 驱动解决方案的效率。它是否能成为上下文感知 AI 集成的标准?当前人工智能创新面临的最紧迫挑战之一是大型语言模型(LLM)与实时数据的隔离。为了解决这个问题,总部位于旧金山的 AI 研究和安全公司 Anthropic最近宣布了一种独特的开发架构,以改变 AI 模型与数据的交互方式。该公司的新 模型上下文协议(MCP) 作为开源项目发布,旨在通过“AI 驱动应用程序和实时、多样化数据源之间的双向通信”来提高 AI 的效率。该架构旨在解决一个日益增长的烦恼:由于缺乏与实时数据的连接而导致的过时的 AI 输出。Anthropic 声称,统一协议可以通过实时上下文感知提高业务的 AI 开发和功能,使其更加人性化。根据公司的说法,每个新的业务数据源都需要自定义的 AI 实现,从而导致低效率。MCP 旨在通过提供开发人员可以普遍采用的标准化框架来解决这个问题。“架构很简单:开发人员可以通过 MCP 服务器暴露他们的数据,或者构建连接到这些服务器的...
具有感知的机器人已成为科幻作品中的常见元素,引发了诱人的伦理问题,并突出了创造人工意识的技术障碍。目前,科技界在人工智能(AI)方面取得的成就很大程度上归功于深度学习的最新进展,这使得机器能够在训练过程中自动学习。这一突破消除了对耗时的、手动的特征工程的需求,这是深度学习在人工智能和科技创新中脱颖而出的一个关键原因。在此基础上,Meta(拥有Facebook、WhatsApp和Instagram)正在利用先进的“触觉人工智能”技术进入新的领域。该公司最近推出了三个新的AI驱动工具:Sparsh、Digit 360和Digit Plexus,旨在为机器人提供一种模仿人类感知的触觉敏感性。目标是创建不仅能模仿任务,还能积极与环境互动的机器人,就像人类与世界互动一样。Sparsh(以梵语中的“触摸”命名)是一种通用目的代理AI模型,允许机器人实时解释和对感官线索做出反应。同样,Digit 360传感器是一种人工指尖,能够帮助机器人感知触摸和物理感觉,如针头的刺激或压力变化。Digit Plexus将作为一座桥梁,提供一种标准化的框架,用于集成触觉传感器到各种机器人设计中,使捕获和分析触摸数据变得更加容易。Meta相信,这些AI驱动的工具将使机器人能够处理需要“人类”触摸的复杂任务,特别是在医疗保健等领域,敏感性和精确性至关重要。然而,引入感知机器人引发了更大的问题:这种技术是否会解锁新的合作水平,还是会引入社会可能无法应对的复杂性?“当机器人解锁新的感官,并获得高水平的智能和自主性时,我们需要开始考虑他们在社会中的角色,”Ali Ahmed,Robomart的联合创始人和CEO,告诉我。“Meta的努力是向为他们提供类似人类的感官迈出的一大步。随着人类与机器人日益亲密,他们将开始将机器人视为生活伴侣、伙伴,甚至会与他们一起建立生活。”人机和谐的框架:未来?除了在触觉人工智能方面的进展外,Meta还推出了PARTNR基准,这是一个用于评估人机协作的标准化框架。PARTNR旨在测试需要规划、推理和协作执行的交互,并将大型语言模型(LLM)集成到这些交互中,以评估机器人在协调和任务跟踪等关键元素方面的能力。通过这种方式,PARTNR可以将机器人从简单的“代理”转变为真正的“伙伴”,使其能够与人类合作无间。“当前的论文对于基准测试来说非常有限,即使在自然语言处理(NLP)中,也需要相当长的时间来完善大型语言模型(LLM)以应用于现实世界。对于82亿人口来说,在有限的实验室环境中进行普遍化将是一项巨大的工作,”Ram Palaniappan,TEKsystems的CTO,告诉我。“需要更大的努力来推动这项研究,以使其成为可行的试点。”为了将这些触觉人工智能进步推向市场,Meta与GelSight Inc.和Wonik Robotics合作。GelSight将负责生产Digit 360传感器,预计明年发布,并将为研究社区提供先进的触觉能力。Wonik Robotics将负责生产下一代Allegro Hand,它集成了Digit Plexus,使机器人能够以新的精度执行复杂的触觉任务。然而,并不是每个人都相信这些进步是朝着正确的方向迈出的一步。“虽然我仍然相信添加感知能力可能对机器人理解环境有意义,但我认为当前的使用案例更多地与机器人面向大众和改善他们的交互有关,”Agustin Huerta,Globant数字创新北美高级副总裁,告诉我。“我不认为我们会接近给予机器人类似人类的感觉,也不认为这是必要的。相反,它将作为决策过程中的一个额外数据点。”Meta的触觉人工智能发展反映了欧洲的一个更广泛的趋势,在那里,像德国、法国和英国这样的国家正在推动机器人感知和意识的边界。例如,欧盟的Horizon 2020计划支持一系列旨在推动机器人边界的项目,从触觉感知和环境意识到决策能力。此外,德国的卡尔斯鲁厄理工学院最近推出了ARMAR-6,一种为工业环境设计的类人机器人。ARMAR-6能够使用钻头和锤子等工具,并具备人工智能能力,使其能够学习如何抓取物体并协助人类同事。但是,Peter Gorm Larsen博士,丹麦奥胡斯大学电气和计算机工程系副主任,欧盟资助的RoboSAPIENS项目协调员,警告说Meta可能忽略了一个关键挑战:虚拟感知和机器人操作的物理现实之间的差距,特别是关于环境和人类安全的问题。“机器人不像活着的生物那样拥有智能,”他告诉我。“科技公司有道德义务确保他们的产品尊重道德界限。个人而言,我最担心的是先进的触觉反馈与紧凑的3D眼镜(如普通眼镜)结合的潜在风险。”我们是否准备好让机器人“感知”?Larsen博士认为,真正的挑战不在于触觉人工智能传感器本身,而在于它们如何在自主环境中部署。“在欧盟,机械指令目前限制了AI驱动的控制在机器人中的使用。但在我看来,这是一个过于严格的要求,我们希望在我目前协调的RoboSAPIENS项目中能够证明这一点。”当然,机器人已经在各个行业与人类合作。例如,Kiwibot帮助物流公司解决了仓库中劳动力短缺的问题,瑞士公司Anybotics最近获得了6000万美元的资金,以将更多的工业机器人推向美国市场,根据TechCrunch报道。我们应该期待人工智能继续渗透到各个行业,因为“人工智能加速了重复任务的生产力,如代码重构、解决技术债务和测试,并改变了全球团队如何协作和创新,”Ness Digital Engineering的全球智能工程实践负责人Vikas Basra说。同时,这些机器人的安全性——现在和将来——是行业进步的主要问题。SQream的产品副总裁Matan Libis在The Observer中说:“公司的下一个重大使命将是确定AI在社会中的地位——其角色和责任……我们需要明确其界限以及它真正有帮助的地方。除非我们确定AI的限制,否则我们将面临日益增长的对其融入日常生活的担忧。”随着人工智能的发展以包括触觉感知,它引发了一个问题:社会是否准备好迎接“感知”的机器人?专家认为,纯粹的软件超级智能可能会遇到瓶颈;为了达到真正的、高级的理解,人工智能必须感知、感知并在我们的物理环境中行动,合并模态以更深入地理解世界——这是机器人所擅长的。然而,超级智能并不等同于感知。“我们不能将工具人格化到将其视为有感知的生物的程度,除非它已经证明自己具有感知能力,”Ahmed解释说。“但是,如果机器人通过感知测试,那么我们就有道德和基本的责任来授予它们一定的自由和权利作为有感知的生物。”Meta的触觉人工智能的影响是显著的,但这些技术是否会带来革命性的变化或跨越道德界限仍然不确定。目前,社会不得不思考一个未来,人工智能不仅能看到和听到,还能触摸——可能以我们刚刚开始想象的方式重塑我们与机器的关系。“我不认为提高AI的感知能力会跨越道德界限。这更多地与如何使用感知来做出决定或驱动他人的决定有关,”Huerta说。“机器人革命不会与工业革命不同。它将影响我们的生活,并将我们置于一个状态,我认为可以让人类繁荣。为了实现这一点,我们需要开始教育自己和下一代如何与机器人建立健康的关系。”
随着人工智能(AI)的快速发展,其能耗需求正在给数据中心带来巨大的压力。下一代人工智能技术,如生成式人工智能(genAI),不仅正在改变各个行业,其能耗也影响到了几乎每个数据服务器组件,从CPU和内存到加速器和网络。genAI应用,包括Microsoft的Copilot和OpenAI的ChatGPT,需要比以往更多的能量。到2027年,仅训练和维护这些人工智能系统就可能消耗足够的电力来为一个小国提供一年所需的电力。这种趋势并没有减缓:过去十年中,CPU、内存和网络等组件的功耗预计到2030年将增加160%,根据高盛的一份报告。大型语言模型的使用也消耗了能量。例如,一个ChatGPT查询消耗了大约十倍于传统的谷歌搜索的能量。考虑到人工智能的巨大能耗需求,行业的快速进步是否可以被可持续地管理,还是会进一步导致全球能耗的增加?麦肯锡最近的研究显示,大约70%的数据中心市场需求增长是针对能够处理高级人工智能工作负载的设施。这一转变从根本上改变了数据中心的建设和运行方式,因为它们适应了这些高功率genAI任务的独特要求。“传统数据中心通常使用老旧的、能耗高的设备和固定容量,难以适应不断变化的工作负载,导致了大量的能耗浪费,”Aethir的首席战略官和联合创始人Mark Rydon告诉我。“集中式运营通常会在资源可用性和消耗需求之间产生不平衡,导致行业面临一个关键的十字路口,即进步可能会危及环境目标,因为人工智能驱动的需求正在增长。”行业领袖现在正面对这一挑战,投资于更绿色的设计和能效更高的数据中心架构。这些努力包括采用可再生能源、创建更高效的冷却系统,以抵消genAI工作负载产生的巨大热量。为更绿色的未来革新数据中心联想最近推出了ThinkSystem N1380 Neptune,这是数据中心液体冷却技术的一个飞跃。该公司声称,这项创新已经使组织能够以显著降低能耗(最高可达40%)部署高功率计算以处理genAI工作负载。N1380 Neptune利用了NVIDIA的最新硬件,包括Blackwell和GB200 GPU,使得在紧凑的设置中可以处理万亿参数的AI模型。联想表示,它旨在为不需要专用空调的100KW+服务器机架的数据中心铺平道路。“我们发现当前的消费者有一个显著的需求:数据中心在处理人工智能工作负载时会消耗更多的电力,因为冷却架构和传统结构框架已经过时,”联想全球人工智能总监Robert Daigle告诉我。“为了更好地理解这一点,我们与一家高性能计算(HPC)客户合作,分析了他们的功耗,这导致我们得出结论:我们可以将能耗降低40%。”他补充说,该公司考虑了风扇功耗、冷却单元的功耗等因素,并将其与联想的数据中心评估服务中可用的标准系统进行比较,以开发新的数据中心架构,并与NVIDIA合作。英国信息技术咨询公司AVEVA表示,它正在使用预测分析来识别数据中心压缩机、电机、HVAC设备、空气处理器等问题。“我们发现,生成式人工智能的预训练是消耗大量电力的,”AVEVA的人工智能和高级分析负责人Jim Chappell告诉我。“通过我们的预测人工智能驱动系统,我们旨在在任何SCADA或控制系统之前找到问题,允许数据中心运营商在问题变得严重之前解决设备问题。此外,我们有一个Vision AI助手,它可以与我们的控制系统本地集成,以帮助找到其他类型的异常,包括当使用热成像相机时的温度热点。”同时,通过GPU在云上进行人工智能训练和开发的去中心化计算正在作为一种替代方案出现。Aethir的Rydon解释说,通过将计算任务分配到更广泛、更适应性的网络中,可以优化能耗,通过将资源需求与可用性相匹配,从而大大减少浪费。“与其依赖大型集中式数据中心,我们的‘边缘’基础设施将计算任务分散到离数据源更近的节点,这大大减少了数据传输的能耗并降低了延迟,”他说。“Aethir Edge网络最小化了对恒定高功率冷却的需求,因为工作负载分散在各个环境中,而不是集中在一个位置,从而避免了典型的集中式数据中心中能耗高的冷却系统。”同样,包括亚马逊和谷歌在内的公司正在尝试使用可再生能源来管理其数据中心日益增长的电力需求。微软正在大量投资可再生能源和提高效率的技术,以降低其数据中心的能耗。谷歌也采取了措施转向碳自由能源,并探索最小化数据中心电力使用的冷却系统。“核能可能是实现碳自由数据中心的最快途径。像微软、亚马逊和谷歌这样的主要数据中心提供商现在正在大量投资这种类型的发电,”AVEVA的Chappell补充说。“小型模块化反应堆(SMR)具有灵活性和生产时间,使其成为实现净零的更可行的选择。”人工智能和数据中心可持续性能否共存?MinIO人工智能基础设施平台的CTOUgur Tigli表示,虽然我们希望未来人工智能能够在不大幅增加能耗的情况下发展,但在短期内这并不现实。“长期影响更难预测,”他告诉我:“但我们将看到工作力的转变,人工智能将在整体上改善能耗,尤其是在其他领域变得更加高效时。”Tigli认为,随着能效成为市场的优先事项,我们将看到计算能力的增长和其他领域能耗的下降,特别是在这些领域变得更加高效时。他还指出,消费者对更绿色的人工智能解决方案的兴趣日益增长。“想象一个以90%的效率运行但只使用一半电力的AI应用——这就是可能真正起飞的创新,”他补充说。很明显,人工智能的未来不仅仅是关于创新——它还关乎数据中心的可持续性。无论是开发更高效的硬件还是更智能地使用资源,我们如何管理人工智能的能耗都将极大地影响数据中心的设计和运营。Rydon强调了行业范围内专注于可持续数据中心设计、能效人工智能工作负载和开放资源共享的举措的重要性。“这些都是朝着更绿色的运营迈出的至关重要的步骤,”他说。“使用人工智能的企业应该与科技公司合作,创造出降低环境影响的解决方案。通过共同努力,我们可以引导人工智能朝着更可持续的未来发展。”
在联想的Tech World 2024上,联想和摩托罗拉都推出了开创性的人工智能(AI)创新,旨在推动消费技术中的超个人化。联想推出了”AI Now“,这是一种基于Meta的Llama 3.1 AI模型的生成式人工智能(genAI)系统,承诺通过将PC变成个性化的数字助手来使PC变得更智能。最突出的功能是:在不损害用户隐私的情况下实现超个人化。与大多数依赖云计算的AI系统不同,AI Now将交互存储在设备上。另外,PC上的genAI助手由系统硬件和本地大型语言模型(Local LLM)提供支持,这是一项独特的创新,不仅限制了AI与云的交互,还可以在没有互联网连接的情况下为用户查询提供响应。同样,摩托罗拉(联想公司)预览了”Moto AI”,这是一种genAI助手,旨在使智能手机变得无需手动操作。用户现在可以使用语音命令管理设备,功能如”Catch Me Up”和”Pay Attention”可以总结个人通信或转录对话以供审阅。”Remember This”功能还允许用户通过语音和手势命令捕捉实时瞬间或屏幕信息。“我们的代理人工智能系统保留用户上下文和记忆,允许进行更自然、连续的交互,无需重新引入信息。通过将多个传统的大型AI模型压缩成高效的7亿参数自治系统,我们计划在联想和摩托罗拉生态系统中提供高性能AI,同时保持可访问性”,杨元庆,联想集团CEO告诉我:“我们的目标是开发一个独特的私人知识库,适应个体需求,无需任何技术专业知识即可操作。”两家品牌都押注于genAI来驱动下一代AI驱动的消费技术。但是,这些AI进步能否在不损害用户隐私的情况下兑现其承诺?新时代的助手:我们能相信AI处理敏感数据吗?联想的AI Now提供超个人化的AI功能,存储用户数据在用户的系统硬件中。AI可以总结文档,转录会议,甚至根据自然语言输入调整设备设置——所有这些都无需互联网连接。创新是由独特的架构组成,结合CPU、GPU和NPU来为AI系统和用户交互提供本地支持,创建一个个人知识库(PKB),完全存储在设备上。AI Now不仅执行任务,还保留上下文和记忆,因此用户无需重新引入他们的偏好。这创建了更自然、连续的交互。联想声称,局部LLM架构是“行业首创”,可以在保护数据隐私的同时提供个性化的消费体验。“AI的未来是个人化的、主动的和预测性的。AI Now是我们开发消费者代理人工智能系统的第一步——一种增强型智能,了解您的偏好,理解您的独特认知行为,并自主为您工作,”托尔加·库尔托格鲁,联想CTO告诉我:“它超越了静态、基于聊天机器人的用例,深入到您的日常活动和与PC的交互数据中,处理这些见解,并将它们转化为可行的结果,以提高消费者的生产力。”摩托罗拉的Moto AI也利用局部LLM和LAM技术来简化智能手机上的日常任务——从设置闹钟到从捕获或存储的内容中生成上下文洞察。例如,当您拍摄一张照片时,Moto AI在后台默默地工作,提取有关该图像的基本信息和上下文。只需一个简单的语音命令,您就可以在任何时候重新访问这些记忆。在演示中,摩托罗拉展示了Moto AI如何自主运行,模仿人类般的交互,无需用户触摸屏幕——这是其他AI助手(如Siri或Google Gemini)难以实现的。用户可以简单地说出命令,如“预订Uber”或“在我最喜欢的餐厅预订晚餐”,然后看着AI在他们眼前执行这些任务,具有平滑地模仿典型人类智能手机交互的界面。摩托罗拉的创新方法整合了来自OpenAI、Stability AI等的多个AI模型,使AI能够在特定任务中表现出色。该公司旨在将Moto AI定位为AI助手领域的直接竞争对手,包括苹果的Siri和谷歌的Gemini,它们都在生成式AI和消费者数据安全方面进行了大量投资。然而,Moto AI的一个值得注意的方面是其能够连续记录发生在手机内部的活动,允许它内部读取通知、电子邮件和消息。那么,Moto AI真的对消费者来说是安全的吗?隐私与便利:这些AI系统有多安全?虽然这些AI助手的便利性是明显的,但隐私问题仍然是一个重大问题。这可能会引发人们对手机AI助手比用户自己更了解其个人生活的担忧,即使它是在本地处理的。作为对消费者数据隐私问题的回应,杰夫·斯诺,摩托罗拉AI和软件体验负责人,强调了AI助手将敏感的用户数据集中在手机本身。“我们相信我们的AI驱动手机将被视为生产力的强大工具,因为AI不会接触应用程序数据,而是通过记录用户偏好来模拟人类行为,”斯诺告诉我。“我们的AI方法不同,我们不是让用户成为创造者,而是让AI为用户提供建议,告诉他们如何与AI合作。我们目前处于测试阶段,计划在发布前通过功能解决更多用户挑战。”联想和摩托罗拉目前专注于平衡AI驱动的便利性与隐私保护。他们的设备AI系统提供增强的个性化,但公众对AI助手的信任将取决于用户对数据安全的信心。消费者会接受便利性,同时不完全确保其个人数据的安全吗?对这个问题的答案可能会决定AI驱动的消费技术的未来。