Connect with us

思想领袖

为什么人工智能独裁者必须被挑战去做得更好

mm

如果我们从人工智能时代学到了任何东西,那就是该行业正在与重大的权力挑战作斗争。这些挑战既是字面意义上的——例如找到满足人工智能数据中心所需的巨大能量需求的方法——又是比喻意义上的——例如基于狭隘的商业利益而不是更广泛的社会利益的人工智能财富集中在少数人手中。

人工智能权力悖论:高成本,集中控制

为了使人工智能成功并造福人类,它必须变得无处不在。为了变得无处不在,它必须在经济和环境上都是可持续的。这不是我们现在正在走的道路。为了更快、更大的人工智能而进行的疯狂竞争,更多的是由短期的性能增益和市场主导地位驱动的,而不是为了可持续和负担得起的人工智能而努力。

人工智能系统的建设正加速进行,但这却带来了巨大的环境代价。像Nvidia的H100(最高700瓦)这样的尖端人工智能芯片已经消耗了大量的能量。这种趋势预计将继续下去,业内人士预测,Nvidia的下一代Blackwell架构可能将每个芯片的功耗推入千瓦范围,可能超过1,200瓦。由于业界领袖预计将在全球数据中心部署数百万这样的芯片,因此人工智能的能量需求即将大幅增加。

人工智能军备竞赛的环境成本

让我们把它放在日常的背景下。为你的整个房子供电的电力可以同时让所有电器以满负荷运行——当然,没有人会这样做。现在,想象一下,仅仅一个120千瓦的Nvidia机架就需要同样的电力,特别是当大型数据中心中可能有成百上千个这样的机架时!现在,1,200瓦等于1.2千瓦。所以,我们实际上是在谈论一个中等规模的社区。一个单独的120千瓦Nvidia机架——基本上是100个这样的耗能芯片——需要足够的电力来为大约100个家庭供电。

这种趋势令人担忧,考虑到许多社区面临的能量限制。数据中心专家预测,美国在未来五到七年内将需要18到30千瓦的新容量,这让公司们都在争相寻找处理这种激增的方法。与此同时,我的行业只是不断地创造出更多耗能的生成性人工智能应用,这些应用的能量消耗远远超过了理论上对应用或大多数企业来说是可行的,甚至是对地球来说是理想的。

平衡安全性和可访问性:混合数据中心解决方案

这种人工智能独裁和“军备竞赛”,痴迷于原始速度和力量,忽视了现实世界数据中心的实际需求——即,能够降低市场壁垒的可负担解决方案,75%的美国组织尚未采用人工智能。让我们面对现实,随着更多关于隐私、安全和环境保护的人工智能监管的出台,更多组织将要求采用混合数据中心方法,在高度保护的本地区域内安全地存储他们最珍贵的、最私密和最敏感的数据,远离人工智能和网络攻击。无论是医疗记录、财务数据、国家防御秘密还是选举完整性,企业人工智能的未来都需要在本地安全性和云敏捷性之间取得平衡。

这是一个重大的系统性挑战,需要超越竞争的超级合作。由于对GPU和其他人工智能加速器芯片的原始能力、速度和性能指标的关注,我们忽略了采用人工智能能力所需的可负担和可持续的基础设施。就像在没有发射台的地方建造一艘宇宙飞船,或者在乡村道路上行驶兰博基尼。

民主化人工智能:行业合作

虽然政府开始考虑监管——确保人工智能造福所有人,而不仅仅是精英——我们的行业需要的不仅仅是政府规则。

例如,英国正在利用人工智能来增强执法能力,通过增强执法机构之间的数据共享来改进人工智能驱动的犯罪预测和预防。他们专注于使用人工智能进行执法的透明度、问责制和公平性,确保公众信任和遵守人权——使用诸如面部识别和预测性警务等工具来辅助犯罪检测和管理。

在生物技术和医疗保健等高度监管的行业中,值得注意的合作包括强生 MedTech和Nvidia共同合作,以增强手术程序的人工智能。他们的合作旨在开发实时、人工智能驱动的分析和决策能力,在手术室中。该合作伙伴关系利用NVIDIA的人工智能平台,在医疗保健环境中实现人工智能应用的可扩展、安全和高效部署。

与此同时,在德国,默克公司已经与Exscientia和BenevolentAI建立了战略联盟,以推进人工智能驱动的药物发现。他们正在利用人工智能来加速新药候选物的开发,特别是在肿瘤学、神经学和免疫学领域。目标是通过人工智能的强大设计和发现能力来提高药物开发的成功率和速度。

第一步是降低企业(尤其是大型制药和科技公司以外的企业)部署人工智能的成本,特别是在人工智能推理阶段——当企业在真正的数据中心中安装和运行训练好的人工智能模型(如Chat GPT、Llama 3或Claude)时。最近的估计表明,开发这些下一代系统中最大的一个的成本可能在10亿美元左右,推理成本可能高出8-10倍。

实施人工智能在日常生产中的成本飞涨,使得许多公司无法完全采用人工智能——“有不”。最近的一项调查发现,只有四分之一的公司在过去12个月内成功推出了人工智能计划,42%的公司尚未从生成性人工智能计划中看到显著的好处。

为了真正民主化人工智能并使其无处不在——即广泛的企业采用——我们的人工智能行业必须转变焦点。我们不需要竞争最大的和最快的模型和人工智能芯片,而是需要更多的合作努力来提高可负担性、降低能耗,并将人工智能市场开放起来,共享其全部和积极的潜力。系统性的变化将使所有人都受益,使人工智能对所有人都更有利可图,并带来巨大的消费者利益。

有令人振奋的迹象表明,降低人工智能的成本是可行的——降低了大规模国家和全球人工智能计划的财务壁垒。我的公司NeuReality正在与高通合作,实现人工智能应用的成本降低90%和能效提高15倍——这些应用遍及文本、语言、声音和图像等人工智能的基本构建块。通过与更多的软件和服务提供商合作,我们可以继续定制人工智能,以提高性能和降低成本。

事实上,我们已经降低了与传统CPU中心基础设施相比每个人工智能查询的成本和能耗——所有人工智能加速器芯片,包括Nvidia GPU,都依赖于这种基础设施。我们的NR1-S人工智能推理设备已经开始配备高通云AI 100 Ultra加速器和NR1 NAPUs。结果是NeuReality架构取代了传统的CPU在人工智能数据中心中的作用——这是人工智能数据处理中最大的瓶颈。这种演进性的变化是深刻的和必要的。

超越炒作:建设经济和可持续的人工智能未来

让我们超越人工智能的炒作,认真地解决我们的系统性挑战。艰难的工作在系统层面上,需要整个人工智能行业共同努力。通过关注可负担性、可持续性和可访问性,我们可以创造一个造福社会的更大的人工智能行业和更广泛的客户群。也就是说,提供可持续的基础设施选择,而不是人工智能财富集中在少数人手中,称为大七集团。

人工智能的未来取决于我们今天的集体努力。通过优先考虑能源效率和可访问性,我们可以避免一个由耗能的人工智能基础设施主导的未来和一个专注于原始性能而非广泛利益的人工智能寡头政治。同时,我们还必须解决阻碍人工智能潜力的不可持续的能源消耗——人工智能可以革新公共安全、医疗保健和客户服务。

通过这样做,我们可以创造一个由广泛的创新驱动的强大的人工智能投资和盈利周期。

谁与我们同在?

Moshe Tanach 是 NeuReality 的联合创始人和 CEO。在创立 NeuReality 之前,他曾在 Marvell 和 Intel 担任工程总监,领导复杂的无线和网络产品进入大规模生产。他还曾在 DesignArt-Networks(后被高通收购)担任研发副总裁,开发 4G 基站产品。他从以色列理工大学获得了电气工程学士学位,成绩优异。