关注我们.

AI 101

开发人员创建开源软件来帮助人工智能研究人员减少碳足迹

mm

一组国际人工智能研究人员和数据科学家合作设计了能够估计计算操作碳足迹的软件。 这个名为 CodeCarbo 的开源软件包是由人工智能和数据科学公司组成的联盟设计的。 希望该软件能够并激励程序员提高代码效率,并减少使用计算资源产生的二氧化碳量。

减少碳足迹

根据 ITP,新的 CodeCarbon 软件包是由人工智能研究公司 Mila 领导的人工智能研究小组与 Comet.ml、宾夕法尼亚州哈弗福德学院和 GAMMA 共同开发的。 该软件不仅可以估算使用计算资源产生的二氧化碳量,还可以为开发人员提供减少碳能源足迹的建议。

训练人工智能模型 可能需要大量的能量。 正如 ArsTechnica 所解释的来自马萨诸塞大学阿默斯特分校的研究人员估算了创建和训练某些人工智能模型的总成本,该团队发现训练自然语言网络 BERT 产生的碳量大约相当于旧金山和纽约之间的往返航班产生的碳量。 同时,多次训练模型直至优化,可能会产生相当于 2 名乘坐同一航班的不同乘客的二氧化碳量。

到底为什么人工智能模型会消耗如此多的能源并产生如此多的二氧化碳作为副产品? 部分答案在于人工智能模型的训练和优化方式。 为了对现有最先进的算法进行哪怕很小的改进,人工智能研究人员可能会对其模型进行数千次训练,每次都对模型进行轻微调整,直到发现最佳模型架构。

人工智能模型的规模也在不断扩大,并且逐年变得更加复杂。

最强大的机器学习算法和模型(例如 GPT-3、BERT 和 VGG)拥有数百万个参数,并且一次训练数周,相当于数百或数千小时的训练时间。 GPT-2 网络内大约有 1.5 亿个参数,而 GPT-3 大约有 175 亿个权重。这最终消耗了数百公斤的二氧化碳。

代码碳

CodeCarbon 有一个跟踪机制模块,可以记录云提供商和数据中心的用电量。 然后,该系统使用从公开来源提取的数据来估计产生的二氧化碳量,并检查硬件所连接的电网的统计数据。 跟踪器使用特定的人工智能模块估算每次实验产生的二氧化碳,并存储项目和整个组织的排放数据。

Mila 的创始人 Yohua Bengio 解释说,虽然人工智能是一种非常强大的工具,可以解决许多问题,但它通常需要大量的计算机能力。 波士顿咨询集团董事总经理西尔维安·杜兰顿 (Sylvian Duranton) 认为,计算和人工智能将在全球范围内继续呈指数级增长。 CodeCarbon 的想法是帮助人工智能和计算公司在不断发展的过程中限制其碳足迹。 CodeCarbon 将生成一个仪表板,使公司可以轻松查看机器学习模型训练产生的排放量。 它还将代表开发人员可以轻松理解的指标排放量,例如汽车行驶里程、看电视的时间以及美国家庭的典型能源消耗。

CodeCarbon 开发人员预计,该软件不仅会鼓励人工智能研究人员尝试减少自己的碳足迹,而且会鼓励提高总体排放的透明度。 开发人员将能够量化和报告一系列不同的人工智能和计算实验产生的排放。 负责创建 CodeCarbon 的团队希望其他开发人员能够采用他们的开源工具,并通过新功能对其进行增强,以帮助人工智能工程师和研究人员进一步抑制对环境的影响。

博主和程序员,擅长 机器学习 深度学习 主题。 丹尼尔希望帮助其他人利用人工智能的力量造福社会。