AI 入门 101

开发人员创建开源软件帮助 AI 研究人员减少碳足迹

mm

一组国际 AI 研究人员和数据科学家合作设计了一款能够估计计算操作碳足迹的软件。该开源软件包称为 CodeCarbo,由一组 AI 和数据科学公司联合设计。希望该软件能够使程序员能够使代码更加高效,并减少计算资源使用产生的二氧化碳量。

减少碳足迹

根据 ITP,新的 CodeCarbon 软件包由 AI 研究公司 Mila 领导的 AI 研究团队开发,与 Comet.ml、宾夕法尼亚州的 Haverford 学院和 GAMMA 合作。该软件不仅可以估计计算资源使用产生的二氧化碳量,还为开发人员提供了减少碳能耗的建议。

训练 AI 模型可能需要大量能量。 如 ArsTechnica 所述,马萨诸塞大学阿默斯特分校的研究人员估计了创建和训练某些 AI 模型的总成本,并发现训练自然语言网络 BERT 一次产生的二氧化碳量约等于从旧金山到纽约的往返航班。同时,训练模型多次直到优化可能会产生与 315 名乘客乘坐同一航班相同的二氧化碳量。

为什么 AI 模型会消耗这么多能量并产生这么多二氧化碳?部分答案在于 AI 模型的训练和优化方式。为了获得小幅度的改进,AI 研究人员可能会训练他们的模型数千次,每次都对模型进行微小的调整,直到发现最佳模型架构。

AI 模型也在不断增长,变得更加复杂。

像 GPT-3、BERT 和 VGG 这样的最强大机器学习算法和模型,有数百万个参数,需要数周的训练时间,相当于数百或数千小时的训练时间。GPT-2 有大约 15 亿个参数,而 GPT-3 有大约 175 亿个权重。这最终会使用数百公斤的二氧化碳。

CodeCarbon

CodeCarbon 有一个跟踪机制模块,记录云提供商和数据中心使用的电力。然后,系统使用来自公开可用来源的数据来估计产生的二氧化碳量,检查连接到硬件的电网的统计数据。跟踪器估计每个实验使用特定 AI 模块产生的二氧化碳量,并存储项目和整个组织的排放数据。

Mila 的创始人 Yohua Bengio 解释说,虽然 AI 是一个非常强大的工具,可以解决很多问题,但它通常需要大量的计算能力。波士顿咨询集团的董事总经理 Sylvian Duranton 认为,计算和 AI 将继续以指数级的速度增长。CodeCarbon 的理念是帮助 AI 和计算公司在继续增长的同时限制他们的碳足迹。CodeCarbon 将生成一个仪表盘,允许公司轻松查看训练机器学习模型产生的排放量。它还将以开发人员可以理解的指标表示排放量,例如驾驶汽车的里程、观看电视的小时数和美国典型家庭的能耗。

CodeCarbon 的开发人员希望该软件不仅会鼓励 AI 研究人员尝试减少自己的碳足迹,还会鼓励整个行业对排放更加透明。开发人员将能够量化和报告不同 AI 和计算实验产生的排放量。CodeCarbon 的开发团队希望其他开发人员会采用他们的开源工具,并添加新的功能,以帮助 AI 工程师和研究人员进一步减少他们的环境影响。

博客作者和程序员,专攻 Machine Learning Deep Learning 领域。Daniel 希望帮助他人利用 AI 的力量为社会做好事。