AI 模型与平台

持续在设备上学习更近了一步，采用新型训练技术

发布于 2022年10月6日

更新于 2026年5月23日

作者

Alex McFarland

麻省理工学院和麻省理工学院-IBM沃森人工智能实验室的研究团队开发了一种新技术，使得设备上的训练可以使用不到一个四分之一的内存。这种新发展是一项令人印象深刻的成就，因为其他训练解决方案通常需要超过500兆字节的内存，这超过了大多数微控制器的256千字节容量。

通过在智能边缘设备上训练机器学习模型，它可以适应新数据并做出更好的预测。话虽如此，训练过程通常需要大量内存，因此通常在数据中心的计算机上进行，然后将模型部署到设备上。这种过程比新技术更昂贵，并且引发了更多的隐私问题。

研究人员以减少训练模型所需的计算量为出发点，开发了算法和框架，使得过程更快、更节省内存。这种技术可以帮助在微控制器上训练机器学习模型，只需几分钟。

这种新技术还可以帮助保护隐私，因为它将数据存储在设备上，这在处理敏感数据时尤为重要。同时，框架可以提高模型的准确性，相比其他方法更为有效。

宋汉是电气工程和计算机科学系的副教授，麻省理工学院-IBM沃森人工智能实验室的成员，也是研究论文的首席作者。

“我们的研究使得物联网设备不仅可以进行推理，还可以不断更新人工智能模型以适应新收集的数据，为持续在设备上学习铺平了道路，” 汉说。“低资源利用使得深度学习更容易获取，并且可以更广泛地应用，特别是对于低功耗边缘设备。”

该论文的共同第一作者和电气工程和计算机科学系的博士生包括Ji Lin和Ligeng Zhu，麻省理工学院的博士后包括Wei-Ming Chen和Wei-Chen Wang。论文还包括麻省理工学院-IBM沃森人工智能实验室的首席研究员Chuang Gan。

使训练过程更高效

为了使训练过程更高效、更少占用内存，团队依赖于两种算法解决方案。第一种被称为稀疏更新，它使用一种算法来识别每轮训练中需要更新的最重要权重。算法逐一冻结权重，直到准确率下降到某个阈值，此时它就会停止。剩余的权重然后被更新，冻结权重对应的激活不需要存储在内存中。

“更新整个模型非常昂贵，因为有很多激活，所以人们倾向于只更新最后一层，但可以想象，这会损害准确率，” 汉说。“对于我们的方法，我们有选择性地更新重要权重，并确保准确率得到完全保留。”

团队开发的第二种解决方案涉及量化训练和简化权重。算法首先通过量化过程将权重四舍五入到八位，这也减少了训练和推理所需的内存，而推理是指将模型应用于数据集并生成预测的过程。算法然后依赖一种称为量化感知缩放（QAS）的技术，作为一个乘数来调整权重和梯度之间的比率。这有助于避免由于量化训练可能导致的准确率下降。

研究人员开发了一个称为微型训练引擎的系统，该系统在一个没有操作系统的简单微控制器上运行算法创新。为了在模型部署到边缘设备之前在编译阶段完成更多工作，该系统改变了训练过程中步骤的顺序。

“我们将大量计算，如自动微分和图优化，推迟到编译时间。我们还积极地修剪冗余的操作以支持稀疏更新。一旦在运行时，我们在设备上要做的工作就大大减少了，” 汉说。

高效技术

虽然传统的为轻量级训练设计的技术通常需要大约300到600兆字节的内存，但团队的优化只需要157千字节来训练微控制器上的机器学习模型。

该框架通过训练计算机视觉模型来检测图像中的人员，并在仅10分钟内学会完成此任务。该方法还能够比其他方法快20多倍地训练模型。

研究人员现在希望将这些技术应用于语言模型和不同类型的数据。他们还希望利用所获得的知识来缩小较大的模型，而不损失准确率，这也可以帮助减少训练大规模机器学习模型的碳足迹。

Alex McFarland

Alex McFarland 是一名人工智能记者和作家，探索最新的人工智能发展。他曾与世界各地的众多人工智能初创公司和出版物合作。

Unite.AI

持续在设备上学习更近了一步，采用新型训练技术

使训练过程更高效

高效技术

发现更多