人工智能

传统机器学习是否仍然相关?

mm
Is Traditional Machine Learning Still Relevant?

近年来,生成式AI在解决复杂AI任务方面显示出良好的效果。现代AI模型,如ChatGPTBardLLaMADALL-E.3SAM,在解决多学科问题(如视觉问答、分割、推理和内容生成)方面展示了卓越的能力。

此外,多模态AI技术已经出现,能够同时处理多种数据模态(即文本、图像、音频和视频)。随着这些进步,人们自然会疑问:我们是否正在接近传统机器学习(ML)的终结?

在本文中,我们将探讨传统机器学习的现状及其与现代生成式AI创新之间的关系。

什么是传统机器学习?– 什么是其局限性?

传统机器学习是一个广泛的术语,涵盖了各种主要由统计学驱动的算法。传统ML算法的两种主要类型是监督和无监督。这些算法旨在从结构化数据集中开发模型。

标准的传统机器学习算法包括:

  • 回归算法,如线性、lasso和岭回归。
  • K-means聚类。
  • 主成分分析(PCA)。
  • 支持向量机(SVM)。
  • 树型算法,如决策树和随机森林。
  • 提升模型,如梯度提升和XGBoost

传统机器学习的局限性

传统ML具有以下局限性:

  1. 可扩展性有限:这些模型通常难以扩展以适应大型和多样化的数据集。
  2. 数据预处理和特征工程:传统ML需要大量的预处理以将数据集转换为模型所需的格式。此外,特征工程可能耗时且需要多次迭代以捕捉数据特征之间的复杂关系。
  3. 高维和非结构化数据:传统ML难以处理复杂的数据类型,如图像、音频、视频和文档。
  4. 适应未见数据:这些模型可能无法很好地适应未在其训练数据中看到的现实世界数据。

神经网络:从机器学习到深度学习及更远

神经网络:从机器学习到深度学习及更远

神经网络(NN)模型比传统机器学习模型复杂得多。最简单的NN——多层感知器(MLP),由多个神经元组成,以理解信息并执行任务,类似于人类大脑的功能。

神经网络技术的进步为从机器学习到深度学习的转变奠定了基础。例如,用于计算机视觉任务(对象检测和图像分割)的NN被称为卷积神经网络(CNNs),如AlexNetResNetYOLO

如今,生成式AI技术正在将神经网络技术推向新的高度,使其在各种AI领域中表现出色。例如,用于自然语言处理任务(如文本摘要、问答和翻译)的神经网络被称为变换器。著名的变换器模型包括BERTGPT-4T5。这些模型对从医疗保健、零售、营销、金融等行业产生了影响。

我们是否仍然需要传统机器学习算法?

我们是否仍然需要传统机器学习算法?

虽然神经网络及其现代变体(如变换器)引起了人们的广泛关注,但传统ML方法仍然至关重要。让我们来看看为什么它们仍然相关。

1. 简单的数据要求

神经网络需要大量的数据集进行训练,而ML模型可以使用较小和更简单的数据集来实现显著的结果。因此,ML在处理较小的结构化数据集时更受欢迎,而深度学习则更适合处理大型和复杂的数据集。

2. 简单性和可解释性

传统机器学习模型建立在更简单的统计和概率模型之上。例如,线性回归中的最佳拟合线使用最小二乘法建立输入输出关系,这是一种统计运算。

同样,决策树使用概率原理对数据进行分类。使用这些原理提供了可解释性,并使AI从业者更容易理解ML算法的工作原理。

现代NN架构,如变换器和扩散模型(通常用于图像生成,如Stable DiffusionMidjourney),具有复杂的多层网络结构。理解这些网络需要对高级数学概念有深入的理解。这就是为什么它们也被称为“黑盒子”。

3. 资源效率

现代神经网络,如大型语言模型(LLMs),需要在集群的昂贵GPU上训练,以满足其计算要求。例如,GPT4据报道在25000个Nvidia GPU上训练了90到100天。

然而,对于每个从业者或AI团队来说,昂贵的硬件和漫长的训练时间并不是可行的。另一方面,传统机器学习算法的计算效率使从业者即使在资源受限的情况下也能实现有意义的结果。

4. 并非所有问题都需要深度学习

深度学习并不是解决所有问题的万能药。有些情况下,ML比深度学习表现更好。

例如,在医疗诊断和预后中,具有有限数据的ML算法(如异常检测)可能比深度学习更有效。同样,传统机器学习在计算能力有限的情况下是一个灵活且高效的解决方案。

主要地,选择最适合任何问题的最佳模型取决于组织或从业者的需求以及问题的性质。

2023年的机器学习

2023年的机器学习

图像由Leonardo AI生成

2023年,传统机器学习继续演进,并与深度学习和生成式AI竞争。它在行业中有多种用途,特别是在处理结构化数据集时。

例如,许多快速消费品(FMCG)公司处理大量的表格数据,依赖于ML算法来执行关键任务,如个性化产品推荐、价格优化、库存管理和供应链优化。

此外,许多视觉和语言模型仍然基于传统技术,提供混合方法和新兴应用的解决方案。例如,一项最近的研究“我们真的需要深度学习模型来进行时间序列预测?”讨论了如何使用梯度提升回归树(GBRTs)来进行时间序列预测,而不是深度神经网络。

ML的可解释性仍然非常有价值,具有诸如SHAP(Shapley加性解释)和LIME(局部可解释模型无关解释)等技术。这些技术解释复杂的ML模型,并提供有关其预测的见解,从而帮助ML从业者更好地理解其模型。

最后,传统机器学习仍然是解决多样化行业的可靠解决方案,解决了可扩展性、数据复杂性和资源约束的问题。这些算法在数据分析和预测建模中不可替代,将继续成为数据科学家的工具之一。

如果您对这些主题感兴趣,请访问Unite AI以获取更多见解。

Haziqa 是一名具有丰富经验的数据科学家,擅长为 AI 和 SaaS 公司撰写技术内容。