人工智能
传统机器学习仍然相关吗?
近年来,生成式人工智能在解决复杂的人工智能任务方面显示出了可喜的成果。 现代人工智能模型如 ChatGPT, 诗人, 骆驼, 达尔-E.3及 SAM 在解决视觉问答、分割、推理和内容生成等多学科问题方面表现出了卓越的能力。
此外, 多模式人工智能 能够同时处理多种数据模式(即文本、图像、音频和视频)的技术已经出现。 有了这些进步,人们自然会想:我们是否已经接近末日了? 传统机器学习 (毫升)?
在本文中,我们将研究有关现代生成式人工智能创新的传统机器学习领域的状况。
什么是传统机器学习? – 它的局限性是什么?
传统机器学习是一个广泛的术语,涵盖主要由统计驱动的各种算法。 传统机器学习算法的两种主要类型是 有监督和无监督。 这些算法旨在从结构化数据集开发模型。
标准的传统机器学习算法包括:
- 回归算法,例如线性、套索和岭。
- K-均值聚类。
- 主成分分析(PCA)。
- 支持向量机 (SVM)。
- 基于树的算法,例如决策树和随机森林。
- Boosting 模型,例如梯度提升和 XGBoost.
传统机器学习的局限性
传统的机器学习有以下局限性:
- 有限的可扩展性: 这些模型通常需要帮助来扩展大型且多样化的数据集。
- 数据预处理和特征工程: 传统的机器学习需要大量的预处理来根据模型要求转换数据集。 此外,特征工程可能非常耗时,并且需要多次迭代才能捕获数据特征之间的复杂关系。
- 高维和非结构化数据: 传统的机器学习难以处理图像、音频、视频和文档等复杂的数据类型。
- 对看不见的数据的适应性: 这些模型可能无法很好地适应不属于其模型的现实世界数据 训练数据.
神经网络:从机器学习转向深度学习及其他
神经网络(NN)模型比传统的机器学习模型复杂得多。 最简单的神经网络—— 多层感知器 (MLP) 由几个连接在一起的神经元组成,用于理解信息并执行任务,类似于人脑的功能。
神经网络技术的进步为从 机器学习到深度学习。例如,用于计算机视觉任务(目标检测和图像分割)的神经网络被称为 卷积神经网络 (CNN),如 亚历克斯网, RESNET及 YOLO.
如今,生成式人工智能技术正在将神经网络技术更进一步,使其在各个人工智能领域表现出色。例如,用于自然语言处理任务(如文本摘要、问答和翻译)的神经网络被称为 变形金刚。 著名的变压器型号包括 BERT, GPT-4及 T5。 这些模式正在对医疗保健、零售、营销、 金融等等。
我们还需要传统的机器学习算法吗?
虽然神经网络及其现代变体(例如 Transformer)受到了广泛关注,但传统的机器学习方法仍然至关重要。 让我们看看为什么它们仍然具有相关性。
1. 更简单的数据要求
神经网络需要大量数据集进行训练,而机器学习模型可以使用更小、更简单的数据集取得显着的结果。 因此,对于较小的结构化数据集,机器学习比深度学习更受青睐,反之亦然。
2. 简单性和可解释性
传统的机器学习模型建立在更简单的统计和概率模型之上。 例如,最佳拟合线 线性回归 使用最小二乘法(一种统计运算)建立输入-输出关系。
同样,决策树利用概率原理对数据进行分类。 这些原则的使用提供了可解释性,并使人工智能从业者更容易理解机器学习算法的工作原理。
现代神经网络架构,如变压器和扩散模型(通常用于图像生成,如 稳定扩散 or 中途)具有复杂的多层网络结构。 理解此类网络需要理解高级数学概念。 这就是为什么它们也被称为“黑匣子”。
3.资源效率
现代神经网络(例如大型语言模型 (LLM))根据其计算要求在昂贵的 GPU 集群上进行训练。 例如,据报道,GPT4 的训练对象是 25000 个 Nvidia GPU 持续90至100天。
然而,昂贵的硬件和漫长的训练时间并不是每个从业者或AI团队都可行的。 另一方面,传统机器学习算法的计算效率使得从业者即使在资源有限的情况下也能获得有意义的结果。
4. 并非所有问题都需要深度学习
深度学习 并不是所有问题的绝对解决方案。 在某些场景中,机器学习的性能优于深度学习。
例如,在 医学诊断和预后 在数据有限的情况下,ML 算法 异常检测 REMED 可以提供比深度学习更好的结果。 同样,传统的机器学习在计算能力较低的场景中也具有重要意义。 灵活高效的解决方案.
首先,针对任何问题选择最佳模型取决于组织或从业者的需求以及当前问题的性质。
2023 年的机器学习
图像生成使用 莱昂纳多艾
2023年,传统机器学习继续发展,并与深度学习和生成式人工智能展开竞争。 它在行业中有多种用途,特别是在处理结构化数据集时。
例如,许多 快速消费品(FMCG) 公司依靠机器学习算法处理大量表格数据,以执行个性化产品推荐、价格优化、库存管理和供应链优化等关键任务。
此外,许多 视觉和语言模型 仍然基于传统技术,提供混合方法和新兴应用的解决方案。 例如,最近一项题为“我们真的需要深度学习模型来进行时间序列预测吗?” 讨论了梯度增强回归树 (GBRT) 如何更有效地 时间序列预测 比深度神经网络。
机器学习的可解释性对于诸如 夏普 (沙普利加法解释)和 LIME (本地可解释的模型不可知的解释)。 这些技术解释了复杂的机器学习模型并提供了有关其预测的见解,从而帮助机器学习从业者更好地理解他们的模型。
最后,传统机器学习仍然是解决可扩展性、数据复杂性和资源限制的不同行业的强大解决方案。 这些算法对于数据分析和预测建模是不可替代的,并将继续成为数据分析和预测建模的一部分。 数据科学家的武器库.
如果此类主题引起您的兴趣,请探索 联合人工智能 以获得更多见解。