存根 什么是深度学习? (2024) - 联合人工智能
关注我们.

AI 101

什么是深度学习?

mm
更新 on

深度学习是人工智能领域最具影响力、发展最快的领域之一。然而,直观地理解深度学习可能很困难,因为深度学习一词涵盖了各种不同的算法和技术。一般来说,深度学习也是机器学习的一个子学科,因此为了理解深度学习,了解机器学习是什么很重要。

什么是机器学习?

深入学习 是源自机器学习的一些概念的延伸,因此,出于这个原因,让我们花一点时间来解释什么是机器学习。

简而言之,机器学习是一种使计算机能够执行特定任务的方法,而无需对用于完成这些任务的每一行算法进行显式编码。 有许多不同的机器学习算法,但最常用的算法之一是 多层感知器。 多层感知器也称为神经网络,它由一系列连接在一起的节点/神经元组成。 多层感知器中有三个不同的层:输入层、隐藏层和输出层。

输入层将数据输入网络,由中间/隐藏层的节点进行操作。 隐藏层中的节点是数学函数,可以操纵来自输入层的数据,从输入数据中提取相关模式。 这就是神经网络“学习”的方式。 神经网络之所以得名,是因为它们受到人脑结构和功能的启发。

网络中节点之间的连接具有称为权重的值。 这些值本质上是关于一层中的数据与下一层中的数据如何相关的假设。 当网络训练时,权重会被调整,目标是关于数据的权重/假设最终将收敛于准确表示数据中有意义模式的值。

激活函数存在于网络的节点中,这些激活函数以非线性方式转换数据,使网络能够学习数据的复杂表示。 激活函数将输入值乘以权重值并添加偏差项。

什么是深度学习?

深度学习是指将许多多层感知器连接在一起的机器学习架构,因此不仅有一个隐藏层,而且有许多隐藏层。 深度神经网络越“深”,网络可以学习的模式就越复杂。

由神经元组成的深层网络有时被称为全连接网络或全连接层,指的是给定神经元与其周围所有神经元保持连接的事实。 全连接网络可以与其他机器学习功能相结合,创建不同的深度学习架构。

不同类型的深度学习

研究人员和工程师使用多种深度学习架构,每种不同的架构都有自己的专业用例。

卷积神经网络

卷积神经网络,或 CNN,是创建计算机视觉系统时常用的神经网络架构。卷积神经网络的结构使它们能够解释图像数据,将其转换为完全连接的网络可以解释的数字。 CNN 有四个主要组成部分:

  • 卷积层
  • 二次采样/池化层
  • 激活函数
  • 全连接层

卷积层将图像作为网络的输入,分析图像并获取像素值。 子采样或池化是图像值被转换/减少的地方,以简化图像的表示并降低图像滤波器对噪声的敏感度。 激活函数控制数据如何从一层流到下一层,而全连接层则分析表示图像的值并学习这些值中包含的模式。

RNN/LSTM

递归神经网络或 RNN,在数据顺序很重要、网络必须了解数据序列的任务中很受欢迎。 RNN 通常应用于自然语言处理等问题,因为在解码句子含义时单词的顺序很重要。术语“循环神经网络”的“循环”部分来自这样一个事实:序列中给定元素的输出依赖于先前的计算以及当前的计算。与其他形式的深度神经网络不同,RNN 具有“记忆”,序列中不同时间步计算的信息用于计算最终值。

RNN 有多种类型,包括双向 RNN,在计算项目的值时,除了前面的项目之外,还考虑序列中的未来项目。另一种类型的 RNN 是 长短期记忆(LSTM), 网络。 LSTM 是一种可以处理长数据链的 RNN。 常规 RNN 可能会成为“梯度爆炸问题”的受害者。 当输入数据链变得非常长时,就会出现此问题,但 LSTM 拥有解决此问题的技术。

自动编码器

到目前为止提到的大多数深度学习架构都应用于监督学习问题,而不是无监督学习任务。自动编码器能够将无监督数据转换为监督格式,从而允许使用神经网络来解决问题。

自动编码器 经常用于检测数据集中的异常,这是无监督学习的一个例子,因为异常的本质是未知的。 此类异常检测的示例包括金融机构的欺诈检测。 在这种情况下,自动编码器的目的是确定数据中规则模式的基线并识别异常或异常值。

自动编码器的结构通常是对称的,隐藏层的排列使得网络的输出类似于输入。 经常使用的四种类型的自动编码器是:

  • 常规/普通自动编码器
  • 多层编码器
  • 卷积编码器
  • 正则化编码器

常规/普通自动编码器只是具有单个隐藏层的神经网络,而多层自动编码器是具有多个隐藏层的深层网络。 卷积自动编码器使用卷积层代替全连接层,或者除了全连接层之外还使用卷积层。 正则化自动编码器使用一种特定类型的损失函数,使神经网络能够执行更复杂的功能,而不仅仅是将输入复制到输出。

生成对抗网络

生成对抗网络(GAN) 实际上是多个深度神经网络,而不仅仅是一个网络。 同时训练两个深度学习模型,并将它们的输出馈送到另一个网络。 这些网络相互竞争,并且由于它们可以访问彼此的输出数据,因此它们都可以从这些数据中学习并改进。 这两个网络本质上是在玩伪造和检测的游戏,其中生成模型试图创建新的实例来愚弄侦探模型/鉴别器。 GAN 在计算机视觉领域已经变得很流行。

深度学习总结

深度学习扩展了神经网络的原理,以创建复杂的模型,可以学习复杂的模式并将这些模式推广到未来的数据集。 卷积神经网络用于解释图像,而 RNN/LSTM 用于解释顺序数据。 自动编码器可以将无监督学习任务转换为监督学习任务。 最后,GAN 是多个相互竞争的网络,对于计算机视觉任务特别有用。

博主和程序员,擅长 机器学习 深度学习 主题。 丹尼尔希望帮助其他人利用人工智能的力量造福社会。