AI 入门 101
什么是CNNs(卷积神经网络)?

也许你曾经想知道Facebook或Instagram如何能够自动识别图像中的面部,或者Google如何让你通过上传自己的照片来搜索网络上的类似照片。这些功能是计算机视觉的例子,它们是由卷积神经网络(CNNs)驱动的。那么,什么是卷积神经网络?让我们深入了解CNN的架构,并了解它们如何运作。
什么是神经网络?
在我们开始讨论卷积神经网络之前,让我们花一点时间定义普通的神经网络。有另一篇文章关于神经网络的话题,所以我们不会在这里对其进行深入讨论。然而,为了简要定义它们,它们是受人脑启发的计算模型。神经网络通过调整“权重”来操作输入数据,这些权重是关于输入特征之间以及对象类别之间的关系的假设。随着网络的训练,权重的值会被调整,希望它们能够收敛到准确捕捉特征之间关系的权重。
这是前馈神经网络的工作原理,CNN由两个部分组成:前馈神经网络和一组卷积层。
什么是卷积神经网络(CNNs)?
卷积神经网络中的“卷积”是什么?卷积是一种数学运算,创建一组权重,基本上是创建图像部分的表示。这种权重集被称为核或滤波器。创建的滤波器比整个输入图像小,仅覆盖图像的一个子部分。滤波器中的值与图像中的值相乘。然后滤波器移动到一个新部分,重复此过程,直到整个图像被覆盖。
另一种思考方式是想象一个砖墙,砖代表输入图像的像素。一个“窗口”正在墙上滑动,这就是滤波器。通过窗口可见的砖块是将其值乘以滤波器内的值的像素。因此,这种使用滤波器创建权重的方法通常被称为“滑动窗口”技术。
滤波器在整个输入图像上移动的输出是一个二维数组,代表整个图像。这个数组被称为“特征图”。
为什么卷积是必需的
为什么要创建卷积?卷积是必要的,因为神经网络必须能够将图像中的像素解释为数字值。卷积层的功能是将图像转换为神经网络可以解释的数字值,然后从中提取相关模式。卷积网络中的滤波器的任务是创建一个可以传递到神经网络后面的层的二维值数组,这些层将学习图像中的模式。
滤波器和通道

Photo: cecebur via Wikimedia Commons, CC BY SA 4.0 (https://commons.wikimedia.org/wiki/File:Convolutional_Neural_Network_NeuralNetworkFeatureLayers.gif)












