CNN Deep Learning Notes

图像由像素构成，每个像素由颜色构成。
假设一张1kx1k像素的图片，每个像素有RGB三个参数表示颜色信息
处理该图片需要处理3百万个像素

典型的CNN由三部分组成：

简单描述功能：
卷积层负责提取图像中的局部特征；池化层用来大幅降低参数量级(降维)；全连接层类似传统神经网络的部分，用来输出想要的结果

用一个过滤器过滤图像的各个子区域，从而得到子区域特征值
每个过滤器代表一种图像模式。如果卷积值较大，则认为此图像块十分接近于此卷积核（过滤器）。
如果设计了100个过滤器，可以理解成：我们认为这个图像由100钟底层纹理模式。用100种模式能够描绘一幅图像。

每种滤波器去卷积图像就得到对图像的不同特征的放映，我们称之为Feature Map。所以100种卷积核就有100个Feature Map。这100个Feature Map就组成了一层神经元。

每一个卷积核共享一个参数。每一层神经元的参数个数等于卷积核的种类乘以每种卷积核的参数。每种卷积核的参数等于感受野的大小x深度（RGB就是3）+1

池化的过程是非重叠的

References：

卷积神经网络学习笔记