|
|
|
|
移动端

2.4.4 二维卷积和图像响应

《深度学习与计算机视觉:算法原理、框架应用与代码实现》第2章 深度学习和计算机视觉中的基础数学知识,本章会尽量从定性的角度讲解一些与深度学习、计算视觉紧密联系的基础数学概念,不一定会很严谨细致,但力求简单、形象。本节为大家介绍二维卷积和图像响应。

作者:叶韵来源:机械工业出版社|2017-11-16 18:17

年前最后一场技术盛宴 | 1月27日与京东、日志易技术大咖畅聊智能化运维发展趋势!


2.4.4  二维卷积和图像响应

二维情况下的卷积和一维并没有本质上的不同,下面略过公式,直接来形象理解,如图2-44所示。

如图2-44a所示,待卷积二维信号是个5×5的矩阵,为了执行same方式的二维卷积,在这个5×5矩阵的外围各加了长度为1的零填充称为一个7×7的矩阵。卷积核则是一个3×3的矩阵,最左边一列为1,最右边一列为-1,中间一列为0。

图2-44a中最上面的例子是卷积核在7×7矩阵上无论是横向还是纵向,每次划动一格,因为是same方式,最后生成一个和原矩阵大小相同的5×5矩阵。虽然这个例子中矩阵很小,但在应用到实际图像时,因为图像是二维的,所以卷积核需要计算点积的位置数目和图片边长像素个数成平方比。这种情况下,如果还是以每次划动一个元素的方式做卷积,通常计算量并不小,所以在二维卷积中一个常用的手段是按一定间隔“划动”卷积核,达到降采样的目的。而这个划动间隔被称为stride,所以每次移动一个元素就是stride=1。而图2-44a中最下面的例子就是每次移动两个元素的情况,也就是stride=2,最后生成一个3×3的矩阵。从维度的观点来看,这也相当于是一种降维。

在图2-43中,我们看到了一维信号经过特定的核卷积之后,生成的大致是信号中与核相似部分的响应。在二维信号中,也有类似的性质,如图2-44b所示,左边是一张砖瓦的黑白照片,有明显的横向纹理和竖向纹理。我们让图2-44a中的卷积核和这张照片做卷积,就会得到一张响应图。为了方便显示,把得到的结果取绝对值,就是图2-44b中右边的图像。可以看到,虽然原图中横向和竖向的条纹都很明显,但是经过卷积之后,只有竖向条纹对应的位置得到了明显不同于其他区域的响应。所以形如图2-44a中所示的卷积核,在这个例子中起到了纵向边缘查找的作用。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

Visual C# 2005从入门到精通

Microsoft Visual C#功能强大、使用简单。本书全面介绍了如何利用Visual Studio2005和NET Framework来进行C#编程。作者将C#的各种特性娓娓...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊