|
|
|
|
移动端

目录(2)

《深度学习与计算机视觉:算法原理、框架应用与代码实现》本书全面介绍了深度学习及计算机视觉中最基础的知识,并结合最常见的应用场景和大量实例,带领读者进入丰富多彩的计算机视觉领域。本节为目录。

作者:叶韵来源:机械工业出版社|2017-11-16 16:37

【新品产上线啦】51CTO播客,随时随地,碎片化学习

目录(2)

4.1.5  多通道卷积 125
4.1.6  激活函数 125
4.1.7  池化、不变性和感受野 126
4.1.8  分布式表征(Distributed Representation) 128
4.1.9  分布式表征和局部泛化 130
4.1.10  分层表达 131
4.1.11  卷积神经网络结构 131
4.2  LeNet——第一个卷积神经网络 132
4.3  新起点——AlexNet 133
4.3.1  网络结构 133
4.3.2  局部响应归一化(Local Response Normalization,LRN) 136
4.4  更深的网络——GoogLeNet 136
4.4.1  1×1卷积和Network In Network 136
4.4.2  Inception结构 138
4.4.3  网络结构 138
4.4.4  批规一化(Batch Normalization,BN) 140
4.5  更深的网络——ResNet 142
4.5.1  困难的深层网络训练:退化问题 142
4.5.2  残差单元 142
4.5.3  深度残差网络 144
4.5.4  从集成的角度看待ResNet 144
4.5.5  结构更复杂的网络 146
第2篇  实例精讲
第5章  Python基础 148
5.1  Python简介 148
5.1.1  Python简史 148
5.1.2  安装和使用Python 149
5.2  Python基本语法 150
5.2.1  基本数据类型和运算 150
5.2.2  容器 153
5.2.3  分支和循环 156
5.2.4  函数、生成器和类 159
5.2.5  map、reduce和filter 162
5.2.6  列表生成(list comprehension) 163
5.2.7  字符串 163
5.2.8  文件操作和pickle 164
5.2.9  异常 165
5.2.10  多进程(multiprocessing) 165
5.2.11  os模块 166
5.3  Python的科学计算包——NumPy 167
5.3.1  基本类型(array) 167
5.3.2  线性代数模块(linalg) 172
5.3.3  随机模块(random) 173
5.4  Python的可视化包——matplotlib 175
5.4.1  2D图表 175
5.4.2  3D图表 178
5.4.3  图像显示 180
第6章  OpenCV基础 182
6.1  OpenCV简介 182
6.1.1  OpenCV的结构 182
6.1.2  安装和使用OpenCV 183
6.2  Python-OpenCV基础 184
6.2.1  图像的表示 184
6.2.2  基本图像处理 185
6.2.3  图像的仿射变换 188
6.2.4  基本绘图 190
6.2.5  视频功能 192
6.3  用OpenCV实现数据增加小工具 193
6.3.1  随机裁剪 194
6.3.2  随机旋转 194
6.3.3  随机颜色和明暗 196
6.3.4  多进程调用加速处理 196
6.3.5  代码:图片数据增加小工具 196
6.4  用OpenCV实现物体标注小工具 203
6.4.1  窗口循环 203
6.4.2  鼠标和键盘事件 205
6.4.3  代码:物体检测标注的小工具 206
第7章  Hello World!  212
7.1  用MXNet实现一个神经网络 212
7.1.1  基础工具、NVIDIA驱动和CUDA安装 212
7.1.2  安装MXNet 213
7.1.3  MXNet基本使用 214
7.1.4  用MXNet实现一个两层神经网络 215
7.2  用Caffe实现一个神经网络 219
7.2.1  安装Caffe 219
7.2.2  Caffe的基本概念 220
7.2.3  用Caffe实现一个两层神经网络 221
第8章  最简单的图片分类——手写数字识别 227
8.1  准备数据——MNIST 227
8.1.1  下载MNIST 227
8.1.2  生成MNIST的图片 227
8.2  基于Caffe的实现 228
8.2.1  制作LMDB数据 229
8.2.2  训练LeNet-5 230
8.2.3  测试和评估 235
8.2.4  识别手写数字 239
8.2.5  增加平移和旋转扰动 240
8.3  基于MXNet的实现 242
8.3.1  制作Image Recordio数据 242
8.3.2  用Module模块训练LeNet-5 243
8.3.3  测试和评估 245
8.3.4  识别手写数字 247
第9章  利用Caffe做回归 249
9.1  回归的原理 249
9.1.1  预测值和标签值的欧式距离 249
9.1.2  EuclideanLoss层 250
9.2  预测随机噪声的频率 250
9.2.1  生成样本:随机噪声 250
9.2.2  制作多标签HDF5数据 252
9.2.3  网络结构和Solver定义 253
9.2.4  训练网络 259
9.2.5  批量装载图片并利用GPU预测 260
9.2.6  卷积核可视化 262
第10章  迁移学习和模型微调 264
10.1  吃货必备——通过Python采集美食图片 264
10.1.1  通过关键词和图片搜索引擎下载图片 264
10.1.2  数据预处理——去除无效和不相关图片 267
10.1.3  数据预处理——去除重复图片 267
10.1.4  生成训练数据 269
10.2  美食分类模型 271
10.2.1  迁移学习 271
10.2.2  模型微调法(Finetune) 272
10.2.3  混淆矩阵(Confusion Matrix) 276
10.2.4  P-R曲线和ROC曲线 278
10.2.5  全局平均池化和激活响应图 284
第11章  目标检测 288
11.1  目标检测算法简介 288
11.1.1  滑窗法 288
11.1.2  PASCAL VOC、mAP和IOU简介 289
11.1.3  Selective Search和R-CNN简介 290
11.1.4  SPP、ROI Pooling和Fast R-CNN简介 291
11.1.5  RPN和Faster R-CNN简介 293
11.1.6  YOLO和SSD简介 294
11.2  基于PASCAL VOC数据集训练SSD模型 296
11.2.1  MXNet的SSD实现 296
11.2.2  下载PASCAL VOC数据集 297
11.2.3  训练SSD模型 298
11.2.4  测试和评估模型效果 299
11.2.5  物体检测结果可视化 299
11.2.6  制作自己的标注数据 302


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

精通JavaScript动态网页编程(实例版)

本书通过大量实例代码,以ECMA-262版本3为基础,结合JavaScript 1.5和JavaScript 5.5,由浅入深、循序渐进地介绍了JavaScript知识要点与编...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊