|
|
|
|
移动端

1.2.2 2012年——计算机视觉的新起点

《深度学习与计算机视觉:算法原理、框架应用与代码实现》本书全面介绍了深度学习及计算机视觉中最基础的知识,并结合最常见的应用场景和大量实例,带领读者进入丰富多彩的计算机视觉领域。本节为大家介绍2012年——计算机视觉的新起点。

作者:叶韵来源:机械工业出版社|2017-11-16 17:17

年前最后一场技术盛宴 | 1月27日与京东、日志易技术大咖畅聊智能化运维发展趋势!


1.2.2  2012年——计算机视觉的新起点

ILSVRC举办的前两年,各种手工设计特征+编码+SVM框架下的算法就霸占了前几名。ILSVRC的分类错误率的标准是让算法选出最有可能的5个预测,如果有一个是正确的则算通过,如果都没有预测对则算错误。2010年ILSVRC的冠军是NEC的余凯带领的研究组,错误率达到了28%。2011年施乐欧洲研究中心的小组将这个成绩提高到了25.7%。

终于,到了2012年,这年辛顿的小组也参加了竞赛,主力选手是辛顿的一名研究生阿历克斯·克里泽夫斯基(Alex Krizhevsky)。阿历克斯是一名学术和工程都非常厉害的学生,在这一年的竞赛上,他提出了一个5卷积层+2全连接层的卷积神经网络AlexNet,并利用CUDA给出了实现,这个算法一下将前5类错误率从25.7%降到了15.3%,在之前的ImageNet竞赛中,哪怕有一个百分点的提升,都是很不错的成绩,而深度学习第一次正式应用在图像分类竞赛就取得了10个百分点的改进,并且完胜第二名(26.2%)。这在当时对传统计算机视觉分类算法的冲击是不言而喻的。简单来说当时的改进主要有以下3点。

更深的网络结构;

校正线性单元(Rectified Linear Unit,ReLU),Dropout等方法的应用;

GPU训练网络。

Tips:AlexNet的细节在第4章中介绍。

尽管在当年许多传统计算机视觉的学者仍然对AlexNet抱有种种质疑,如算法难以解释,参数过多(实际上比许多基于SVM的办法还少)等,但自从2012年后,ImageNet的参赛者几乎全体转向了基于卷积神经网络的深度学习算法,或者可以说计算机视觉领域全体转向了深度学习。基于深度学习的检测和识别、基于深度学习的图像分割、基于深度学习的立体视觉等如雨后春笋般一夜之间全冒了出来。深度学习,尤其是卷积神经网络就像一把万能的大杀器,在计算机视觉的各个领域开始发挥了作用。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

数据库系统概念

本书是数据库系统方面的经典教材之一。国际上许多著名大学包括斯坦福大学、耶鲁大学、得克萨斯大学、康奈尔大学、伊利诺伊大学、印度理工学...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊