|
|
|
|
移动端

1.3.1 从ImageNet竞赛到AlphaGo战胜李世石——计算机视觉超越人类

《深度学习与计算机视觉:算法原理、框架应用与代码实现》本书全面介绍了深度学习及计算机视觉中最基础的知识,并结合最常见的应用场景和大量实例,带领读者进入丰富多彩的计算机视觉领域。本节为大家介绍从ImageNet竞赛到AlphaGo战胜李世石——计算机视觉超越人类。

作者:叶韵来源:机械工业出版社|2017-11-16 17:19

1.3  基于深度学习的计算机视觉

深度学习成了现今大部分计算机视觉领域的标配,计算机视觉上的成功又进一步促进了深度学习。

1.3.1  从ImageNet竞赛到AlphaGo战胜李世石——计算机视觉超越人类

前面已经介绍过ImageNet图像分类竞赛和AlexNet的一骑绝尘。本节来看看接下来几年发生了什么。

2013年,马修·塞勒(Matthew Zeiler)以初创公司Clarifi创始人,以及纽约大学计算机系的博士生的两个身份参加了ImageNet比赛,并分别取得了第一名和第三名,这一年他把ImageNet的前5分类错误率降低到了11.7%。从这一年开始几乎所有的参赛者都开始使用卷积神经网络,少数没有使用深度神经网络的参赛者都处于垫底位置。

2014年,Google开始在ImageNet发力。当时在Google担任软件工程师的克里斯蒂安·赛格蒂(Christian Szegedy)提出了一种Inception的结构,并基于这种结构搭建了一个22层的卷积神经网络GoogLeNet,达到了6.66%错误率的成绩。和2013年相比,这一年基于卷积神经网络的成绩普遍提升,前5名都达到了小于10%的成绩。另外值得一提的是,GoogLeNet从网络、形态上讲,已经脱离了AlexNet和LeNet的卷积叠加+全连接的框架。这一年,所有的参赛者都使用了深度神经网络。

Tips:关于GoogLeNet的细节,第4章节会有详细介绍。

2015年,在建立更深网络的大趋势下,微软亚洲研究院(MicroSoft Research Asia,MSRA)的何恺明提出了深度残差网络(Deep Residual Networks),把网络层数做到了152层,并在ImageNet的分类比赛中取得了3.57%的错误率。在当年,这个成绩的意义除了第一名,更重要的是超过了接收过训练的人在ImageNet数据集上对图片进行分类的成绩(5.1%)。虽然这个结果并不能说明深度学习算法已经真的超过了人类,但是在深度学习介入ImageNet的分类竞赛前,算法只能做到28%的错误率,而在引入深度学习后,三年内就填补了最先进算法到人类分类水平的23%左右的空白,深度学习已经充分展现了威力。

2016年,前5名分类的错误率被进一步降低到了2.99%。冠军是我国公安部三所的搜神(Trimps-Soushen)代表队。2016年的ImageNet竞赛基本上是中国公司代表队的全面开花。在各个不同类别比赛的最终排行榜上都能看到中国公司和机构的名字,出现最多的是海康威视、公安部三所搜神和汤晓鸥老师的商汤科技。这是个可喜可贺的情况,说明中国在深度学习的应用上已经走在了世界的前列。不过从另一方面来讲,2016年很多国外传统强队根本没有参赛,并且也没有什么特别亮眼的新方法被提出,这届竞赛有些更像是模型组合及调参大赛,也不是一件特别鼓舞人心的事情。

每一门学科技术的发展都是螺旋式上升,深度学习被大炒几年后是否也会像股票和三线城市的房价一样回调停滞?总之,作为一门威力强大但是却没有被透彻研究的技术,深度学习还有很多可以探索的领域,其发展也许还任重道远。如图1-7是从2011年到2016年ImageNet竞赛中物体分类最好成绩的趋势。

深度学习在图片分类上的成功是被关注讨论最多的,事实上在其他领域深度学习算法在指标上也在渐渐赶超人类。如人脸识别领域的一个公认数据集LFW(Labeled Faces in the Wild)上,人类识别的准确率是97.53%,而如今基于深度学习的人脸识别已经可以达到99.5%的水平。

2016年初万众瞩目的围棋人机大战中,AlphaGo突破了人类智慧的最后堡垒。虽然AlphaGo不算是计算机视觉的应用,但是深度卷积神经网络却在其中扮演了重要角色。棋盘的特征是以19×19的图像形式表示的,通道数是人为规定的颜色、轮次等其他特征,然后放到基于深度卷积神经网络的估值和策略网络中进行训练。

事实上在许多特定任务上,基于深度学习的算法超越人类水平都不是什么新鲜事,未来还会看到更多的例子。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

点石成金:访客至上的网页设计秘笈(原书第2版)

有些网站看起来很清爽; 有些网站看起来很杂乱; 有些网站能让你轻松地找到资料; 有些网站让你犹如置身迷宫…… ...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊