|
|
|
|
移动端

2.2.1 条件概率和独立

《深度学习与计算机视觉:算法原理、框架应用与代码实现》第2章 深度学习和计算机视觉中的基础数学知识,本章会尽量从定性的角度讲解一些与深度学习、计算视觉紧密联系的基础数学概念,不一定会很严谨细致,但力求简单、形象。本节为大家介绍条件概率和独立。

作者:叶韵来源:机械工业出版社|2017-11-16 17:44

2.2  概率论及相关基础知识

概率论在各种应用学科中未必有线性代数那么广泛,但也是极其重要的一门学科。机器学习作为一门面向数据的学科,概率论的重要性更加凸显。在默认读者已经具备高中概率基本知识的前提下,本节将面向应用层面需要,简要回顾及介绍概率论及相关知识里和机器学习联系最紧密的部分。

2.2.1  条件概率和独立

先上定义:如果有事件A和B,在已知B事件发生的条件下,A事件发生的概率为P(A|B)。通过定义,一个直观的感受是条件概率描述了依赖性。从反面的角度来说,就是一个事件是否是独立的。

所以我们来考虑这两种情况:第一种情况,如果A事件发生的概率确实依赖于B事件,则当需要计算A事件的概率时,就不得不考虑B事件。于是A事件和B事件同时发生的概率为P(AB)=P(A|B)P(B)。进一步的,如果用P(A|)表示B不发生时A发生的概率,则A事件发生的概率可以表示为P(A)=P(A|B)P(B)+P(A|)(1-P(B)),这实际上就是在求边缘概率。另一方面,A事件和B事件同时发生的概率也可以表示用已知A事件发生时B事件的概率乘以A事件发生的概率,所以有P(AB)=P(A|B)P(B)=P(B|A)P(A),这就是著名的贝叶斯公式;第二种情况,如果A事件发生的概率和B毫无关系,则有P(A)=P(A|B)=P(A|)。A事件和B事件同时发生的概率则为各自发生概率的乘积P(AB)=P(A)P(B)。

说个简单例子来体会一下,假设你住在二楼,每到晚饭后,楼下经常会出现跳广场舞的大妈。在不下雨的好天气里,大妈们兴致盎然,不过考虑到体能问题,只有90%的时候会出现,也就是P(跳舞|不下雨)=0.9。而遇上雨雪天气,大妈们仍有一颗风雨无阻的心,出现在广场上的概率大概是50%,所以P(跳舞|下雨)=0.5。而你居住的城市里,下雨天出现的概率是40%,即P(下雨)=0.4,总结如表2-1所示。

表2-1  广场舞大妈出现概率一览

说    明

P(下雨)=0.4

P(不下雨)=0.6

跳舞的条件概率

0.5

0.9

不跳舞的条件概率

0.5

0

先来计算一下大妈们在雨中舞蹈的概率P(下雨,跳舞)=P(跳舞|下雨)P(下雨)=0.5×0.4=0.2,也就是说大妈们在雨中坚持舞蹈的景象有20%的情况会出现。再来算算总体而言,大妈们跳舞的概率,P(跳舞)=P(跳舞|下雨)P(下雨)+P(跳舞|不下雨)P(不下雨)=0.5×0.4+  0.9×0.6=0.74,所以大部分时间大妈们都会跳舞的。接下来再算算,大妈们跳舞的情况下,下雨天出现的概率,P(下雨|跳舞)=P(跳舞|下雨)P(下雨)/P(跳舞)=0.5×0.4/0.74=0.27。虽然这个概率可以计算,不过注意到这并不代表着因果关系。下雨是影响是否跳舞的因素,而跳舞是不会影响是否下雨的。所以因果关系能推出条件概率,但是条件概率并不代表着因果关系。

那么条件独立的例子呢?想象一下你住的城市从不下雨,不过有雾霾。面对雾霾和对舞蹈的热爱,大妈们选择了后者,完全不受影响。所以这种情况下跳舞就是个独立事件,如果要计算大妈们在雾霾中舞蹈的概率,只需要P(霾中舞蹈)=P(跳舞)P(雾霾)。假如是在北京的话,根据2015年的统计数据,这个概率是0.9×0.49=0.44。


喜欢的朋友可以添加我们的微信账号:

51CTO读书频道二维码


51CTO读书频道活动讨论群:365934973

【责任编辑:book TEL:(010)68476606】

回书目   上一节   下一节
点赞 0
分享:
大家都在看
猜你喜欢

读 书 +更多

C++编程你也行

本书是一本优秀的C++教材,内容包括:基础类型、操作符和简单变量,循环和决策,命名空间和C++标准库,用C++编写函数,行为、序列点和求值...

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊