前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >用几何图形帮助我们分析和理解概率问题

用几何图形帮助我们分析和理解概率问题

作者头像
阿波张
发布2020-07-27 15:30:06
1.7K0
发布2020-07-27 15:30:06
举报
文章被收录于专栏:go语言核心编程技术

本文是对最近所学概率的一点总结和思考,内容比较基础,主要介绍如何通过图形帮助我们分析和理解概率相关的问题,比如全概率及贝叶斯公式的图形化理解等。

用图形表示样本空间和事件

概率中的样本空间指的是一个试验的所有可能结果所组成的集合,而事件是该集合的子集。比如在一次抛一个质地均匀的硬币的试验中如果我们关心的是哪一面朝上,则样本空间为

{正面朝上,反面朝上}

而事件则可能是以下几个

{正面朝上},{反面朝上},{正面朝上或反面朝上},{正面朝上而且反面朝上}

很显然最后一个事件是不可能发生的事件。

上面用的是集合来表示样本空间和事件,而集合又可以用文氏图来表示,因此我们也可以使用类似的图形来来表示样本空间和事件。还是前面的例子,我们把样本空间和事件都整合到下图中。

整个实线圆就表示样本空间,它包含了两个基本事件:用左半圆表示的正面朝上事件和用右半圆表示的反面朝上事件。红色的虚线圆表示正面朝上或反面朝上这个事件,很容易理解它跟样本空间是完全重合的。这里我们用的半圆和圆,当然我们也可以用其它图形来表示,只要能反应事件和样本空间的关系就可以了。

样本空间和事件图形化之后,我们就可以把某个事件的概率看作是代表该事件的图形所占面积与代表样本空间的图形所占面积的比值。为了简便,一般我们把整个样本空间图形的面积看作是1,这样一个图形的面积的绝对值也就是该图形所对应事件的概率。

比如上面的例子,因为硬币是均匀的,所以正面朝上或反面朝上的可能性是一样的,所以我们用了两个一样大的半圆来分别表示正面朝上和反面朝上这两个事件。它们各占整个样本空间面积的1/2,代表P(正面朝上)=1/2,P(反面朝上)=1/2,从上图可以看出虚线圆表示的正面朝上或反面朝上这一事件正好包含了正面朝上和反面朝上这两个事件,所以它的概率是1/2+1/2=1。

可能有读者会说,这样图形化也没多大好处,不图形化我们也能很容易理解这个概率。确实,如果概率问题比较简单,图形化好处并不大。但随着问题越来越复杂,我们将会看到概率模型图形化的好处。接下来我们来看稍稍复杂点的条件概率。

条件概率的图形化理解

条件概率的公式为

P(A|B)=\frac{P(A \cap B)}{P(B)}

它表示的意思是在事件B已经发生的情况下事件A发生的概率等于事件A和B的交集的概率除以事件B的概率。图形化表示如下:

结合上图和条件概率公式:在事件B已经发生的情况下事件A发生的概率可以看作是事件A的图形在事件B的图形之内的部分的面积除以事件B的图形的面积。

例子 一对夫妇有2个小孩,已知其中一个是女孩,如果生男生女概率相同,那么另一个也是女孩的概率是多少?

根据题意,我们可以把样本空间设计为

{男孩男孩,男孩女孩,女孩女孩,女孩男孩}

其中 {男孩女孩}表示第一胎生的是男孩而第二胎生的是女孩,其他的类推。

因为生男生女的概率相同,所以两个都是男孩的概率等于第一胎生男孩的概率乘第二胎生男孩的概率,即1/2 * 1/2 = 1/4,同理,样本空间中其他几个基本事件的概率都是1/4。现设事件B={其中一个是女孩},事件A={另一个也是女孩},事件A等价于{两个都是女孩 }这一事件。现在我们需要计算的是P(A|B)等于多少。我们可以把图画成下面这样

从图中可以看出,事件B(玫红色部分)占整个样本空间图形的3/4,而事件A(左下角标有'女孩女孩’的1/4圆)占整个样本空间的1/4,而且事件A完全被包含在了事件B之中,所以事件A占事件B的1/3,也就是已知其中一个是女孩另一个也是女孩的概率是1/3,即P(A|B)=1/3。

全概率及贝叶斯公式的图形化理解

下图是来自于《概率导论》这本书中的全概率公式。

先解释两个概念:

不相容事件:指的是两个事件没有交集,用图形来表示不相容事件的话就是两个图形没有重叠部分。 形成样本空间的一个分割:指的是一组事件合起来正好是整个样本空间。

第一次看到这个公式可能不太明白它到底是什么意思,我们看看同样来自于《概率导论》的下图。

图中有三个互不相容的事件A1,A2和A3,这三个事件的并集正好是整个样本空间。从上图我们可以非常直观的看出事件B的概率是椭圆阴影部分的面积与整个长方形样本空间的面积的比值,同时椭圆又可以看成由事件A1中的阴影部分,事件A2中的阴影部分和事件A3中的阴影部分这三部分组成的。现假设长方形面积为1,则A1的概率P(A1)可以看作是图形A1的面积,而条件概率P(B|A1)表示的是A1中的阴影部分的面积与A1的面积之比,因此P(A1)P(B|A1)表示的就是A1中阴影部分的面积,以此类推,根据全概率公式计算的P(B) = P(A1)P(B|A1) + P(A2)P(B|A2) + P(A3)P(B|A3)要表达的意思就是

事件B的概率 = 事件A1中阴影部分的面积 + 事件A2中阴影部分的面积 + 事件A3中阴影部分的面积

这是我们轻易就可以从图中看出来的事实,下面看个例子。

小王每天开车上班的概率为50%,坐地铁上班的概率为30%,跑步上班的概率为20%,已知三种出行方式导致迟到的概率分别为50%,10%和10%,如果小王今天上班迟到了,那么他今天开车上班的概率是多少?

假设事件B={上班迟到了},事件A={开车上班},则需要计算的是条件概率P(A|B)。根据题意我们可以画出下图。

根据前面条件概率的图形化理解,可以知道P(A|B)=开车上班的这一事件的图形(上图左半圆)在上班迟到了这一事件的图形之内的部分的面积除以上班迟到这一事件的图形(图中阴影部分)的面积。

那么上班迟到这一事件的图形的面积是多少呢?这个其实就是一个全概率,假设整个样本空间图形的面积是1,则它等于下面三部分之和:

1,开车上班的图形的面积 * 开车迟到的概率:0.5 * 0.5 = 0.25,也就是事件A与事件B的交集部分的面积 2,坐地铁上班的图形的面积 * 坐地铁迟到的概率:0.3 * 0.1 = 0.03 3,跑步上班的图形的面积 * 跑步迟到的概率:0.2 * 0.1 = 0.02

所以

P(A|B)=\frac{0.25}{0.25+0.03+0.02}=\frac{5}{6}

也就是说如果小王今天上班迟到了,那么他开车上班的概率为5/6。虽然前面算的是概率,但可以把它看作是一个因果推理,即知道小王今天迟到了,我们推断出今天他很有可能开车了!

熟悉贝叶斯公式的人可能已经发现,在上面的这个例题中其实我们无意之间用到了大名鼎鼎的贝叶斯公式,该公式在深度学习中应用比较多。

最后我们来看一下贝叶斯公式:

结合上面例题中的图,我们很容易看出贝叶斯公式所要表达的意思:

如果事件B已经发生,则事件A也已经发生的概率等于在整个样本空间中事件A和事件B同时发生的概率除以事件B发生的概率。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 源码游记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档