统计学关我什么事:生活中的极简统计学
上QQ阅读APP看书,第一时间看更新

2-6 贝叶斯推理过程的总结

本讲中,求癌症检查的贝叶斯逆概率的方法,可用图表2-7表示如下:

图表2-7 罹患癌症概率的贝叶斯推理过程

那么,在求罹患癌症的后验概率的过程中,我们能够发现什么呢?这个问题,也是本讲最重要的内容所在。

首先,请注意本讲开头提出的问题——“如果在准确度为95%的癌症检查中,你的检查结果呈阳性,那么,你患癌症的概率是否为95%?”答案是否定的。别说95%了,实际上只有4.5%。不过在这个意义上讲,倒不必过度悲观。

至于为何概率会如此之低,原因在于,患癌症的可能性本来就极其微小,健康人群中所占的比例远高于患癌症的人,健康人被误诊为阳性的可能性也很大,这一部分数值不能忽视。因此,即便检查结果呈阳性,也有很极大的可能性是健康人被误诊。所以,千万不要过度悲观。

不过,即便如此,也不能完全放心。关于这一点,看一看表示先验概率和后验概率的图表2-8就清楚了。

图表2-8 关于癌症检查的贝叶斯更新

通过上图我们可以看出,罹患该种癌症的概率,在尚未进行观察的情况下为0.001(先验概率);而得知检查结果呈阳性之后,数值便发生了更新,变为约0.045(后验概率)。也就是说,概率从0.1%一下子上升到4.5%,增大了45倍。

在得知检查结果之前,该种癌症的自然发生率很低,1000人中只有1个人有可能患病;而得知检查结果呈阳性之后,概率骤然提高,20个人中就有1个人有可能患病。这绝对是不容小觑的事情。

在类似以上的推算过程中,如果想要深刻理解后验概率的话,需要每天进行练习。在阅读本书的过程中,请读者朋友们多加练习。

第2讲·小结

1.(借助流行病学数据)设定“癌症”、“健康”的先验概率。

2.设定癌症检查的敏感度。也就是设定癌症患者检查结果为阳性或阴性的条件概率,以及健康人检查结果为阳性或阴性的条件概率(使用治疗数据)。

3.由于检查结果呈“阳性”,因此暂不考虑“阴性”情况。

4.对“癌症&阳性”的概率与“健康&阳性”的概率数值,恢复标准化条件(保持之前的比例关系,使相加结果为1)

5.标准化条件下的“癌症&阳性”的数值,即为检查结果为阳性的患者实际患癌的时候概率(贝叶斯逆概率)。

6.在观察检查结果后,先验概率更新为后验概率(贝叶斯更新)。

练习题

假设现在是流感流行期,由于高烧而前来医院就诊的患者中,有70%患的是流感,30%患的是普通感冒。通过流感检测工具检查出来的阳性-阴性概率总结于以下表格中。

此时,通过以下步骤来推测,在流感检测工具上显示阳性时患流感的概率,以及显示阴性时未患流感的概率。

各个类别的先验概率分别为,

(a)=( )、(b)=( )

添加信息后的条件概率分别为,

(c)=( )、(d)=( )

(e)=( )、(f)=( )

四种互不相同的情况的概率分别为,

(g)=( )×( )=( )

(h)=( )×( )=( )

(i)=( )×( )=( )

(j)=( )×( )=( )

将观察结果为“阳性”的两种可能性的概率进行标准化处理,则

观察结果为“阳性”的情况下,患“流感”的后验概率=( )

将观察结果为“阴性”的两种可能性的概率进行标准化处理,则

观察结果为“阴性”的情况下,患“流感”的后验概率=( )