博文

关于真实得病概率问题

已有 13127 次阅读 2017-4-2 00:25 |系统分类:博客资讯

关于真实得病概率问题

首先是有张天蓉博主的一篇“概率论悖论”，/blog-677221-1042909.html。

其中有如下一段话：

--------------------------------------

基本比率谬误（base rate fallacy）

先看一个生活中的例子。

王宏去医院作验血实验，检查他患上了X疾病的可能性，其结果居然为阳性，把他吓了一大跳，赶忙到网上查询。网上的资料说，实验总是有误差的，这种实验有“百分之一的假阳性率和百分之一的假阴性率”。这句话的意思是说，在得病的人中做实验，有1%的人是假阳性，99％的人是真阳性。而在未得病的人中做实验，有1%的人是假阴性，99％的人是真阴性。于是，王宏根据这种解释，估计他自己得了X疾病的可能性（即概率）为99%。王宏想，既然只有百分之一的假阳性率，那么，百分之九十九都是真阳性，那我已被感染X病的概率便应该是99%。

可是，医生却告诉他，他被感染的概率只有0.09左右。这是怎么回事呢？王宏的思路误区在哪里？

医生说：“百分之九十九？哪有那么大的感染几率啊。99％是测试的准确性，不是你得病的概率。你忘了一件事：这种X疾病的正常比例是不大的，1000个人中只有一个人有X病。”

医生的计算方法是这样的：因为测试的误报率是1%，1000个人将有10个被报为“假阳性”，而根据X病在人口中的比例（1/1000=0.1%），真阳性只有1个。所以，大约11个测试为阳性的人中只有一个是真阳性（有病）的，因此，王宏被感染的几率是大约1/11，即0.09(9%)。

王宏想来想去仍感糊涂，但这件事激发了王宏去重温他之前学过的概率论。经过反复阅读，再思考琢磨医生的算法之后，他明白了自己是犯了那种叫做“基本比率谬误”的错误，即忘记使用“X病在人口中的基本比例（1/1000）这个事实。

------------------------------------

高山博主不同意，发表了一篇博文：“有关科学网一篇概率问题的再讨论”，

/blog-907017-1043054.html

高山说，王宏最初认为的99%是对的，医生计算的9%是不对的。而且留言希望我支持他的观点。

老实说，我对概率论只通六窍，今天之前也不知道贝叶斯是谁。但是这个问题看上去很有趣，似乎违反常识，何不乘此机会学习一点概率论？

数学家当然是对的，可是他们写的东西照例很抽象难懂。我且试试能不能把这个问题用简单的语言说清楚，让老百姓也能懂。

先看看几个名词的定义：

1. 临床特异度是衡量试验正确地判定无病者的能力，特异度是将实际无病的人正确地判定为阴性的比例。

2. 临床灵敏度可用来衡量某种试验检测出有病者的能力，灵敏度是将实际有病的人正确地判定为阳性的比例。

3. false negative proportion

假阴性率：又称漏诊率或第Ⅱ类错误。指实际有病，但根据筛检试验被定为无病的百分比。它反映的是筛检试验漏诊病人的情况。

4. false positive proportion

假阳性率：又称误诊率或第Ⅰ类错误。在科学实验或检测中，出现假阳性结果的几率。实际上无病，但根据筛检被判为有病的百分比。它反映的是筛检试验误诊病人的情况。

5.gold standard

所谓“金标准”是指当前临床医学界公认的诊断疾病的最可靠、最准确、最好的诊断方法，也称标准诊断方法。临床上常用的金标准有组织病理学检查（活检、尸检）、手术发现、影像诊断（CT、核磁共振、彩色B 超）、病原体的分离培养以及长期随访所得的结论。金标准一般是特异性诊断方法，可以正确区分为“有病”和“无病”。但目前金标准在诊断医学中的应用不是很多。

所以，首先是有一种或一些方法--金标准--来规定一个病人是有（某种）病还是没有病。可惜金标准由于种种原因通常不能普遍使用，临床上通常会有一些较简单，便宜的检验方法进行筛查。

把100个金标准病人的样品进行筛查，给出X个病人阳性（有病），Y个病人阴性。那么，X%就是灵敏度，Y%就是假阴性率（漏报率）。显然，X+Y=100。

把100个金标准无病人的样品进行筛查，给出A个病人阳性（有病），B个病人阴性。那么，B%就是特异度，A%就是假阳性率（误报率）。显然，A+B=100。

原文中的问题是，如果X=B=99，王宏检验结果是阳性，问王宏是真正有病（金标准病人）的概率是多少？

我们知道X,B，是对正问题有了确定的答案，我们对测试方法的性能有完全的了解。现在要解决的是逆问题，如果我们知道结果，我们能知道输入参数（有病，无病）的概率分布吗？

“常识”告诉王宏，他真正有病的概率就是X%（=99%）。

可是张天蓉介绍的概率论告诉我们，在这里“常识”不成立。要知道王宏真正有病的概率，我们还需要一个不可缺少的参数：人群中真正的病人的比率C。原文中假定C=0.1% 。

按照所给的参数，对100000个人进行筛查。其中有100个真正的病人，会报告99例阳性。其余的99900非病人，由于1%的误报率，会报告999例阳性。最终结果是，在99+999例阳性报告中，只有99个真正的病人。

王宏真正有病的概率，确实就是9% 。

不管高山博主多么自信，他这次错了！

张天蓉博文有一段：

网上的资料说，实验总是有误差的，这种实验有“百分之一的假阳性率和百分之一的假阴性率”。这句话的意思是说，在得病的人中做实验，有1%的人是假阳性，99％的人是真阳性。而在未得病的人中做实验，有1%的人是假阴性，99％的人是真阴性。

其中后半段有瑕疵。正确的说法是：这句话的意思是说，在得病的人中做实验，有1%的人是假阴性，99％的人是真阳性。而在未得病的人中做实验，有1%的人是假阳性，99％的人是真阴性。

顺便说一句，在此例中，100000-99-999=98002份阴性报告中，只有1个人是真正有病的.所以，阴性结果的可信度非常高。比较：阳性结果的可信度是9%。悬殊如此之大，是由于此例中人群中真正的病人的比率C=0.1%，很小。

相关专题：概率问题与贝叶斯定理
转载本文请联系原作者获取授权，同时请注明本文来自文克玲科学网博客。
链接地址：https://blog.szjingmu.com/blog-583426-1043106.html

上一篇：提倡：“各人自扫门前雪，莫议他人瓦上霜”
下一篇：为什么说“高山根本不懂贝叶斯统计”

收藏 IP: 114.254.45.*| 热度|

nqed的个人博客分享 /u/nqed

博文

关于真实得病概率问题

当前推荐数：7 推荐人：徐令予 范振英 杨正瓴 冯大诚 梅卫平 gaoshannankai yunmu

该博文允许注册用户评论请点击登录评论 (31 个评论)

文克玲

全部作者的精选博文

全部作者的其他澳门黄金赌城

全部精选博文导读

相关博文

nqed的个人博客分享 /u/nqed

博文

关于真实得病概率问题

当前推荐数：7 推荐人： 徐令予 范振英 杨正瓴 冯大诚 梅卫平 gaoshannankai yunmu

该博文允许注册用户评论 请点击登录 评论 (31 个评论)

文克玲

全部作者的精选博文

全部作者的其他澳门黄金赌城

全部精选博文导读

相关博文

当前推荐数：7 推荐人：徐令予范振英杨正瓴冯大诚梅卫平 gaoshannankai yunmu

该博文允许注册用户评论请点击登录评论 (31 个评论)