智游城

标题: 概率 vs 常识 和思维习惯带来的错误认识 [打印本页]

作者: maomaobiao    时间: 2010-7-19 09:09
标题: 概率 vs 常识 和思维习惯带来的错误认识
本帖最后由 maomaobiao 于 2010-7-19 09:27 编辑

最近看书学到的一个有意思的问题,发现这样的思维在我们的习惯中,很常见。

------=== 问题 ===------

假设你是医生,你根据以往海量的数据知道以下情况并且用它们作为你判断的依据:

a. 来看病的人中,确诊得了肺炎的病人,有15%症状表现为剧烈咳嗽
b. 来看病的人中,确诊得了肺炎的病人,有50%症状表现为胸口局部剧烈刺痛

问题来了,一个人来看病,他症状表现为 剧烈咳嗽 + 胸口局部剧烈刺痛,那他有多大的可能性得的是肺炎呢?

有点意思,我先不说答案。正在思考ing这对于打扑克能有什么帮助,哈哈。
作者: greatsunkai    时间: 2010-7-19 14:39
如果是有剧烈咳嗽的人,15%肺炎还有点价值。
作者: 78x    时间: 2011-5-27 13:35
俺把问题改得更直接一点,可不可以理解成这样?:
在一个小区里面,确认是中国人的,有15%是老人
在一个小区里面,确认是中国人的,有50%是男人
那么,这个小区里面出来一个老男人是中国人的最大可能性是多少?

俺的答案是最大可能性是100%
最小可能性是0%。


我有点怀疑是不是题目没有完全出清楚?因为不知道看病的总人数是多少。

如果可以把条件改成这样:
a. 来看病的人中,有15%症状表现为剧烈咳嗽的病人,最后被确诊得了肺炎
b. 来看病的人中,有50%症状表现为胸口局部剧烈刺痛的病人,最后被确诊得了肺炎
问题来了,一个人来看病,他症状表现为 剧烈咳嗽 + 胸口局部剧烈刺痛,那他有多大的可能性得的是肺炎呢?

这样的话,这个15%和50%,才和最后得肺炎的的概率能关联
作者: maomaobiao    时间: 2011-5-28 07:13
本帖最后由 maomaobiao 于 2011-5-28 07:40 编辑
我有点怀疑是不是题目没有完全出清楚?因为不知道看病的总人数是多少。
78x 发表于 2011-5-27 13:35


这就是让大家思考的地方,可能类似墙说过的,中国的教育令学生们很会解决一些有确定条件的题目,但是这里的这个问题恰好是让大家思考,什么是概率,什么是统计,这两者其实不完全一样,统计是如何对应到概率的,又是如何对未知事件有了指导意义的。

即便如此,假如题目不是开放式的,告诉你一个确切的数字,可是新来了一个病人,这就还是一个未知的问题,需要用概率来预测,但是概率总是从统计中来的。

早上刚起来,不知道有没有回答你的疑惑。

另外来看看你改过的条件和原来的条件有什么不同吧:

原来的条件
a. 来看病的人中,确诊得了肺炎的病人,有15%症状表现为剧烈咳嗽
b. 来看病的人中,确诊得了肺炎的病人,有50%症状表现为胸口局部剧烈刺痛

这里,“确诊得了肺炎的病人”,是一个值

你给的条件
a. 来看病的人中,有15%症状表现为剧烈咳嗽的病人,最后被确诊得了肺炎
b. 来看病的人中,有50%症状表现为胸口局部剧烈刺痛的病人,最后被确诊得了肺炎

而这里,“症状表现为剧烈咳嗽的病人”和“症状表现为胸口局部剧烈刺痛的病人”,是两个值。问题变得更加复杂和不确定了。希望我没有理解错你的意思。原题其实也很简单,画个大饼图取交集就好了。
作者: xphxph    时间: 2011-5-28 17:10
这题目超级好解答

咳嗽 不是肺炎  85%
胸痛 不是肺炎 50%

现在咳嗽+胸痛  不是肺炎, 概率上交 包容事件  85%X50%= 47.5%

那么咳嗽+胸痛是肺炎 1-47.5%= 52.5%
作者: xphxph    时间: 2011-5-28 17:15
实际情况是

如果医生称职大于10%的可能的传染病就要去查了。

所以这个倒霉蛋,肯定要被查出 , 要么是, 要们不是。
作者: maomaobiao    时间: 2011-5-28 17:48
这题目超级好解答

咳嗽 不是肺炎  85%
胸痛 不是肺炎 50%

现在咳嗽+胸痛  不是肺炎, 概率上交 包容事件  ...
xphxph 发表于 2011-5-28 17:10


你这个还真不对。仔细读条件吧

来看病的人中,确诊得了肺炎的病人,有15%症状表现为剧烈咳嗽

这个怎么得出  咳嗽 不是肺炎  85% ??
作者: xphxph    时间: 2011-5-28 19:11
本帖最后由 xphxph 于 2011-5-28 19:16 编辑

OK 可能算得马虎了一点

那就做逻辑运算

A:咳嗽
B: 胸痛
C:肺炎

C-- > 15% A
C-- > 50% B

原命题成立,你否命题肯定成立

非15%A-- > 非C
非 50% B-- > 非C



现在要求

同时满足 [A+B]-- 〉?% C

那可以求求看 非? %C-- > 非 [A+B]= 非A+非B- [非A+非B]

这边是集合运算。

下面把已知条件往里面代

我懒的算,哪个会数学变形的来解一下。

我估一下,这个数字不会大于65%,应该过 50%
作者: maomaobiao    时间: 2011-5-29 18:10
本帖最后由 maomaobiao 于 2011-5-29 19:11 编辑

fact is fact, fact is not logic.

But you can use logic to tell whether a fact is true or false (or you believe it is true or false).

事实就是事实,事实不是逻辑。

但是你可以应用逻辑来判断一个事实的对或错(或者你认为的对或错)

在这里,“来看病的人中,确诊得了肺炎的病人,有15%症状表现为剧烈咳嗽” 就是一个事实,你是不能对他进行逻辑运算的。恩?!

我再较个真,从这个事实,也就是统计数据,我们得到一个结论

“如果一个人被确诊得了肺炎,那么他是有15%可能性症状表现为剧烈咳嗽”

这个结论就是一个有逻辑的命题了,而且是含有概率的逻辑命题。

那么这个命题的逆否命题是什么呢?不是你说的那样,这个命题的逆否命题应该是

“如果一个人不是有15%可能性症状表现为剧烈咳嗽,那么他不能被确诊得了肺炎”

为什么这个逆否命题是废话?因为原命题是由一个事实推出的,是一个废话,所以他的逆否命题和他是等价的,也是一句废话。

"不是有15%可能性" 是不能等价于 "85%的可能性不是” 的。按说这是一个对概率误读的常见错误。"15%是" 的反面是 "不是15%是",而不是 “85%不是”

如果用英文更方便了。

“There is NOT a 15% possibility that ...”  >< "there is 85% possibility that ..."

如果我的逻辑有问题,欢迎指正。大饼图我改天画一个,很简单的,不明白你为什么不画。
作者: xphxph    时间: 2011-5-30 03:55
所以 已经改正了

你看第二个回复的

逻辑运算

不喜欢画饼的原因是因为

2个你好画, 12个你好画吗?

还是直接逻辑运算来的快。
作者: liuhaiyang    时间: 2011-6-7 11:21
这个用贝叶斯公式来解。但缺少几个条件:
这么表述:确诊肺炎是事件A,咳嗽是事件B1,疼痛是事件B2,提供的条件是
P(B1|A)=0.15
P(B2|A)=0.5
求解的是P(A|B1&B2).
根据贝叶斯公式,P(A|B1&B2)=P(B1&B2|A)*P(A)/P(B1&B2)
缺少条件,包括所有病人中确诊肺炎的概率P(A),以及所有病人中咳嗽和疼痛同时发生的概率。
作者: liuhaiyang    时间: 2011-6-7 11:26
本帖最后由 liuhaiyang 于 2011-6-7 13:14 编辑

其实我想楼主想计算的是P(B1&B2|A),语言表述是:得的是肺炎,那剧烈咳嗽 + 胸口局部剧烈刺痛的可能性。

而“剧烈咳嗽 + 胸口局部剧烈刺痛,得的是肺炎的可能性”表述就是P(A|B1&B2)。

P(A|B1&B2)和P(B1&B2|A)是不同的,用语言表述好绕啊,所以还是用数学表达简洁直观。

计算P(B1&B2|A),要考虑B1和B2是独立、互斥还是关联事件,一般会有个相关系数R。这里就可以画饼图了,结果是小于0.15。
作者: 78x    时间: 2011-6-7 11:30
回复 11# liuhaiyang
我的想法和你是一致的。没有P(A),15%和50%是么有价值的。
不知道,俺们的思路哪儿出了问题。
还是恳请斑竹公布一哈答案。
作者: liuhaiyang    时间: 2011-6-7 11:32
回复 13# 78x

有条件的公式是绝对的,缺少条件即无结果。
作者: liuhaiyang    时间: 2011-6-7 11:49
不过结果也正如LZ所说的,普通的直觉和事实往往有差距。这个时候只能依靠数学工具。
作者: 78x    时间: 2011-6-7 11:50
回复 14# liuhaiyang
看来你和我一样也是中国教育的受害者:
这就是让大家思考的地方,可能类似墙说过的,中国的教育令学生们很会解决一些有确定条件的题目,但是这里 ...
maomaobiao 发表于 2011-5-28 07:13

作者: liuhaiyang    时间: 2011-6-7 12:31
本帖最后由 liuhaiyang 于 2011-6-7 12:57 编辑
回复  liuhaiyang
看来你和我一样也是中国教育的受害者:
78x 发表于 2011-6-7 11:50



    呵呵,说不上受害者啥的吧,数学问题用语言描述,很容易就弄混了。到头来是一个问句前后调换的问题,结果大家说了半天,按照公式表述一下就一目了然。西方用一个清晰的符号系统来表述,利于数学归纳、解决和发展。

你也可能想说的是思维定式,这块我也有,所以要一直吸收大家的经验。比如我也很久没用过贝叶斯了,难得重温一下,手头的一些问题好像也多了点解法。
作者: maomaobiao    时间: 2011-6-7 16:25
本帖最后由 maomaobiao 于 2011-6-7 18:24 编辑

很久以前发的帖子,被翻出来了。很高兴有朋友愿意深入地讨论这个问题。看到"小屁孩xph"的回复时候,我就已经开始在努力回忆当时看书的思路了。这个问题原本出现在《The Drunkard's walk: how randomness rules our lives》这本书中(一下简称为“《醉汉》”),很不幸,我的那本丢在了公车上,可惜我还做了很多笔记。看来我有必要再买一本,也再次推荐给大家。至于这个帖子里提到的这个问题,我很高兴能有机会把我当时看书的思路整理出来,很多我想说的话,在大家的回复中都反映了出来,说明这个问题还是很有意思的。且听我慢慢道来:

1.《醉汉》中,这个例子出现地很早,所以它背后的科学道理相对并不复杂,原作者的目的只是要说明“即便是医生这样在西方被推崇的很有学问的职业,在对待概率问题时也会犯很简单的错误”。

2.首先,医生在日常诊断中通常会有一个“常识”性的逻辑
由:“来看病的人中,确诊得了肺炎的病人,有15%症状表现为剧烈咳嗽” 得出 “剧烈咳嗽的人,有15%的可能得了肺炎”。
这个逻辑肯定不严谨,本贴的回复中也提到了,但是原书的作者说,姑且认为医生这么判断有一定的经验依据,而这背后的逻辑(或者说经验总结)往往对于肺炎这种还算比较常见的疾病是行之有效的,作为判据的效率也是比较高的。话说到这里,其实还是怪我,当初发这个贴子故意留了一手,把这个条件省掉了。先请大家原谅我这么做,但这么做的用意在于下面的进一步讨论,事实证明我这么做是对的,否则大家也不会这么深入地讨论了,哈哈(自卖自夸了)。

3.姑且认为,医生们的第一个逻辑是成立的,那么这个题目的答案似乎就显而易见了,应该是 "一个人来看病,他症状表现为 剧烈咳嗽 + 胸口局部剧烈刺痛,那他有小于15%的可能性得的是肺炎”,这是由“来看病的人中,确诊得了肺炎的病人,有小于15%症状表现为剧烈咳嗽 + 胸口局部剧烈刺痛”,这个计算我就不多说了。到这,好戏开始了。

4.《醉汉》原书的作者提到,医生们往往会犯第二个逻辑的错误,就是进一步用他们的“常识”(或者说经验),判断"一个人来看病,他症状表现为 剧烈咳嗽 + 胸口局部剧烈刺痛,那他有大于65%(或者说较大的可能)得的是肺炎”。而这这个结论和实际情况又往往吻合,如果大家要反对这一点,那就算我的或者说原书作者,或者医生们的“常识”有问题吧。话说回来,不论医生的“常识”判断如何,也许第一个逻辑还值得商榷,但是这第二个逻辑错误却是显而易见的,也是无可回避的。是到此,原书作者的目的达到了——“即便是医生这样在西方被推崇的很有学问的职业,在对待概率问题时也会犯很简单的错误”。

5.那么,《醉汉》原书作者提到,这两个逻辑的错误的联合,是怎么得到一个常识性正确的结论的呢?他说,这就是人脑对概率的一种“思维习惯”,是一种直接的反射,而不是计算的结果。这种人脑对概率的认识,很可能在人脑的漫长的进化过程中就形成了,并不需要后天的学习和计算,就可以得到一个比较模糊的接近正确的结论。就像大家讨论的那样,如果要严格地得到一个答案,其实缺少一些条件。但是,我们在生活中作各种各样的决定和判断的时候,往往伴随大量的未知条件。而大脑实际上是综合了过去以往的“经验”,对这种包含未知条件的概率进行判断有其自己的一套方法,而这个判断的方法(类似潜意识的)目前还不为我们完全了解——但是却足够我们生存下来,规避风险。

6.所以,讨巧地说,这个题目并没有一个真正的答案。

7.我把这个例子提出来的初衷是因为,在牌桌上,很多东西的概率是一定的,比如说同花抽牌的概率,抽两头顺子的概率。但是,有很多东西又是未知的。我们很多时候都会有“直觉”,例如“我下一个大注能把他打跑”;“他的这个overbet是在诈唬”。直觉这东西,有时候并不完全离谱,特别是在建立在大量的经验的基础之上。虽然我是相信科学的,但是自读了这本书之后,我对直觉有了另外的一种解读和认识。
作者: xphxph    时间: 2011-6-7 21:30
我是来要求楼上 respect

XPHXPH, 这个英文名字,不是你理解的意思就不要乱按照你的意思乱改 OK?

BTW: 突然发现这个用户ID还可以这样理解
作者: liuhaiyang    时间: 2011-6-7 21:42
呵呵,直觉啊。我直觉觉得XPH这个名字和音乐有关。
作者: xphxph    时间: 2011-6-8 06:39
这个是俺名字的 首字母的 min raise
作者: maomaobiao    时间: 2011-6-8 06:52
呵呵,直觉啊。我直觉觉得XPH这个名字和音乐有关。
liuhaiyang 发表于 2011-6-7 21:42


我直觉你的ID和黑熊有关,哈哈哈
作者: xphxph    时间: 2011-6-8 10:15
可以申请改ID吗
我决定把ID改称 X-PHX-PH

这样应该可以了

怎么也要是 北极熊,熊掌肉多

黑熊体型小不够塞牙缝
作者: notch    时间: 2012-2-3 15:28
maomaobiao 发表于 2011-6-7 16:25
很久以前发的帖子,被翻出来了。很高兴有朋友愿意深入地讨论这个问题。看到"小屁孩xph"的回复时候,我就已 ...

最近无聊,又在挖坟

这里说的逻辑推导出咳嗽+胸痛变成<15%肺炎和直觉不符
应该是逻辑推导出问题了

按照之前的逻辑1,
满足胸痛这个条件,就有50%可能是肺炎
满足咳嗽这个条件,就有15%可能是肺炎
现在同时满足这两个条件,应该是超过50%可能是肺炎,这个就与直觉相符了

其实这里的矛盾正是假定正确的逻辑1带来的
由:“来看病的人中,确诊得了肺炎的病人,有15%症状表现为剧烈咳嗽” 得出 “剧烈咳嗽的人,有15%的可能得了肺炎”。
同“理”
由“按照概率,确诊得了肺炎的病人,有小于15%症状表现为咳嗽+胸痛”得出“症状表现为咳嗽+胸痛,有小于15%的可能得了肺炎”
逻辑1的错误在单一一个条件下还不明显,两个条件以上就很明显了

之前猫版提到上面的逆否命题应该是“如果一个人不是有15%可能性症状表现为剧烈咳嗽,那么他不能被确诊得了肺炎”
我有一个疑问:这里的前提是“一个人不是15%可能为咳嗽”,那么这一个人到底是在咳嗽还是不在咳嗽呢?
一个人是不可能“15%咳嗽,或者不是15%咳嗽”的,统计上的数字是无法具体到一个人在某一个时刻上的

来看病的人中,确诊得了肺炎的病人,有15%症状表现为剧烈咳嗽
这里已经把看病的人分成了得肺炎的和不得肺炎的,这个15%只是在得肺炎人群中的概率
要通过咳嗽来诊断肺炎,需要了解的是咳嗽在不得肺炎病人中的比例,还有得肺炎的人占总人数的比例 (类似11楼的计算)
实际情况下,咳嗽在不得肺炎病人中的比例应该远远低于15%,而得肺炎的人占总人数的比例还不小
所以医生可以通过经验来判断“剧烈咳嗽的人,有15%的可能得了肺炎”。
作者: maomaobiao    时间: 2012-2-6 08:31
notch 发表于 2012-2-3 17:28
最近无聊,又在挖坟

这里说的逻辑推导出咳嗽+胸痛变成

欢迎继续挖坑。

你的回帖中说

按照之前的逻辑1,
满足胸痛这个条件,就有50%可能是肺炎
满足咳嗽这个条件,就有15%可能是肺炎
现在同时满足这两个条件,应该是超过50%可能是肺炎


上面你说的兰字的最后一句话,有逻辑错误。

从这里开始吧。如果,你明白你这里那里错了,就转到 #18 开始。
作者: notch    时间: 2012-2-6 10:49
maomaobiao 发表于 2012-2-6 08:31
欢迎继续挖坑。

你的回帖中说

嗯,没明白错在哪里。

我的前两句话是,满足a, 50%可能得出c,满足b,15%可能得出c
这ab两个条件互相独立的,同时满足,得出c的概率肯定要比双方都大,所以得出一个>50%得到c
我的理解是相当于开两枪,开两次枪的命中概率总要比开一次的大吧?
猫版的理解是要两枪同时中,所以概率要比单一一次小?
作者: maomaobiao    时间: 2012-2-6 11:36
notch 发表于 2012-2-6 12:49
嗯,没明白错在哪里。

我的前两句话是,满足a, 50%可能得出c,满足b,15%可能得出c

我的前两句话是,满足a, 50%可能得出c,满足b,15%可能得出c
这ab两个条件互相独立的


如果是独立的,那么同时满足a 和 b 的,则是 a和b的子集,于是要比 a和b中较小的那个还要小。
作者: notch    时间: 2012-2-6 13:59
本帖最后由 notch 于 2012-2-6 14:02 编辑
maomaobiao 发表于 2012-2-6 11:36
我的前两句话是,满足a, 50%可能得出c,满足b,15%可能得出c
这ab两个条件互相独立的


其实就是开两枪分开算,还是要一起中来算的问题了
不知道怎么表达

我对“独立”的两个条件的理解是,a发生与否并且a的结果如何和b发生与否及其结果无关

就看病这个事件来看,应该是分开算比较合理吧?

另一个问题就是咳嗽人群和胸痛人群并不是同一个人群
所以应该没有办法去简单的对他们进行概率计算吧?
作者: holdemfishIV    时间: 2012-2-16 09:50
这么多人搞错,
看来我该发财。
满足一个条件的就有50%, 考虑有同时满足两个条件的, 答案是大于50%, 小于65%
作者: kerland    时间: 2012-3-26 17:47
这么多人搞错,
看来该我发财,
很多人把这个问题当成纯概率问题了,所以觉得条件不全。其实它是一道应用题,在这个特定环境下,有些条件是隐含的。那就是去医院查肺结核的人,要么咳嗽,要么胸痛,要么又咳嗽又胸痛,你要是说又不咳嗽又不胸痛的人,没症状你查什么肺结核!所以医生的经验在这里隐含着这样的条件。
那么我们来把题目和解答说的通俗易懂。100个人咳嗽,验痰,15个人确诊肺结核;100个人胸痛,去拍胸透,50个人确诊肺结核。那么有100个人又咳嗽又胸痛,医生先让他们去验痰,有15个人可以确诊肺结核;剩下的85个人医生又让他们去拍胸透,85X50%=42.5的人确诊肺结核。所以15+42.5=57.5人确诊肺结核。概率来说就是57.5,%。如果医生先让他们去拍胸透没确诊的人再验痰,答案一样100X50%+50X15%=57.5。
医院要赚钱或者说医生的经验要发挥作用,这里还可以引申出一个如何使医院达到最大ev,还是别那么黑暗了,从待查的患者的角度考虑他的ev吧。如果验痰要花10块,胸透要花50,那一个又咳嗽又胸痛的人要先查哪个才能最大化ev呢?答案是验痰。只要胸透的价格/验痰的价格>50/15,就先验痰,小于的话就先做胸透。
所以说病人如果懂概率,可以赚不少钱,oyeah。




欢迎光临 智游城 (http://zhiyoucheng.co/) Powered by Discuz! X3.2