德州扑克要素之二十:贝叶斯推断
(本文发表于2013年6月份《扑士》)
把分母展开,就得到:
上面这个公式,就是著名的贝叶斯定理。上来二话不说现来一个公式,据说不是好的写作方式。如果你患有公式恐怖症,请别害怕,我和你一样也不喜欢公式,所以我会试图用人类能听懂的语言来解释贝叶斯定理的本质是什么,以及为什么会在扑克上有如此广泛的应用。
我上大学时的概率课上,第一次接触到贝叶斯定理。它的形式很好理解,推导出来也不难,我也作了一些应用贝叶斯定理的习题。但我仍然很迷惑,这样一个把一堆A和B捣鼓来捣鼓去的定理,能有什么用呢?
举个例子来说。贝叶斯定理最普遍的应用之一是医疗检测。根据2009年的数据,美国艾滋病毒携带着大约有120万,大约是美国总人口的千分之三。现在假设有一种新的检测手段出来,它简易但很准确:如果测试者是病毒携带者,它检测为阳性的可能性达到95%;如果测试者是健康人,它检测为阳性的可能性仅有2%。
某路人甲接受这种检测,结果为阳性,那么路人甲确实是艾滋病毒携带者的概率是多少?
直觉可能会告诉我们,路人甲是病毒携带者的概率是95%或者比95%稍微小一点。你如果也这么想,就错了,但不要觉得难过,因为即使是训练有素的医生也经常犯一样的错误。
我们来看看怎么应用贝叶斯公式来解决这个问题: 事件A——该人确实是病毒携带者; 事件B——检测结果阳性;
我们要知道的就是已知B发生的情况下A的概率,也就是P(A|B)
已知的概率如下: P(A) = 0.3% 普通人群中艾滋病毒携带者概率为千分之三; P(B|A)=0.95 病毒携带者测试结果为阳性的概率95%; P(B|~A) = 0.02 健康人误诊为阳性的概率是2%。
应用贝叶斯公式,我们得到: 0.95 ×0.3% = —————————————— 0.95 ×0.3% + 0.02 × 99.7%
= 12.5%
可以看到,即使检测结果是阳性,该路人甲真是病毒携带者的概率也远远小于95%。表面上看非常准确的一项检测,其结果却可能出现大量误诊,所以必须有其他辅助检查手段才能作为可靠结果。
但是为什么我们的直觉会跟真正的结果相差这么大呢?现在我们分析一下所有的美国人口,看看到底哪里出了问题。
美国总共3亿1千多万人,为简单起见按照3亿人计算。
其中, 1百万人是艾滋病毒携带者 (0.3%的总人口) 2亿9千9百万是非携带者(99.7%的总人口)
在1百万艾滋病毒携带者中, 95万会检测出阳性 (95%准确率) 5万会检测为非阳性而漏网 (5%)
在2亿9千9百万非携带者中, 6百万会误诊为阳性 (2%误诊率) 2亿9千3百万检测为非阳性(98%)
如果全美国的人口都做这项检查,总共会有695万人检测为阳性,其中只有95万人是真正的病毒携带者提供的,剩下6百万都来自健康人。
所以我们要求的概率是95万/695万,不到15%。
从这里我们可以体会到贝叶斯公式的本质。我们已经知道,美国大街上随便一个人是艾滋病毒携带者的概率是0.3%,现在我们有了新的信息,也就是这个人检测结果为阳性。那么,根据新的信息,我们可以重新评估这个人是病毒携带者的概率,在本例中该概率从0.3%上升到了12.5%。这种根据新的信息重新评估已有概率的过程,就是贝叶斯公式的本质,因为它是个推断的过程,所以叫做贝叶斯推断(Bayesian inference)。
贝叶斯推断在扑克上的应用可以用每时每刻、无孔不入来形容。事实上,所谓读人读牌,就是贝叶斯推断的同义词。翻牌前在作出任何动作前,我们认为某玩家的牌是纯随机牌,现在他在前位加注,我们就可以缩小他的范围到top 20%;如果他再加注前位紧手玩家的加注,我们可以缩小他的范围到top 5%。翻牌KQ3,对方下注,他加注,我们就可以推断他有AA/KK/QQ/AK的概率上升,而有JJ/TT的概率下降。这样的过程,其实正是贝叶斯推断:我们不断得根据新的信息来调整他底牌的概率。
然而,有些时候贝叶斯推断的应用并不是那么直接和简单,这时候,能应用正确的公式去严格推理就有很大作用。
比如,我们在扑克桌上,观测到某刚上桌的陌生人坐在枪口+2的位置,加注6BB开锅,其他人都弃牌。第二手牌他在枪口+1又用6BB开锅,所有人又都弃牌。第三手牌他在枪口仍然用6BB开锅。
遇到这种情况,很多人会说,我信你一次两次可以,你连续三次都这么干,我决不能再信你,你是疯子,我要反击。
我们用贝叶斯推断来看看这人是疯子的概率到底多大。先定义什么是疯子。我们可以把扑克玩家分为大概两类:正常人和疯子。正常人会用大约top 25%的牌在前位加注,而疯子会80%加注每一手牌。根据我们的日常观察,疯子在所有玩家中的比例大约是5%。
现在他连续三手在前位加注,如果是正常人,连续3手恰好都是好牌的概率是: 25%×25%×25%=1.56%
而一个疯子,连续三手加注的概率是: 80%×80%×80% = 51.2%
我们来给事件定义一下: A——他是疯子 B——观察到他连续三手加注
我们想知道的概率是P(A|B),也就是已经观察到连续三手前位加注的前提下,他是疯子的概率。
我们已知的概率如下: P(A) = 5% 一个随机玩家是疯子的概率是5%; P(B|A) = 51.2% 疯子连续三手前位加注的概率51.2% P(B|~A) = 1.56% 正常玩家连续三手前位加注的概率1.56%
根据贝叶斯公式, 51.2% ×5% = —————————————— 51.2%×5% + 1.56%×95%
= 63.3%
可见,仅仅观察该玩家打了三手牌,确实可以把他是疯子的概率从5%提高到63%!我们在这件事上的直觉是基本准确的。
当然,上面举的这个例子有很大的简化。现实中,玩家不仅仅只有疯子和正常这两类,而是有非常保守、保守、正常、偏松、很松、疯子等等很多类。而且,我们列举的一些假设,也未必符合实际,比如疯子占所有玩家的5%。在某些特定场合,比如home game,疯子可以达到20%;在其他的时候,你可以根据他的穿着打扮、言谈举止进一步推断他是疯子的概率。
而且,也要小心某些玩家故意迷惑对手,可能刚坐下的前两手牌严重偏离自己的风格,给对手一个迷惑的印象,从而获利。
但即使有种种限制和不足,贝叶斯推断仍然是了解扑克本质的一个有力武器,恰到好处得应用已有信息,既不过分推理,也不浪费,才能最大化信息带来的价值。扑克水平的核心就是收集、分析、应用信息的能力,而贝叶斯推断就是应用信息能力的关键所在。
|