智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 15459|回复: 14
打印 上一主题 下一主题

德州扑克要素之二十:贝叶斯推断

[复制链接]
跳转到指定楼层
1#
Howard 发表于 2013-12-24 00:50:50 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
德州扑克要素之二十:贝叶斯推断


(本文发表于2013年6月份《扑士》)
把分母展开,就得到:

上面这个公式,就是著名的贝叶斯定理。上来二话不说现来一个公式,据说不是好的写作方式。如果你患有公式恐怖症,请别害怕,我和你一样也不喜欢公式,所以我会试图用人类能听懂的语言来解释贝叶斯定理的本质是什么,以及为什么会在扑克上有如此广泛的应用。

我上大学时的概率课上,第一次接触到贝叶斯定理。它的形式很好理解,推导出来也不难,我也作了一些应用贝叶斯定理的习题。但我仍然很迷惑,这样一个把一堆A和B捣鼓来捣鼓去的定理,能有什么用呢?

举个例子来说。贝叶斯定理最普遍的应用之一是医疗检测。根据2009年的数据,美国艾滋病毒携带着大约有120万,大约是美国总人口的千分之三。现在假设有一种新的检测手段出来,它简易但很准确:如果测试者是病毒携带者,它检测为阳性的可能性达到95%;如果测试者是健康人,它检测为阳性的可能性仅有2%。

某路人甲接受这种检测,结果为阳性,那么路人甲确实是艾滋病毒携带者的概率是多少?

直觉可能会告诉我们,路人甲是病毒携带者的概率是95%或者比95%稍微小一点。你如果也这么想,就错了,但不要觉得难过,因为即使是训练有素的医生也经常犯一样的错误。

我们来看看怎么应用贝叶斯公式来解决这个问题:
事件A——该人确实是病毒携带者;
事件B——检测结果阳性;

我们要知道的就是已知B发生的情况下A的概率,也就是P(A|B)

已知的概率如下:
P(A) = 0.3%  普通人群中艾滋病毒携带者概率为千分之三;
P(B|A)=0.95 病毒携带者测试结果为阳性的概率95%;
P(B|~A) = 0.02 健康人误诊为阳性的概率是2%。

应用贝叶斯公式,我们得到:
      0.95 ×0.3%
= ——————————————
      0.95 ×0.3% + 0.02 × 99.7%

= 12.5%

可以看到,即使检测结果是阳性,该路人甲真是病毒携带者的概率也远远小于95%。表面上看非常准确的一项检测,其结果却可能出现大量误诊,所以必须有其他辅助检查手段才能作为可靠结果。

但是为什么我们的直觉会跟真正的结果相差这么大呢?现在我们分析一下所有的美国人口,看看到底哪里出了问题。

美国总共3亿1千多万人,为简单起见按照3亿人计算。

其中,
1百万人是艾滋病毒携带者 (0.3%的总人口)
2亿9千9百万是非携带者(99.7%的总人口)

在1百万艾滋病毒携带者中,
95万会检测出阳性 (95%准确率)
5万会检测为非阳性而漏网 (5%)

在2亿9千9百万非携带者中,
6百万会误诊为阳性 (2%误诊率)
2亿9千3百万检测为非阳性(98%)

如果全美国的人口都做这项检查,总共会有695万人检测为阳性,其中只有95万人是真正的病毒携带者提供的,剩下6百万都来自健康人。

所以我们要求的概率是95万/695万,不到15%。

从这里我们可以体会到贝叶斯公式的本质。我们已经知道,美国大街上随便一个人是艾滋病毒携带者的概率是0.3%,现在我们有了新的信息,也就是这个人检测结果为阳性。那么,根据新的信息,我们可以重新评估这个人是病毒携带者的概率,在本例中该概率从0.3%上升到了12.5%。这种根据新的信息重新评估已有概率的过程,就是贝叶斯公式的本质,因为它是个推断的过程,所以叫做贝叶斯推断(Bayesian inference)。

贝叶斯推断在扑克上的应用可以用每时每刻、无孔不入来形容。事实上,所谓读人读牌,就是贝叶斯推断的同义词。翻牌前在作出任何动作前,我们认为某玩家的牌是纯随机牌,现在他在前位加注,我们就可以缩小他的范围到top 20%;如果他再加注前位紧手玩家的加注,我们可以缩小他的范围到top 5%。翻牌KQ3,对方下注,他加注,我们就可以推断他有AA/KK/QQ/AK的概率上升,而有JJ/TT的概率下降。这样的过程,其实正是贝叶斯推断:我们不断得根据新的信息来调整他底牌的概率。

然而,有些时候贝叶斯推断的应用并不是那么直接和简单,这时候,能应用正确的公式去严格推理就有很大作用。

比如,我们在扑克桌上,观测到某刚上桌的陌生人坐在枪口+2的位置,加注6BB开锅,其他人都弃牌。第二手牌他在枪口+1又用6BB开锅,所有人又都弃牌。第三手牌他在枪口仍然用6BB开锅。

遇到这种情况,很多人会说,我信你一次两次可以,你连续三次都这么干,我决不能再信你,你是疯子,我要反击。

我们用贝叶斯推断来看看这人是疯子的概率到底多大。先定义什么是疯子。我们可以把扑克玩家分为大概两类:正常人和疯子。正常人会用大约top 25%的牌在前位加注,而疯子会80%加注每一手牌。根据我们的日常观察,疯子在所有玩家中的比例大约是5%。

现在他连续三手在前位加注,如果是正常人,连续3手恰好都是好牌的概率是:
25%×25%×25%=1.56%

而一个疯子,连续三手加注的概率是:
80%×80%×80% = 51.2%

我们来给事件定义一下:
A——他是疯子
B——观察到他连续三手加注

我们想知道的概率是P(A|B),也就是已经观察到连续三手前位加注的前提下,他是疯子的概率。

我们已知的概率如下:
P(A) = 5%  一个随机玩家是疯子的概率是5%;
P(B|A) = 51.2% 疯子连续三手前位加注的概率51.2%
P(B|~A) = 1.56% 正常玩家连续三手前位加注的概率1.56%

根据贝叶斯公式,
      51.2% ×5%
= ——————————————
      51.2%×5% + 1.56%×95%

= 63.3%

可见,仅仅观察该玩家打了三手牌,确实可以把他是疯子的概率从5%提高到63%!我们在这件事上的直觉是基本准确的。

当然,上面举的这个例子有很大的简化。现实中,玩家不仅仅只有疯子和正常这两类,而是有非常保守、保守、正常、偏松、很松、疯子等等很多类。而且,我们列举的一些假设,也未必符合实际,比如疯子占所有玩家的5%。在某些特定场合,比如home game,疯子可以达到20%;在其他的时候,你可以根据他的穿着打扮、言谈举止进一步推断他是疯子的概率。

而且,也要小心某些玩家故意迷惑对手,可能刚坐下的前两手牌严重偏离自己的风格,给对手一个迷惑的印象,从而获利。

但即使有种种限制和不足,贝叶斯推断仍然是了解扑克本质的一个有力武器,恰到好处得应用已有信息,既不过分推理,也不浪费,才能最大化信息带来的价值。扑克水平的核心就是收集、分析、应用信息的能力,而贝叶斯推断就是应用信息能力的关键所在。



分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏6
2#
maomaobiao 发表于 2013-12-24 03:14:57 | 只看该作者
这个好!

恰到好处得应用已有信息,既不过分推理,也不浪费,才能最大化信息带来的价值。扑克水平的核心就是收集、分析、应用信息的能力,而贝叶斯推断就是应用信息能力的关键所在。
3#
Tamarin 发表于 2013-12-25 01:15:41 | 只看该作者
maomaobiao 发表于 2013-12-24 03:14
这个好!

恰到好处得应用已有信息,既不过分推理,也不浪费,才能最大化信息带来的价值。扑克水平的核心就 ...

原来平时看似简单的思考也可以用数学模型来解释
4#
老陈 发表于 2014-1-2 03:31:20 | 只看该作者
本帖最后由 老陈 于 2014-1-1 17:32 编辑

贝叶斯定理很好,为了以后熟练应用,先做作业。

有人知道蒙古包吗?
我知道的蒙古包是牧羊人居住的地方,是用毡子代替帆布做成的帐篷。
在人民公社时代的蒙古包住3人,一个是达拉嘎(蒙语,翻译成汉语是领导的意思),一是放羊的,一是打柴做饭的,还有2-3条狗,出了放羊和做饭以外的事都归达拉嘎管,包括外交、安全等等,总之机构非常简单,不像国务院设那么多部委。夏季10多天就般一次家,冬季不搬家。

书归正传:
过去5年里狼夜里袭击该蒙古包20次,有18次狗叫了,2次狗没叫。
过去5年里狗夜里叫了300次。
问:昨夜狗叫了,达拉嘎判断狼来了的概率是多大?

设:事件A为狼来了,事件B为狗叫

P(A)=20/5/365
P(B)=300/5/365
P(B|A)=18/20
代入Bayes公式:
P(A|B)=P(B|A)*P(A)/P(B)=(18/20)*(20/5/365)/(300/5/365)=6/100

本来狼来的频率大概是一个季度一次,因为狗叫了,所以达拉嘎把狼来了概率提高到6/100。





5#
xxxxx 发表于 2014-3-7 12:59:29 | 只看该作者
太强大了,逻辑很严谨,推理精辟,需要再次仔细阅读,理解
6#
伟大的墙 发表于 2015-6-22 01:53:24 | 只看该作者
这是啥东西
7#
昆仑苍狼 发表于 2015-6-22 08:38:25 | 只看该作者
然而这。。。。。。
8#
伟大的墙 发表于 2015-6-22 19:48:24 | 只看该作者
一个家伙只要有人struddle丫就干道100,连续两次,我暗下决心,第三次就抓丫现行。第三次有人struddle我来55,先靠,到这小子又干100,我挥手700全进丫靠,AA
9#
muyir 发表于 2015-6-22 20:45:14 | 只看该作者
大师说,你打法正确,只是不幸遭遇cooler
10#
taiji18 发表于 2015-6-22 21:44:22 | 只看该作者
伟大的墙 发表于 2015-6-22 19:48
一个家伙只要有人struddle丫就干道100,连续两次,我暗下决心,第三次就抓丫现行。第三次有人struddle我来5 ...

疯狂的桌子,100/100,起buy500bb,翻前各种3bet,4bet,这时,一人limp 3bet ,我33 4bet 190bb allin,对方秒靠,AA,然后,turn3。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-12-26 09:25 , Processed in 0.053271 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部