智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 10193|回复: 22
打印 上一主题 下一主题

试简明阐释贝叶斯定理在扑克中的应用(上)

[复制链接]
跳转到指定楼层
1#
lililili11 发表于 2015-6-21 19:36:54 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 lililili11 于 2015-6-21 19:39 编辑

有这么一个公式P(A|B)=P(B|A)*P(A)/P(B),它叫做贝叶斯公式,其背后的定理叫做贝叶斯定理。据说在我们打扑克的时候,掌握它,可以产生很大的作用。

我最初见到Phil Galfond的一篇采访,他表示自己主要的两大优势在于擅长演绎逻辑和贝叶斯定理。于是我百度了一下这个已经快要忘光的公式,但是还是不知道如何能对自己产生帮助。

然后又看到了ED.Miller的一篇文章《如何在德州扑克中读牌》,其中对贝叶斯定理大篇幅地加以介绍。于是我照葫芦画瓢,用这个公式试着求解了一两个扑克中遇到的问题,但是仍然不知道具体实战中应该如何应用它。

后来我又看到了城里Howard兄《扑克要素二十:贝叶斯推断》,再次对贝叶斯定理加以阐释,于是我又学习了一次,虽然还是没能明白怎么在扑克实战中把它运用起来,但是了解到了一点:贝叶斯它是一个“推断”,主要是一个推理过程。

最后我看到了城里pongba兄的《数学之美番外篇:平凡而又神奇的贝叶斯方法》,终于开始有点明白,贝叶斯定理本身不是关键,关键的是它背后深刻的思想和思维法则。(当然这篇文章太深奥,又是关于计算机科学的,我基本上没看懂)

所以这是我个人对贝叶斯定理认识的一个深化的过程:公式→定理→推断→方法→思想。

现在我认识到,贝叶斯定理的本质其实就是一种概率推理,要把它应用到扑克中,关键就是掌握这种思想,学着按照这种思维法则去进行推理,而不是死板地记公式。我想,除非是对这个公式掌握程度非常娴熟,能够瞬间地做出大量的各种假设+计算的数学天才,我们正常人可能在打牌的时候并不需要严格地记住这个公式,然后按照这个公式来寻找各种条件,最后代入计算,并加以求解。因为这对我们正常人来说可能不太现实,一个是计算量太大太复杂,二个是每次决策的时候时间限制很严苛,现场基本上平均半分钟以内就要做决定,网络10秒钟就要做决定,如果是多桌的话,决策时间就只有1秒钟,在这么紧迫的时间里,根本不容许我们慢条斯理地去进行数学计算。

更不用说,如果因为做这些计算而露出timing tell,那么更加是得不偿失。

所以按照目前我对贝叶斯定理的理解,我觉得把它的公式忘记也无妨。当然,由于对其有了一定的理解,基本上也没办法忘干净。总之就是不必时时刻刻想着去拿这个公式代入计算。

既然反正都要忘,所以我们其实也不是一定要懂这个定理本身,我在这里就是想要尝试一下,看能不能简单地把这个定理的思想在扑克中如何应用,给阐释清楚,让我们不用去了解定理本身,也不用去记公式,就能对我们的扑克思维有所帮助。

我认为,关键词其实就是两个:
1、 评估
2、 修正

什么叫评估?举个简单的例子:某个对手坐下来不久,一共10手牌他玩了6手,其中preflop 3bet别人两次,一次直接拿下底池,另一次cbet 拿下底池。那么我们对他的评估就是“比较松,比较凶”。而另一个对手坐下来不久,一共10手牌他都直接弃牌,那么我们对他的评估可能就是“比较紧”。

什么叫修正?前面那个我们一开始认为是比较松凶的选手,后面一路弃牌,这也不玩那也不玩,那么我们就开始逐渐修正对他的认识,他每弃牌一次,在我们心目中的印象就开始紧了一分。而后面那个我们一开始认为是比较紧的选手,后面忽然开始有很多动作,频繁收锅,那么我们就开始逐渐修正对他的认识,他每参与一次锅,在我们心目中的印象就开始松了一分。

所谓的贝叶斯定理,其实就是要求我们做评估,而且把这些评估量化成具体的数字,然后每当新状况发生的时候,就把这些数字代入那个贝叶斯公式来进行计算,最后得出一系列新的数字。所以其实就是一个“评估出具体数字,然后每当出现一次情况的时候,就把这些数字按照公式加以修正,得出新的更加准确的数字”这么一个过程。

计算机的“机器学习”其实也是这样一个过程,所以我们不妨在这里就把“评估+修正”的过程称为“机器学习”的过程。
那么我们打牌的时候按照这样一个过程来打,就行了吗?那我们人脑岂不是不如电脑更适合打扑克了?在修正的过程中,电脑可以做出精确的计算,而我们由于计算力有限,只能做出模糊的判断,这样岂不是非常吃亏?

请听我说,这里有两个方面:
1、 这种“机器学习”的过程,非常值得我们去借鉴
2、 但是扑克远远不止“机器学习”这么简单,所以光靠“机器学习”是不够的。

也就是说,在扑克中,贝叶斯定理背后蕴含的思想在很多地方对我们能有所帮助,但是它又有局限性,所以更深的地方,它就用不上了。
先看它值得我们学习的地方:评估+修正的这么一种模式,非常稳,非常靠谱。

举个我自己的例子,刚学扑克的时候,有一次睡醒以后直接开电脑打牌,刚上桌第一次进锅,我在MPAQ openBTN 3bet,我callFlop 853rBTN cbet,我check-raiseBTN callTurn J,我all in,对手call,亮出KK

那时候我刚学扑克,也不会分析range,也不会做EV计算,也不懂用什么软件,反正就是觉得我上桌第一手牌你就搞我?你什么意思?你就一定有牌?我就看看能不能打跑你。然后就输了一个buyin,然后我就关掉了电脑。

这件事情其实有两个原因,一个是生理方面的,刚起床,人的大脑和生理各方面都处于一个比较低级的状态,容易生气,冲动等等。另一个原因是更加本质的原因:就是因为我不懂这种情况应该怎样评价,正是因为不知道怎样评价这样的情况,所以就会焦虑,就会冲动,就会乱来。

现在我们打得熟练以后,知道不要乱来,先忍一忍,等一等,观察观察,等熟悉了桌上的情况以后再做决定。但是我们真的知道如何评价这样的情况了吗?不一定,有的人可能只是懂得了克制自己的冲动,知道谋定而后动,只是找到了方法,却不知道其中的原理,仍然并没有清楚地知道如何评价这样的情况。

我们第一次被人3bet,第一次被人在flop raise,第一次被人在turn raise,第一次被人在river raise,或者被人连续两次、三次、四次、五次不断地3bet或者raise,我们究竟应该如何去认识,如何去评价这样的情况呢?光“忍”就够了吗?

真正的问题是:这样的“忍”究竟能不能保证我们赚钱呢?我们“忍”了就一定能赚钱吗?忍到什么时候是个头呢?

当然大家会说,我们要读人啊,读牌啊,看history啊,看table dynamic啊,看gameflow啊,没错,这些是我们在第二方面要讲的,人类超越“机器学习”的部分。这里我们首先看看,能不能运用贝叶斯定理的思想,来用一种比较“科学”的方法,对这样的情况进行认知和评价。

于是我们遇到这样的情况,就需要有自己的评估和修正。首先在遇到这样的动作之前,就得有自己的评估。譬如我这个例子,第一手牌就被3bet了,对对手没有任何认识,如何评估?那就只能认为他是这个game type,这个limit的平均类型的对手。这样一种平均类型的对手有多少可能是在操作,有多少可能是nit。如果他是在操作,他的range应该是什么样的,如果他是nit,他的range应该是什么样的。现在发生了这么一个3bet的状况,我们就要对默认的数据加以一定程度的修正,最后得到一个新的数值——最后根据这个数值来决定我们AQ要不要弃牌,还是跟注,或者决定反操作对手。

类似的,当我们被人第二次、第三次、第四次、第五次操作的时候,经过不断的一次又一次的修正,得到新的数值,我们每次都可以根据这个数值来做出回应。这就是数学的思想赋予我们的“底气”,让我们不至于在不确定性面前茫然无措,要么冲动地失去一切,要么优柔寡断坐失良机。

以上是第一个方面:“机器学习”值得我们学习的地方。
下一篇大概会比较一下“机器学习”和“使用HUD数据”的异同,以及简单阐明我自己对超越“机器学习”部分的扑克内容的理解。

---------------------------------------------------------------------------------------------------------------------------------------------------------
以上是我对贝叶斯定理、机器学习等方面的一点粗浅的理解,不排除很多想当然的地方。仅仅是抛砖引玉,目的是希望能引得大家的讨论和高人的指点,以求进一步的收获,还请大家不吝赐教。

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏1
2#
maomaobiao 发表于 2015-6-21 20:45:41 | 只看该作者
好文,顶起来。

关于人脑和学习归纳的方面,最近TED演讲有一个讲两岁的baby就可以generalize和逻辑演绎,而且是建立在极少的“数据”基础之上的,实验非常震撼。也说明人脑不是像机器一样用“大数据”来演绎逻辑,这种类似本能的东西,在扑克中的应用与表现肯定也是屡见不鲜的。

lz的这些理解非常接近本质的东西,因为我们都是希望用最少的数据做最多的判断。期待下文。
3#
leisong 发表于 2015-6-21 23:20:20 来自手机 | 只看该作者
板凳,严重期待下文,还是这个适用简洁
4#
 楼主| lililili11 发表于 2015-6-22 19:47:57 | 只看该作者
maomaobiao 发表于 2015-6-21 20:45
好文,顶起来。

关于人脑和学习归纳的方面,最近TED演讲有一个讲两岁的baby就可以generalize和逻辑演绎, ...

对这个演讲非常感兴趣啊,请问名字叫什么?
5#
maomaobiao 发表于 2015-6-23 05:04:37 | 只看该作者
http://youtu.be/y1KIVZw7Jxk

或者google,TED baby logic
6#
 楼主| lililili11 发表于 2015-6-23 13:47:36 | 只看该作者
maomaobiao 发表于 2015-6-23 05:04
http://youtu.be/y1KIVZw7Jxk

或者google,TED baby logic

看完了,非常有启发性的研究。在视频里看到一本书名,卡尼曼的《不确定性条件下的判断:启发式与偏见》,以前就列在我的书单里,但是不知道什么时候才能有时间去看...

我觉得不管是贝叶斯式的归纳/概括,还是因果推理,根本性都在于对因果关系的研究。
似乎人类的大脑天然地就懂得并且喜欢去分析因果关系,或者说,人类的大脑就是在上百万年的自然选择下,发展出了适应并且研究现实世界中的各种因果律的这么一种思维规律。
而逻辑学则是把这种思维规律给整合出来,并且加以研究。

另外,我觉得人类之所以好赌,本质上就是对“不确定性”的着迷。
因为它是不能简单地用因果律去判断的,所以是人类大脑暂时无法理解的,因此人类大脑就会天然地对这种情况着迷,试图去破解其中的原理。
我想这就是我们喜欢打扑克的根本原因之一。

关于“大数据”,我觉得是数据够多以后,就可以暴力式地直接找到想要找的东西,而不需要非常精巧细腻的推理。
7#
 楼主| lililili11 发表于 2015-6-23 14:00:37 | 只看该作者
佛家的“因”、“缘”、“果”的区别和联系,道家的“命”和“运”的区别,其实都是对因果关系和不确定性的思考,其实也是一种朴素的归纳和概括。
8#
maomaobiao 发表于 2015-6-23 14:37:25 | 只看该作者
lililili11 发表于 2015-6-23 15:47
看完了,非常有启发性的研究。在视频里看到一本书名,卡尼曼的《不确定性条件下的判断:启发式与偏见》, ...

这种对痴迷扑克的解释很有意思。

你的书单列一个,启发一下我吧。
9#
 楼主| lililili11 发表于 2015-6-23 15:05:36 | 只看该作者
maomaobiao 发表于 2015-6-23 14:37
这种对痴迷扑克的解释很有意思。

你的书单列一个,启发一下我吧。

都是些很杂的东西,严格说来,并不是一定会去看,只是有看的意向。比如《时间简史》《少有人走的路》《自控力》《反脆弱》《津巴多时间心理学》《政治的人生》《思想录》《荣枯鉴》《道德经》
甚至资本论、国富论、康德三大批判都有点兴趣,奈何一个是没有时间,二个也沉不下来,更重要的是得谋生...
10#
Y@ngL 发表于 2015-6-23 15:06:20 | 只看该作者
这东西说白了,就是剥削式打法,就是充分利用已经获取的信息,对对手进行分析,并利用其漏洞进行剥削!

《扑克数学》有一点关于这方面的介绍!
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-12-25 09:51 , Processed in 0.047678 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部