智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 9999|回复: 22
打印 上一主题 下一主题

试简明阐释贝叶斯定理在扑克中的应用(上)

[复制链接]
跳转到指定楼层
1#
lililili11 发表于 2015-6-21 19:36:54 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
本帖最后由 lililili11 于 2015-6-21 19:39 编辑

有这么一个公式P(A|B)=P(B|A)*P(A)/P(B),它叫做贝叶斯公式,其背后的定理叫做贝叶斯定理。据说在我们打扑克的时候,掌握它,可以产生很大的作用。

我最初见到Phil Galfond的一篇采访,他表示自己主要的两大优势在于擅长演绎逻辑和贝叶斯定理。于是我百度了一下这个已经快要忘光的公式,但是还是不知道如何能对自己产生帮助。

然后又看到了ED.Miller的一篇文章《如何在德州扑克中读牌》,其中对贝叶斯定理大篇幅地加以介绍。于是我照葫芦画瓢,用这个公式试着求解了一两个扑克中遇到的问题,但是仍然不知道具体实战中应该如何应用它。

后来我又看到了城里Howard兄《扑克要素二十:贝叶斯推断》,再次对贝叶斯定理加以阐释,于是我又学习了一次,虽然还是没能明白怎么在扑克实战中把它运用起来,但是了解到了一点:贝叶斯它是一个“推断”,主要是一个推理过程。

最后我看到了城里pongba兄的《数学之美番外篇:平凡而又神奇的贝叶斯方法》,终于开始有点明白,贝叶斯定理本身不是关键,关键的是它背后深刻的思想和思维法则。(当然这篇文章太深奥,又是关于计算机科学的,我基本上没看懂)

所以这是我个人对贝叶斯定理认识的一个深化的过程:公式→定理→推断→方法→思想。

现在我认识到,贝叶斯定理的本质其实就是一种概率推理,要把它应用到扑克中,关键就是掌握这种思想,学着按照这种思维法则去进行推理,而不是死板地记公式。我想,除非是对这个公式掌握程度非常娴熟,能够瞬间地做出大量的各种假设+计算的数学天才,我们正常人可能在打牌的时候并不需要严格地记住这个公式,然后按照这个公式来寻找各种条件,最后代入计算,并加以求解。因为这对我们正常人来说可能不太现实,一个是计算量太大太复杂,二个是每次决策的时候时间限制很严苛,现场基本上平均半分钟以内就要做决定,网络10秒钟就要做决定,如果是多桌的话,决策时间就只有1秒钟,在这么紧迫的时间里,根本不容许我们慢条斯理地去进行数学计算。

更不用说,如果因为做这些计算而露出timing tell,那么更加是得不偿失。

所以按照目前我对贝叶斯定理的理解,我觉得把它的公式忘记也无妨。当然,由于对其有了一定的理解,基本上也没办法忘干净。总之就是不必时时刻刻想着去拿这个公式代入计算。

既然反正都要忘,所以我们其实也不是一定要懂这个定理本身,我在这里就是想要尝试一下,看能不能简单地把这个定理的思想在扑克中如何应用,给阐释清楚,让我们不用去了解定理本身,也不用去记公式,就能对我们的扑克思维有所帮助。

我认为,关键词其实就是两个:
1、 评估
2、 修正

什么叫评估?举个简单的例子:某个对手坐下来不久,一共10手牌他玩了6手,其中preflop 3bet别人两次,一次直接拿下底池,另一次cbet 拿下底池。那么我们对他的评估就是“比较松,比较凶”。而另一个对手坐下来不久,一共10手牌他都直接弃牌,那么我们对他的评估可能就是“比较紧”。

什么叫修正?前面那个我们一开始认为是比较松凶的选手,后面一路弃牌,这也不玩那也不玩,那么我们就开始逐渐修正对他的认识,他每弃牌一次,在我们心目中的印象就开始紧了一分。而后面那个我们一开始认为是比较紧的选手,后面忽然开始有很多动作,频繁收锅,那么我们就开始逐渐修正对他的认识,他每参与一次锅,在我们心目中的印象就开始松了一分。

所谓的贝叶斯定理,其实就是要求我们做评估,而且把这些评估量化成具体的数字,然后每当新状况发生的时候,就把这些数字代入那个贝叶斯公式来进行计算,最后得出一系列新的数字。所以其实就是一个“评估出具体数字,然后每当出现一次情况的时候,就把这些数字按照公式加以修正,得出新的更加准确的数字”这么一个过程。

计算机的“机器学习”其实也是这样一个过程,所以我们不妨在这里就把“评估+修正”的过程称为“机器学习”的过程。
那么我们打牌的时候按照这样一个过程来打,就行了吗?那我们人脑岂不是不如电脑更适合打扑克了?在修正的过程中,电脑可以做出精确的计算,而我们由于计算力有限,只能做出模糊的判断,这样岂不是非常吃亏?

请听我说,这里有两个方面:
1、 这种“机器学习”的过程,非常值得我们去借鉴
2、 但是扑克远远不止“机器学习”这么简单,所以光靠“机器学习”是不够的。

也就是说,在扑克中,贝叶斯定理背后蕴含的思想在很多地方对我们能有所帮助,但是它又有局限性,所以更深的地方,它就用不上了。
先看它值得我们学习的地方:评估+修正的这么一种模式,非常稳,非常靠谱。

举个我自己的例子,刚学扑克的时候,有一次睡醒以后直接开电脑打牌,刚上桌第一次进锅,我在MPAQ openBTN 3bet,我callFlop 853rBTN cbet,我check-raiseBTN callTurn J,我all in,对手call,亮出KK

那时候我刚学扑克,也不会分析range,也不会做EV计算,也不懂用什么软件,反正就是觉得我上桌第一手牌你就搞我?你什么意思?你就一定有牌?我就看看能不能打跑你。然后就输了一个buyin,然后我就关掉了电脑。

这件事情其实有两个原因,一个是生理方面的,刚起床,人的大脑和生理各方面都处于一个比较低级的状态,容易生气,冲动等等。另一个原因是更加本质的原因:就是因为我不懂这种情况应该怎样评价,正是因为不知道怎样评价这样的情况,所以就会焦虑,就会冲动,就会乱来。

现在我们打得熟练以后,知道不要乱来,先忍一忍,等一等,观察观察,等熟悉了桌上的情况以后再做决定。但是我们真的知道如何评价这样的情况了吗?不一定,有的人可能只是懂得了克制自己的冲动,知道谋定而后动,只是找到了方法,却不知道其中的原理,仍然并没有清楚地知道如何评价这样的情况。

我们第一次被人3bet,第一次被人在flop raise,第一次被人在turn raise,第一次被人在river raise,或者被人连续两次、三次、四次、五次不断地3bet或者raise,我们究竟应该如何去认识,如何去评价这样的情况呢?光“忍”就够了吗?

真正的问题是:这样的“忍”究竟能不能保证我们赚钱呢?我们“忍”了就一定能赚钱吗?忍到什么时候是个头呢?

当然大家会说,我们要读人啊,读牌啊,看history啊,看table dynamic啊,看gameflow啊,没错,这些是我们在第二方面要讲的,人类超越“机器学习”的部分。这里我们首先看看,能不能运用贝叶斯定理的思想,来用一种比较“科学”的方法,对这样的情况进行认知和评价。

于是我们遇到这样的情况,就需要有自己的评估和修正。首先在遇到这样的动作之前,就得有自己的评估。譬如我这个例子,第一手牌就被3bet了,对对手没有任何认识,如何评估?那就只能认为他是这个game type,这个limit的平均类型的对手。这样一种平均类型的对手有多少可能是在操作,有多少可能是nit。如果他是在操作,他的range应该是什么样的,如果他是nit,他的range应该是什么样的。现在发生了这么一个3bet的状况,我们就要对默认的数据加以一定程度的修正,最后得到一个新的数值——最后根据这个数值来决定我们AQ要不要弃牌,还是跟注,或者决定反操作对手。

类似的,当我们被人第二次、第三次、第四次、第五次操作的时候,经过不断的一次又一次的修正,得到新的数值,我们每次都可以根据这个数值来做出回应。这就是数学的思想赋予我们的“底气”,让我们不至于在不确定性面前茫然无措,要么冲动地失去一切,要么优柔寡断坐失良机。

以上是第一个方面:“机器学习”值得我们学习的地方。
下一篇大概会比较一下“机器学习”和“使用HUD数据”的异同,以及简单阐明我自己对超越“机器学习”部分的扑克内容的理解。

---------------------------------------------------------------------------------------------------------------------------------------------------------
以上是我对贝叶斯定理、机器学习等方面的一点粗浅的理解,不排除很多想当然的地方。仅仅是抛砖引玉,目的是希望能引得大家的讨论和高人的指点,以求进一步的收获,还请大家不吝赐教。

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏1
20#
大道初现 发表于 2022-7-1 21:19:05 | 只看该作者
lililili11 发表于 2015-6-23 15:05
都是些很杂的东西,严格说来,并不是一定会去看,只是有看的意向。比如《时间简史》《少有人走的路》《自 ...

都是好书 收录收录
19#
Optimization 发表于 2022-6-25 11:17:29 | 只看该作者
虽然应该不是老蔺所要表达的,但还是推荐老蔺看一下Bayesian game
18#
panduidui123 发表于 2022-6-25 05:51:48 | 只看该作者
lililili11 发表于 2015-6-23 15:05
都是些很杂的东西,严格说来,并不是一定会去看,只是有看的意向。比如《时间简史》《少有人走的路》《自 ...

哲学很重要,但是在当今物欲横流年代,poker就像走独木桥,很小众,探索在探索,在这个本质负ev厉害的游戏,赢得一点利润,
17#
panduidui123 发表于 2022-6-25 05:45:16 | 只看该作者
poker游离于小概率之间,很多时候是心理对决,数学无法完成,
16#
东南西北 发表于 2020-11-24 04:03:08 | 只看该作者
lililili11 发表于 2020-10-29 01:12
几年后重新来阐释贝叶斯定理在扑克中的应用的话,我会这样说:贝叶斯定理为快速给对手完成【合理】的定位提 ...

赞一个
15#
 楼主| lililili11 发表于 2020-10-29 01:12:39 来自手机 | 只看该作者
几年后重新来阐释贝叶斯定理在扑克中的应用的话,我会这样说:贝叶斯定理为快速给对手完成【合理】的定位提供了一个量化的方法。快速定位谁都会,比如“limp都是鱼”“松就一定会偷”“紧就都是强牌”连偷我两次了,下次我一定要加回去”等等。问题是这种感性的快速定位,其实是不合理的。太冒失了。要得出更加温和/合理的结论,需要有一个方法,贝叶斯定理就是这样一个方法。在实践中,我们可以将对手摆在一个频谱上,根据自己的经验,设定对手的初始位置,以及每次大概需要挪动多远。每当收集到新的信息,就可以不温不火地在这个横轴上挪动关于对手的定位。了解这个定理,可以对“火候”把握得更好一些。
14#
panduidui123 发表于 2020-10-28 18:27:19 | 只看该作者
剥削打法,让你说的如此复杂。你说不能计算,其实,开发个hud,每秒可以计算,
13#
weizhi18 发表于 2019-3-6 03:09:21 | 只看该作者
举个我自己的例子,刚学扑克的时候,有一次睡醒以后直接开电脑打牌,刚上桌第一次进锅,我在MP拿AQ open,BTN 3bet,我call。Flop 853r,BTN cbet,我check-raise,BTN call。Turn J,我all in,对手call,亮出KK。

那时候我刚学扑克,也不会分析range,也不会做EV计算,也不懂用什么软件,反正就是觉得我上桌第一手牌你就搞我?你什么意思?你就一定有牌?我就看看能不能打跑你。然后就输了一个buyin,然后我就关掉了电脑。

这件事情其实有两个原因,一个是生理方面的,刚起床,人的大脑和生理各方面都处于一个比较低级的状态,容易生气,冲动等等。另一个原因是更加本质的原因:就是因为我不懂这种情况应该怎样评价,正是因为不知道怎样评价这样的情况,所以就会焦虑,就会冲动,就会乱来。


这段好可爱啊 不知怎么看完脑海里就浮现出哈士奇的脸 想起我们一直笑话哈士奇是二哈 是不是它本身焦虑基因偏高 收索了一下 果然
12#
maomaobiao 发表于 2015-6-24 05:24:17 | 只看该作者
lililili11 发表于 2015-6-23 17:05
都是些很杂的东西,严格说来,并不是一定会去看,只是有看的意向。比如《时间简史》《少有人走的路》《自 ...

时间简史 在路上了,我的问题是看书经常烂尾。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-11-24 05:26 , Processed in 0.092732 second(s), 8 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部