智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 11598|回复: 34
打印 上一主题 下一主题

你的利润来自哪里?——这里有一个你肯定没有听过的概...

[复制链接]
跳转到指定楼层
#
mnsgdhr 发表于 2017-6-4 16:06:40 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
我们都知道扑克中的利润来自对手的错误。这句话很正确,但它并没有完全说明问题,因为我们要先定义什么是“错误”。对错误的定义代表了不同时代人们对扑克的理解,今天我们就来聊一聊这个问题,并且我这里将提出一个全新的概念,并无耻地以我的名字命名,希望出门不会被打。

真钱
在混沌初开的年代,人们打扑克纯属娱乐,没有那么多的概念和理论。他们看待输赢的方式也很简单,就是桌上那一摞摞钞票,赢得多就是玩得好。但这样显然是有问题的,有时候打得好未必就会赢,AA和27o在翻牌前全压都还是会有超过10%的概率翻船的。你能说用AA和对手全压是错误吗?如果你现在还是单纯只看输赢的结果,那么你对扑克的理解还是处于原始时代。

S-BUCKS
S-BUCKS是斯克兰斯基美元(Sklansky-BUCKS)的简称,是David Sklansky提出的一个概念,它是用来告诉你,长期来讲你平均每次能从底池中赢得多少钱。举个简单的例子,对手翻前开池加注3美元,我们3bet到10美元,对手4bet全压到100美元,所有人弃牌到我们,我们手拿KK跟注,对手亮出AcKd,结果翻牌对手击中一张A,我们输掉了100美元的真钱。

这时候一个老头过牌拍拍你的肩膀告诉你,其实你这手牌赢了50美元,你的决定是正确的。KK对抗AKo有大约70%的胜率,所以你跟注之后平均每次能赢得底池里的140美元(这里我们忽略盲注):

0.7*200=140

你跟注需要90美元,因此你的净利润是50美元,注意这里我们是计算跟注这个选择的EV而不是整手牌的EV,之前3bet的10美元已经是死钱(如果你对此有疑问,可以看我之前发的那篇“盲注位弃牌到底是0EV还是-EV?”)。你每次拿着KK跟注对手的4bet全压,平均都会获得50美元的利润,所以这是非常正确的决定。S-BUCKS对错误有了新的定义,每次你犯错误,你都会损失S-BUCKS,这是一个很大的进步。

G-BUCKS
但是S-BUCKS存在一个很大的问题,就是它实际上并不能指导玩家做出正确决定,因为在对手没有亮牌之前,我们不可能确切知道对手是哪一手牌,所以S-BUCK只能在事后告诉我们这个决定长期来讲可以获得多少S-BUCKS。

在亮牌之前,对手的手牌对于我们是一个范围,于是知名玩家Phill Golfond引入了G-BUCKS的概念,用来检查对抗范围的期望值,还是刚才那个例子,我们假设对手会用【QQ+, AK】这个范围全压,我们KK对抗这个范围的赢率大约是57%(这里,以及下面的例子,我们都不考虑底牌的排除效应),因此我们的G-BUCKS就是24美元:

0.57*200-90=24

G-BUCKS的提出对于扑克来说具有非常重要的意义,这让我们对于决策有了很清晰地理论依据,我们可以根据G-BUCKS来判断我们是否在犯错误,这标志着扑克进入了新纪元。

相互钱
但是我这里还要告诉你,即使做出正确的决定,你也未必能赢钱,即使错误的决定,你也未必会输钱。这是《Elements of Poker》的作者Tommy Angelo提出的,Recoprocal-Bucks我们简称R-BUCKS。

还是刚才的例子,如果我们和对手互换,局势还是按例子中那样发展,那么我们和对手之间实际上没有金钱流动。所以金钱的流动是来自策略的差异,如果对方和我们在某个特定情形采取的是相同的策略,那么不管对手是否犯错,我们的R-BUCKS都是0。

其实我认为所有人在牌局中,每一手牌都在犯“错误”,因为没有人能打出完美的扑克,不管我们的决定有多好,总有更好的决定。

扑克不是在比谁不犯错,而是在比谁犯的错小。

N-RMB
下面我要提出一个新的概念N-RMB,N是我名字的首字母,RMB是人民币的简称,毕竟我是中国人,N-BUCKS留给老外用。简单来讲是指我们策略选择的平均期望值,后面我会写出最终定义。

为了说明这个概念,我们还用刚才那个例子,假设我们3bet的范围是【QQ+, AKs, A5s-A2s, JTs, T9s, 98s, 87s, 76s, 65s, AKo】,这是74种组合。对手用【QQ+, AK】4bet全压,我们需要跟注90去赢一个跟注后是200的底池,需要45%的赢率,而AK和QQ的赢率都不够,因此我们只能用KK+跟注,KK+有12种组合,对抗对手范围有大约70%的胜率,我们范围的G-BUCKS=50。

当我们做跟注这个选择的同时,其实也意味着其他所有牌都选择弃牌,也就是说我们大约16%的时候跟注4bet全压。因此我们面对4bet全压时策略选择的N-RMB是:

0.16*50=8

再次提醒,这里是计算面对4bet时的策略选择,因此弃牌的EV是0,而不是-10,很多人都会搞混。从这个公式我们可以看出,如果我们只用KK+去3bet,并跟注全压,我们面对4bet全压的N-RMB就是50,那么我们是否应该这么做呢?答案是不一定,因为这样做有可能会降低其他地方的N-RMB,从而导致整个策略系统的N-RMB降低。

例如,如果对手这里开池范围中有170种组合,他面对3bet只用【QQ+, AK】即34种组合4bet全压,然后弃掉其他牌,那么你不仅不应该减少3bet范围,反而应该用你整个范围去3bet,因为我们3bet后面对4bet全压的概率只有20%,其他80%的情况是对手直接弃牌,我们直接赢得底池。用整个范围去3bet的收益会更高,具体的数字我就不做计算了,感兴趣的可以自己下去计算一下。

对于翻牌后也是如此,如果你因为对手跟注过多而用很多中等牌下注,这会提高你的收益,但也会导致你过牌范围过弱,过牌弃牌频率过高,从而让对手能轻易诈唬你获利;或者对手爱诈唬,于是你慢玩强牌,这会让对手的诈唬受挫,但也可能会导致你下注范围变成封顶的,很容易被超池下注击败。究竟孰轻孰重,这些都需要你从全局来考虑。

因此,在某个决策点利润最大化不是我们的目的,整个策略系统的期望值才是。

然而还没有结束,如果我们用全部范围去3bet对手,对手很可能会开始调整,例如他知道我们只用KK+跟注4bet全压,于是开始用整个范围去4bet,于是我们之前的收益很可能又会吐回去。然而我们也不是吃素的,我们开始收紧3bet范围,增加跟注4bet全压的范围。对手又会做相应的调整,金钱在敌我之间来回流动,并没有形成稳定收益。

直到最后,其中一方达到能力极限,无法再做出调整,此时另一方是占优的,因此也没有意愿调整,双方的策略系统趋于稳定。如果双方交手的时间足够长,占优一方的策略系统会稳定赢利,这个时候的平均收益,就是N-RMB。

因此请忘掉我之前例子中的表述方式,N-RMB不再用来表示某一局部策略的收益。N-RMB的最终定义是:当双方都没有意愿(或能力)改变策略系统时,我们的策略系统对抗对手的策略系统的平均收益。N-RMB才是我们利润的真正来源,也是我们提高水平的努力方向。

这个概念我想很多高手应该都在用,只是他们不能(或不愿)将它清晰地表述出来,我这个人相对于打牌,对研究技术更感兴趣,因此我也不会藏着掖着,有什么就都分享出来。这篇文章与我之前发的“为什么要对付厉害的玩家,专心捕鱼不好吗?”有一定的相关性,一些观点可以互相补充,没看过的朋友可以看一下。

同时这个概念我也是第一次公开出来,也许会有考虑不完善或表述准确的地方,希望大家多留言讨论。



分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏2
34#
benny_xmy 发表于 2017-6-9 04:56:14 | 只看该作者
pongba 发表于 2017-6-8 05:26
假设在决策树的每个节点都做max EV的动作,能使得total game strategy是max EV的吗?(假定对手不会adjust ...

interesting,不晓得能不能举个例子说明一下这个sub optimal -> total optimal的过程
33#
xiaoyuer 发表于 2017-6-8 08:10:50 | 只看该作者
感觉你好厉害的样子
32#
pongba 发表于 2017-6-8 05:26:55 | 只看该作者
因此,在某个决策点利润最大化不是我们的目的,整个策略系统的期望值才是。


假设在决策树的每个节点都做max EV的动作,能使得total game strategy是max EV的吗?(假定对手不会adjust)
我记得传统的扑克理论的建议是在每一个spot做MAX EV的决策,然而实际上从total game strategy的角度看,完全可以在turn上做一个suboptimal的决策(小于max EV,甚至-EV),然后进入河牌的新的决策树分支,在这个分支中得到更大的补偿,从而使得turn+river这个subgame的EV是更大的。
31#
泥中土 发表于 2017-6-7 20:44:21 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
30#
Ander_AK 发表于 2017-6-6 19:57:49 来自手机 | 只看该作者
本帖最后由 Ander_AK 于 2017-6-6 20:01 编辑

概念似乎不错,但名字最好换下。。。。
29#
 楼主| mnsgdhr 发表于 2017-6-6 19:06:05 | 只看该作者
lililili11 发表于 2017-6-6 02:21
Gbucks确实说反了。

楼主说的这个概念还是挺有用的,Gbucks我真不知道有什么用,求各位大侠指点迷津。 ...

如果把G-BUCKS延伸成范围对范围,应该还是有用的吧。
范围对手牌的话,我得去翻翻那篇文章了,已经不记得他具体说的什么了。。。。
28#
 楼主| mnsgdhr 发表于 2017-6-6 19:01:58 | 只看该作者
泥中土 发表于 2017-6-5 23:26
怎么会帮不到了,已经搜索阅读过知乎你14篇文章,有很多还不错的内容。只是觉得应该还可以探讨得更深入, ...

哈,能帮到就好!一篇文章篇幅有限,再加上我自己的笔力不足,有些事情确实无法表达得非常清楚。毕竟文章属于单向表达,由于笔者和读者的知识结构有差异,难免会有我以为不用说的东西其实有必要说。这方面我还需要提高啊!
另外那本新书我在亚马逊上看不到啊,你是从哪里得知的?有链接吗?谢谢!
27#
 楼主| mnsgdhr 发表于 2017-6-6 18:55:29 | 只看该作者
吹牛无罪 发表于 2017-6-6 00:40
G-Buck说反了。高方说的是我方的范围对敌方的具体一手牌。

你这么一说好像确实是,这下尴尬了。。。。

你就当我把它延伸了,让G-BUCKS包含了:我方范围对对手手牌,我方手牌对对方范围,我方范围对对方范围。

嗯,这下圆过去了。。。

26#
AKsReid 发表于 2017-6-6 13:27:36 来自手机 | 只看该作者
benny_xmy 发表于 2017-6-6 04:11
高方已经很久没出什么成绩了。。

高方转PLO很久了吧,他不怎么打比赛,主要是Cash。
25#
benny_xmy 发表于 2017-6-6 04:11:14 | 只看该作者
lililili11 发表于 2017-6-6 02:21
Gbucks确实说反了。

楼主说的这个概念还是挺有用的,Gbucks我真不知道有什么用,求各位大侠指点迷津。 ...

高方已经很久没出什么成绩了。。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-11-24 15:20 , Processed in 0.049105 second(s), 8 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部