智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 11619|回复: 34
打印 上一主题 下一主题

你的利润来自哪里?——这里有一个你肯定没有听过的概...

[复制链接]
跳转到指定楼层
1#
mnsgdhr 发表于 2017-6-4 16:06:40 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
我们都知道扑克中的利润来自对手的错误。这句话很正确,但它并没有完全说明问题,因为我们要先定义什么是“错误”。对错误的定义代表了不同时代人们对扑克的理解,今天我们就来聊一聊这个问题,并且我这里将提出一个全新的概念,并无耻地以我的名字命名,希望出门不会被打。

真钱
在混沌初开的年代,人们打扑克纯属娱乐,没有那么多的概念和理论。他们看待输赢的方式也很简单,就是桌上那一摞摞钞票,赢得多就是玩得好。但这样显然是有问题的,有时候打得好未必就会赢,AA和27o在翻牌前全压都还是会有超过10%的概率翻船的。你能说用AA和对手全压是错误吗?如果你现在还是单纯只看输赢的结果,那么你对扑克的理解还是处于原始时代。

S-BUCKS
S-BUCKS是斯克兰斯基美元(Sklansky-BUCKS)的简称,是David Sklansky提出的一个概念,它是用来告诉你,长期来讲你平均每次能从底池中赢得多少钱。举个简单的例子,对手翻前开池加注3美元,我们3bet到10美元,对手4bet全压到100美元,所有人弃牌到我们,我们手拿KK跟注,对手亮出AcKd,结果翻牌对手击中一张A,我们输掉了100美元的真钱。

这时候一个老头过牌拍拍你的肩膀告诉你,其实你这手牌赢了50美元,你的决定是正确的。KK对抗AKo有大约70%的胜率,所以你跟注之后平均每次能赢得底池里的140美元(这里我们忽略盲注):

0.7*200=140

你跟注需要90美元,因此你的净利润是50美元,注意这里我们是计算跟注这个选择的EV而不是整手牌的EV,之前3bet的10美元已经是死钱(如果你对此有疑问,可以看我之前发的那篇“盲注位弃牌到底是0EV还是-EV?”)。你每次拿着KK跟注对手的4bet全压,平均都会获得50美元的利润,所以这是非常正确的决定。S-BUCKS对错误有了新的定义,每次你犯错误,你都会损失S-BUCKS,这是一个很大的进步。

G-BUCKS
但是S-BUCKS存在一个很大的问题,就是它实际上并不能指导玩家做出正确决定,因为在对手没有亮牌之前,我们不可能确切知道对手是哪一手牌,所以S-BUCK只能在事后告诉我们这个决定长期来讲可以获得多少S-BUCKS。

在亮牌之前,对手的手牌对于我们是一个范围,于是知名玩家Phill Golfond引入了G-BUCKS的概念,用来检查对抗范围的期望值,还是刚才那个例子,我们假设对手会用【QQ+, AK】这个范围全压,我们KK对抗这个范围的赢率大约是57%(这里,以及下面的例子,我们都不考虑底牌的排除效应),因此我们的G-BUCKS就是24美元:

0.57*200-90=24

G-BUCKS的提出对于扑克来说具有非常重要的意义,这让我们对于决策有了很清晰地理论依据,我们可以根据G-BUCKS来判断我们是否在犯错误,这标志着扑克进入了新纪元。

相互钱
但是我这里还要告诉你,即使做出正确的决定,你也未必能赢钱,即使错误的决定,你也未必会输钱。这是《Elements of Poker》的作者Tommy Angelo提出的,Recoprocal-Bucks我们简称R-BUCKS。

还是刚才的例子,如果我们和对手互换,局势还是按例子中那样发展,那么我们和对手之间实际上没有金钱流动。所以金钱的流动是来自策略的差异,如果对方和我们在某个特定情形采取的是相同的策略,那么不管对手是否犯错,我们的R-BUCKS都是0。

其实我认为所有人在牌局中,每一手牌都在犯“错误”,因为没有人能打出完美的扑克,不管我们的决定有多好,总有更好的决定。

扑克不是在比谁不犯错,而是在比谁犯的错小。

N-RMB
下面我要提出一个新的概念N-RMB,N是我名字的首字母,RMB是人民币的简称,毕竟我是中国人,N-BUCKS留给老外用。简单来讲是指我们策略选择的平均期望值,后面我会写出最终定义。

为了说明这个概念,我们还用刚才那个例子,假设我们3bet的范围是【QQ+, AKs, A5s-A2s, JTs, T9s, 98s, 87s, 76s, 65s, AKo】,这是74种组合。对手用【QQ+, AK】4bet全压,我们需要跟注90去赢一个跟注后是200的底池,需要45%的赢率,而AK和QQ的赢率都不够,因此我们只能用KK+跟注,KK+有12种组合,对抗对手范围有大约70%的胜率,我们范围的G-BUCKS=50。

当我们做跟注这个选择的同时,其实也意味着其他所有牌都选择弃牌,也就是说我们大约16%的时候跟注4bet全压。因此我们面对4bet全压时策略选择的N-RMB是:

0.16*50=8

再次提醒,这里是计算面对4bet时的策略选择,因此弃牌的EV是0,而不是-10,很多人都会搞混。从这个公式我们可以看出,如果我们只用KK+去3bet,并跟注全压,我们面对4bet全压的N-RMB就是50,那么我们是否应该这么做呢?答案是不一定,因为这样做有可能会降低其他地方的N-RMB,从而导致整个策略系统的N-RMB降低。

例如,如果对手这里开池范围中有170种组合,他面对3bet只用【QQ+, AK】即34种组合4bet全压,然后弃掉其他牌,那么你不仅不应该减少3bet范围,反而应该用你整个范围去3bet,因为我们3bet后面对4bet全压的概率只有20%,其他80%的情况是对手直接弃牌,我们直接赢得底池。用整个范围去3bet的收益会更高,具体的数字我就不做计算了,感兴趣的可以自己下去计算一下。

对于翻牌后也是如此,如果你因为对手跟注过多而用很多中等牌下注,这会提高你的收益,但也会导致你过牌范围过弱,过牌弃牌频率过高,从而让对手能轻易诈唬你获利;或者对手爱诈唬,于是你慢玩强牌,这会让对手的诈唬受挫,但也可能会导致你下注范围变成封顶的,很容易被超池下注击败。究竟孰轻孰重,这些都需要你从全局来考虑。

因此,在某个决策点利润最大化不是我们的目的,整个策略系统的期望值才是。

然而还没有结束,如果我们用全部范围去3bet对手,对手很可能会开始调整,例如他知道我们只用KK+跟注4bet全压,于是开始用整个范围去4bet,于是我们之前的收益很可能又会吐回去。然而我们也不是吃素的,我们开始收紧3bet范围,增加跟注4bet全压的范围。对手又会做相应的调整,金钱在敌我之间来回流动,并没有形成稳定收益。

直到最后,其中一方达到能力极限,无法再做出调整,此时另一方是占优的,因此也没有意愿调整,双方的策略系统趋于稳定。如果双方交手的时间足够长,占优一方的策略系统会稳定赢利,这个时候的平均收益,就是N-RMB。

因此请忘掉我之前例子中的表述方式,N-RMB不再用来表示某一局部策略的收益。N-RMB的最终定义是:当双方都没有意愿(或能力)改变策略系统时,我们的策略系统对抗对手的策略系统的平均收益。N-RMB才是我们利润的真正来源,也是我们提高水平的努力方向。

这个概念我想很多高手应该都在用,只是他们不能(或不愿)将它清晰地表述出来,我这个人相对于打牌,对研究技术更感兴趣,因此我也不会藏着掖着,有什么就都分享出来。这篇文章与我之前发的“为什么要对付厉害的玩家,专心捕鱼不好吗?”有一定的相关性,一些观点可以互相补充,没看过的朋友可以看一下。

同时这个概念我也是第一次公开出来,也许会有考虑不完善或表述准确的地方,希望大家多留言讨论。



分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏2
2#
sky1021 发表于 2017-6-4 16:53:04 | 只看该作者
“然而还没有结束,如果我们用全部范围去3bet对手,对手很可能会开始调整,例如他知道我们只用KK+跟注4bet全压,于是开始用整个范围去4bet,于是我们之前的收益很可能又会吐回去。然而我们也不是吃素的,我们开始收紧3bet范围,增加跟注4bet全压的范围。对手又会做相应的调整,金钱在敌我之间来回流动,并没有形成稳定收益。

直到最后,其中一方达到能力极限,无法再做出调整,此时另一方是占优的,因此也没有意愿调整,双方的策略系统趋于稳定。如果双方交手的时间足够长,占优一方的策略系统会稳定赢利,这个时候的平均收益,就是N-RMB。“

这点非常赞同

高手跟高手过招 比的就是谁调整的好 谁适应的快

但最终结果这只是放大波动 收益并没有随着波动增加而增加 纯属浪费时间浪费生命 给平台给局头打工而已
3#
三脚架 发表于 2017-6-4 17:35:22 | 只看该作者
本帖最后由 三脚架 于 2017-6-4 17:52 编辑

因此请忘掉我之前例子中的表述方式,N-RMB不再用来表示某一局部策略的收益。N-RMB的最终定义是:当双方都没有意愿(或能力)改变策略系统时,我们的策略系统对抗对手的策略系统的平均收益。N-RMB才是我们利润的真正来源,也是我们提高水平的努力方向。

可否给一个清晰的例子?

因此我们面对4bet全压时策略选择的N-RMB是:

0.16*50=8
??????
为什么要*0.16? N-RMB和G-bucks, 和EV有什么不同?

如果按照如上的例子, Hero 3bet 的N-RMB是否=
对手ft3 我的盈利=((170-34)/170))*(3+1.5)=2.8
对手4bet 我们fold=(34/170)*((74-12)/74))*(-10)=0.2*0.8378378378378378*-10=-1.6756756756756756
对手4bet 我们call=(34/170)*(12/74)*50=1.6216216216216216
2.8+1.6216216216216216-1.6756756756756756=2.745945945945946

这是3bet的EV. N-RMB 又是什么? 求解



4#
傻傻的鱼 发表于 2017-6-4 19:25:45 来自手机 | 只看该作者
当十年后n-rmb 名动天下,楼主走上人生巅峰的时候请记住我是第一个出来捧你臭脚的,到那时,好照顾的话照顾下,随手打赏个百八十万
5#
 楼主| mnsgdhr 发表于 2017-6-4 21:26:01 | 只看该作者
本帖最后由 mnsgdhr 于 2017-6-4 21:37 编辑
三脚架 发表于 2017-6-4 17:35
因此请忘掉我之前例子中的表述方式,N-RMB不再用来表示某一局部策略的收益。N-RMB的最终定义是:当双方都没 ...

实际上是我图省事省略了,完整的式子应该是0.16*50+0.84*0=8.
这个式子实际上计算的是:将之前的底池中的钱当成死钱的前提下,我们面对对手4bet时的EV,我们做选择时,弃牌的EV总是0。



我文章的最后专门提了一句,忘掉之前的表述,之前是为了方便表述来说明问题。N-RMB最终是指你稳定后的整个策略系统与对手稳定后的策略系统对抗后产生的金钱流动,这才是你利润的真正来源。N-RMB是一个相对值,而非绝对值。

想象一下,你在翻拍前的策略比对手优秀,赢了对手5bb,结果翻牌后对手更优秀,你输给他5bb,最终你们之间的对抗实际上没有金钱的流动。

或者说再将焦点缩小,你的下注范围很强很平衡,对手在面对你下注的时候输了2bb,但是你过牌的范围很弱,对手面对你过牌时又赢了你2bb,你们还是没有金钱流动。

虽然计算整个策略系统的N-RMB很困难,人力是很难完成的,但我想在不久的将来,利用软件是有可能计算出来的。

特别是利用人工智能分析你的整个策略系统,甚至有可能计算出完全没有交过手的两个人,如果他们对抗,长期下来其中打得好的人能从较差的人那里赢得每百手几bb。

或者是人工智能通过你的牌局分析你的打法,然后能完全复制你的打法,然后另一个AI再复制另一个人,两个AI打上1亿手牌,也能得出他们之间的N-RMB。

N-RMB的功能主要是指导我们从全局来思考问题,某一局部的优势,有可能是你用另一个地方的劣势换来的,最终如何抉择,就需要考虑对抗这个对手整体的N-RMB。

不知道我这样说清楚了没有。其实我对这个概念还还在探索之中。
6#
 楼主| mnsgdhr 发表于 2017-6-4 21:27:33 | 只看该作者
傻傻的鱼 发表于 2017-6-4 19:25
当十年后n-rmb 名动天下,楼主走上人生巅峰的时候请记住我是第一个出来捧你臭脚的,到那时,好照顾的话照顾 ...

那你应该先资助我格百八十万的,我让你占10%的股,等我赚了一个亿,你就能分到1000万,是不是很划算?
7#
傻傻的鱼 发表于 2017-6-4 21:45:39 来自手机 | 只看该作者
mnsgdhr 发表于 2017-6-4 21:27
那你应该先资助我格百八十万的,我让你占10%的股,等我赚了一个亿,你就能分到1000万,是不是很划算?
...

你等两天,我去把裤子当了给你打款。

不开玩笑了。
我觉得你所谓的“N-RMB” 还是有价值的,至少是值得思考的。
8#
泥中土 发表于 2017-6-4 21:48:30 来自手机 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
9#
benny_xmy 发表于 2017-6-5 00:05:42 来自手机 | 只看该作者
从$200到$8。。$8估计被抽水抽掉咯
10#
benny_xmy 发表于 2017-6-5 00:12:44 来自手机 | 只看该作者
本帖最后由 benny_xmy 于 2017-6-5 03:45 编辑

兄弟,我有一个问题,就是你这个全局ev是在决策中重复博弈10000个来回的的一次option,还是打了10000手牌才能体现出来的整体ev?
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-11-28 04:22 , Processed in 0.046520 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部