智游城

标题: 你的利润来自哪里?——这里有一个你肯定没有听过的概... [打印本页]

作者: mnsgdhr    时间: 2017-6-4 16:06
标题: 你的利润来自哪里?——这里有一个你肯定没有听过的概...
我们都知道扑克中的利润来自对手的错误。这句话很正确,但它并没有完全说明问题,因为我们要先定义什么是“错误”。对错误的定义代表了不同时代人们对扑克的理解,今天我们就来聊一聊这个问题,并且我这里将提出一个全新的概念,并无耻地以我的名字命名,希望出门不会被打。

真钱
在混沌初开的年代,人们打扑克纯属娱乐,没有那么多的概念和理论。他们看待输赢的方式也很简单,就是桌上那一摞摞钞票,赢得多就是玩得好。但这样显然是有问题的,有时候打得好未必就会赢,AA和27o在翻牌前全压都还是会有超过10%的概率翻船的。你能说用AA和对手全压是错误吗?如果你现在还是单纯只看输赢的结果,那么你对扑克的理解还是处于原始时代。

S-BUCKS
S-BUCKS是斯克兰斯基美元(Sklansky-BUCKS)的简称,是David Sklansky提出的一个概念,它是用来告诉你,长期来讲你平均每次能从底池中赢得多少钱。举个简单的例子,对手翻前开池加注3美元,我们3bet到10美元,对手4bet全压到100美元,所有人弃牌到我们,我们手拿KK跟注,对手亮出AcKd,结果翻牌对手击中一张A,我们输掉了100美元的真钱。

这时候一个老头过牌拍拍你的肩膀告诉你,其实你这手牌赢了50美元,你的决定是正确的。KK对抗AKo有大约70%的胜率,所以你跟注之后平均每次能赢得底池里的140美元(这里我们忽略盲注):

0.7*200=140

你跟注需要90美元,因此你的净利润是50美元,注意这里我们是计算跟注这个选择的EV而不是整手牌的EV,之前3bet的10美元已经是死钱(如果你对此有疑问,可以看我之前发的那篇“盲注位弃牌到底是0EV还是-EV?”)。你每次拿着KK跟注对手的4bet全压,平均都会获得50美元的利润,所以这是非常正确的决定。S-BUCKS对错误有了新的定义,每次你犯错误,你都会损失S-BUCKS,这是一个很大的进步。

G-BUCKS
但是S-BUCKS存在一个很大的问题,就是它实际上并不能指导玩家做出正确决定,因为在对手没有亮牌之前,我们不可能确切知道对手是哪一手牌,所以S-BUCK只能在事后告诉我们这个决定长期来讲可以获得多少S-BUCKS。

在亮牌之前,对手的手牌对于我们是一个范围,于是知名玩家Phill Golfond引入了G-BUCKS的概念,用来检查对抗范围的期望值,还是刚才那个例子,我们假设对手会用【QQ+, AK】这个范围全压,我们KK对抗这个范围的赢率大约是57%(这里,以及下面的例子,我们都不考虑底牌的排除效应),因此我们的G-BUCKS就是24美元:

0.57*200-90=24

G-BUCKS的提出对于扑克来说具有非常重要的意义,这让我们对于决策有了很清晰地理论依据,我们可以根据G-BUCKS来判断我们是否在犯错误,这标志着扑克进入了新纪元。

相互钱
但是我这里还要告诉你,即使做出正确的决定,你也未必能赢钱,即使错误的决定,你也未必会输钱。这是《Elements of Poker》的作者Tommy Angelo提出的,Recoprocal-Bucks我们简称R-BUCKS。

还是刚才的例子,如果我们和对手互换,局势还是按例子中那样发展,那么我们和对手之间实际上没有金钱流动。所以金钱的流动是来自策略的差异,如果对方和我们在某个特定情形采取的是相同的策略,那么不管对手是否犯错,我们的R-BUCKS都是0。

其实我认为所有人在牌局中,每一手牌都在犯“错误”,因为没有人能打出完美的扑克,不管我们的决定有多好,总有更好的决定。

扑克不是在比谁不犯错,而是在比谁犯的错小。

N-RMB
下面我要提出一个新的概念N-RMB,N是我名字的首字母,RMB是人民币的简称,毕竟我是中国人,N-BUCKS留给老外用。简单来讲是指我们策略选择的平均期望值,后面我会写出最终定义。

为了说明这个概念,我们还用刚才那个例子,假设我们3bet的范围是【QQ+, AKs, A5s-A2s, JTs, T9s, 98s, 87s, 76s, 65s, AKo】,这是74种组合。对手用【QQ+, AK】4bet全压,我们需要跟注90去赢一个跟注后是200的底池,需要45%的赢率,而AK和QQ的赢率都不够,因此我们只能用KK+跟注,KK+有12种组合,对抗对手范围有大约70%的胜率,我们范围的G-BUCKS=50。

当我们做跟注这个选择的同时,其实也意味着其他所有牌都选择弃牌,也就是说我们大约16%的时候跟注4bet全压。因此我们面对4bet全压时策略选择的N-RMB是:

0.16*50=8

再次提醒,这里是计算面对4bet时的策略选择,因此弃牌的EV是0,而不是-10,很多人都会搞混。从这个公式我们可以看出,如果我们只用KK+去3bet,并跟注全压,我们面对4bet全压的N-RMB就是50,那么我们是否应该这么做呢?答案是不一定,因为这样做有可能会降低其他地方的N-RMB,从而导致整个策略系统的N-RMB降低。

例如,如果对手这里开池范围中有170种组合,他面对3bet只用【QQ+, AK】即34种组合4bet全压,然后弃掉其他牌,那么你不仅不应该减少3bet范围,反而应该用你整个范围去3bet,因为我们3bet后面对4bet全压的概率只有20%,其他80%的情况是对手直接弃牌,我们直接赢得底池。用整个范围去3bet的收益会更高,具体的数字我就不做计算了,感兴趣的可以自己下去计算一下。

对于翻牌后也是如此,如果你因为对手跟注过多而用很多中等牌下注,这会提高你的收益,但也会导致你过牌范围过弱,过牌弃牌频率过高,从而让对手能轻易诈唬你获利;或者对手爱诈唬,于是你慢玩强牌,这会让对手的诈唬受挫,但也可能会导致你下注范围变成封顶的,很容易被超池下注击败。究竟孰轻孰重,这些都需要你从全局来考虑。

因此,在某个决策点利润最大化不是我们的目的,整个策略系统的期望值才是。

然而还没有结束,如果我们用全部范围去3bet对手,对手很可能会开始调整,例如他知道我们只用KK+跟注4bet全压,于是开始用整个范围去4bet,于是我们之前的收益很可能又会吐回去。然而我们也不是吃素的,我们开始收紧3bet范围,增加跟注4bet全压的范围。对手又会做相应的调整,金钱在敌我之间来回流动,并没有形成稳定收益。

直到最后,其中一方达到能力极限,无法再做出调整,此时另一方是占优的,因此也没有意愿调整,双方的策略系统趋于稳定。如果双方交手的时间足够长,占优一方的策略系统会稳定赢利,这个时候的平均收益,就是N-RMB。

因此请忘掉我之前例子中的表述方式,N-RMB不再用来表示某一局部策略的收益。N-RMB的最终定义是:当双方都没有意愿(或能力)改变策略系统时,我们的策略系统对抗对手的策略系统的平均收益。N-RMB才是我们利润的真正来源,也是我们提高水平的努力方向。

这个概念我想很多高手应该都在用,只是他们不能(或不愿)将它清晰地表述出来,我这个人相对于打牌,对研究技术更感兴趣,因此我也不会藏着掖着,有什么就都分享出来。这篇文章与我之前发的“为什么要对付厉害的玩家,专心捕鱼不好吗?”有一定的相关性,一些观点可以互相补充,没看过的朋友可以看一下。

同时这个概念我也是第一次公开出来,也许会有考虑不完善或表述准确的地方,希望大家多留言讨论。




作者: sky1021    时间: 2017-6-4 16:53
“然而还没有结束,如果我们用全部范围去3bet对手,对手很可能会开始调整,例如他知道我们只用KK+跟注4bet全压,于是开始用整个范围去4bet,于是我们之前的收益很可能又会吐回去。然而我们也不是吃素的,我们开始收紧3bet范围,增加跟注4bet全压的范围。对手又会做相应的调整,金钱在敌我之间来回流动,并没有形成稳定收益。

直到最后,其中一方达到能力极限,无法再做出调整,此时另一方是占优的,因此也没有意愿调整,双方的策略系统趋于稳定。如果双方交手的时间足够长,占优一方的策略系统会稳定赢利,这个时候的平均收益,就是N-RMB。“

这点非常赞同

高手跟高手过招 比的就是谁调整的好 谁适应的快

但最终结果这只是放大波动 收益并没有随着波动增加而增加 纯属浪费时间浪费生命 给平台给局头打工而已

作者: 三脚架    时间: 2017-6-4 17:35
本帖最后由 三脚架 于 2017-6-4 17:52 编辑

因此请忘掉我之前例子中的表述方式,N-RMB不再用来表示某一局部策略的收益。N-RMB的最终定义是:当双方都没有意愿(或能力)改变策略系统时,我们的策略系统对抗对手的策略系统的平均收益。N-RMB才是我们利润的真正来源,也是我们提高水平的努力方向。

可否给一个清晰的例子?

因此我们面对4bet全压时策略选择的N-RMB是:

0.16*50=8
??????
为什么要*0.16? N-RMB和G-bucks, 和EV有什么不同?

如果按照如上的例子, Hero 3bet 的N-RMB是否=
对手ft3 我的盈利=((170-34)/170))*(3+1.5)=2.8
对手4bet 我们fold=(34/170)*((74-12)/74))*(-10)=0.2*0.8378378378378378*-10=-1.6756756756756756
对手4bet 我们call=(34/170)*(12/74)*50=1.6216216216216216
2.8+1.6216216216216216-1.6756756756756756=2.745945945945946

这是3bet的EV. N-RMB 又是什么? 求解




作者: 傻傻的鱼    时间: 2017-6-4 19:25
当十年后n-rmb 名动天下,楼主走上人生巅峰的时候请记住我是第一个出来捧你臭脚的,到那时,好照顾的话照顾下,随手打赏个百八十万
作者: mnsgdhr    时间: 2017-6-4 21:26
本帖最后由 mnsgdhr 于 2017-6-4 21:37 编辑
三脚架 发表于 2017-6-4 17:35
因此请忘掉我之前例子中的表述方式,N-RMB不再用来表示某一局部策略的收益。N-RMB的最终定义是:当双方都没 ...

实际上是我图省事省略了,完整的式子应该是0.16*50+0.84*0=8.
这个式子实际上计算的是:将之前的底池中的钱当成死钱的前提下,我们面对对手4bet时的EV,我们做选择时,弃牌的EV总是0。



我文章的最后专门提了一句,忘掉之前的表述,之前是为了方便表述来说明问题。N-RMB最终是指你稳定后的整个策略系统与对手稳定后的策略系统对抗后产生的金钱流动,这才是你利润的真正来源。N-RMB是一个相对值,而非绝对值。

想象一下,你在翻拍前的策略比对手优秀,赢了对手5bb,结果翻牌后对手更优秀,你输给他5bb,最终你们之间的对抗实际上没有金钱的流动。

或者说再将焦点缩小,你的下注范围很强很平衡,对手在面对你下注的时候输了2bb,但是你过牌的范围很弱,对手面对你过牌时又赢了你2bb,你们还是没有金钱流动。

虽然计算整个策略系统的N-RMB很困难,人力是很难完成的,但我想在不久的将来,利用软件是有可能计算出来的。

特别是利用人工智能分析你的整个策略系统,甚至有可能计算出完全没有交过手的两个人,如果他们对抗,长期下来其中打得好的人能从较差的人那里赢得每百手几bb。

或者是人工智能通过你的牌局分析你的打法,然后能完全复制你的打法,然后另一个AI再复制另一个人,两个AI打上1亿手牌,也能得出他们之间的N-RMB。

N-RMB的功能主要是指导我们从全局来思考问题,某一局部的优势,有可能是你用另一个地方的劣势换来的,最终如何抉择,就需要考虑对抗这个对手整体的N-RMB。

不知道我这样说清楚了没有。其实我对这个概念还还在探索之中。

作者: mnsgdhr    时间: 2017-6-4 21:27
傻傻的鱼 发表于 2017-6-4 19:25
当十年后n-rmb 名动天下,楼主走上人生巅峰的时候请记住我是第一个出来捧你臭脚的,到那时,好照顾的话照顾 ...

那你应该先资助我格百八十万的,我让你占10%的股,等我赚了一个亿,你就能分到1000万,是不是很划算?

作者: 傻傻的鱼    时间: 2017-6-4 21:45
mnsgdhr 发表于 2017-6-4 21:27
那你应该先资助我格百八十万的,我让你占10%的股,等我赚了一个亿,你就能分到1000万,是不是很划算?
...

你等两天,我去把裤子当了给你打款。

不开玩笑了。
我觉得你所谓的“N-RMB” 还是有价值的,至少是值得思考的。
作者: 泥中土    时间: 2017-6-4 21:48
提示: 作者被禁止或删除 内容自动屏蔽
作者: benny_xmy    时间: 2017-6-5 00:05
从$200到$8。。$8估计被抽水抽掉咯
作者: benny_xmy    时间: 2017-6-5 00:12
本帖最后由 benny_xmy 于 2017-6-5 03:45 编辑

兄弟,我有一个问题,就是你这个全局ev是在决策中重复博弈10000个来回的的一次option,还是打了10000手牌才能体现出来的整体ev?
作者: keybattle    时间: 2017-6-5 00:16
你说的概念早就有了,打牌运用挺多了,你只是取了个名字而已
作者: AKsReid    时间: 2017-6-5 07:48
楼主是知乎上的“南什”?欢迎来到智游城。
http://www.zhiyoucheng.co/forum.php?mod=viewthread&tid=47738受启发写了个帖子,不要介意。

作者: mnsgdhr    时间: 2017-6-5 08:18
benny_xmy 发表于 2017-6-5 00:12
兄弟,我有一个问题,就是你这个全局ev是在决策中重复博弈10000个来回的的一次option,还是打了10000手牌才 ...

兄弟你的思考水平很高啊!

既是前者也是后者。
但前者是博弈无数次的到最后形成的稳定状态,虽然没有达到GTO的纳什均衡,但由于水平限制已无法做出调整,这之后双方都会采取这个打法而不会有太大变化,除非某一方水平出现变化。

当双方系统达到稳定后,这两个系统对抗就需要无数次的对抗才能体现出谁更优,10000手可能远远不够。但对于简单的游戏,例如HU中双方都是浅筹码,只采取全压和弃牌的策略,这时候是可以通过计算计算出N-RMB的。

作者: 1025    时间: 2017-6-5 08:31
有深度!
作者: mnsgdhr    时间: 2017-6-5 08:33
keybattle 发表于 2017-6-5 00:16
你说的概念早就有了,打牌运用挺多了,你只是取了个名字而已

没错,对于打牌多年的老手,会在不自觉中运用这个概念。

但是如果一个事物没有清晰地概念,这个事物对于你来说就是不存在的。或者有概念但概念不够清晰,就很可能运用不好。我想在phill golfond提出“G-BUCKS”之前,其他高手肯定早就在用这个概念了,只是他们没有将他们的做法凝练成概念。那么他们在给其他不知道的人解释的时候就不太容易解释,甚至他们自己在运用的时候也会由于思路不清晰而出现问题。当然这里没有拿自己和phill golfond比肩的意思,

并且当概念有了清晰的定义,并有了名字,在交流的过程中就会省去很多力气与误会。例如我说3bet,你自然就知道那是一个什么动作,但是如果没有人提出“3bet”这个概念的话,我们交流的时候可能总是得不断重复“当对手open之后,我们再加注”,如果open也没有定义的话,那这个句子可能会更长。


作者: mnsgdhr    时间: 2017-6-5 08:34
AKsReid 发表于 2017-6-5 07:48
楼主是知乎上的“南什”?欢迎来到智游城。
http://www.zhiyoucheng.co/forum.php?mod=viewthread&tid=4773 ...

怎么会介意,这是你自己的理解,又没有照抄我的。而且你还提了我的名字,等于帮我做了宣传,我还要谢谢你呢!

作者: keybattle    时间: 2017-6-5 21:39
mnsgdhr 发表于 2017-6-5 08:33
没错,对于打牌多年的老手,会在不自觉中运用这个概念。

但是如果一个事物没有清晰地概念,这个事物对于 ...

有没有名字我觉得不算特别重要,理解理论基础才是最重要的

我从来没听过 S-bucks, G-bucks这些名字,但是这些概念早就烂熟于心

作者: 心难在焉    时间: 2017-6-5 22:32
楼主说的真好
作者: mnsgdhr    时间: 2017-6-5 22:33
本帖最后由 mnsgdhr 于 2017-6-5 22:40 编辑
keybattle 发表于 2017-6-5 21:39
有没有名字我觉得不算特别重要,理解理论基础才是最重要的

我从来没听过 S-bucks, G-bucks这些名字,但 ...

就算牛顿不对万有引力做出定义,当时世界上意识到引力这回事的肯定定也不在少数。但牛顿做了定义,让后世的全世界都知道了万有引力。

英文中没有“上火”这个词,你试着给老外解释下“上火”这个概念,我估计你解释不清的,虽然你自己知道是怎么一回事。

我文中也说了,很多人都知道这个概念,但也有很多人不知道,要向这些不知道的人说清楚这个概念,最好的方式就是去定义这个概念。

概念有清晰地定义,才能方便不理解这个概念的人学习,可以降低学习的时间成本,所以我认为很重要。



作者: mnsgdhr    时间: 2017-6-5 22:36
本帖最后由 mnsgdhr 于 2017-6-5 23:11 编辑
lililili11 发表于 2017-6-5 19:33
还是取了个名字的意思……

再稍微宽泛一点,就是winrate。

winrate是绝对的,而N-RMB是相对的,winrate可以理解成你对所有敌人策略总和的N-RMB,我认为还是有必要区分的,否则G-BUCKS直接说是EV就好了。。。。



我这里确实有些标题党的意思,但我认为不是简单地起个名字。我以前的文章写过一句话“概念是个容器,重要的是装在里面的东西”,我做的其实就是想让别人看到这个瓶子,就知道里面装的是什么。

作者: mnsgdhr    时间: 2017-6-5 22:42
本帖最后由 mnsgdhr 于 2017-6-5 23:07 编辑

2017年6月5日更新


相信看了我之前的那篇文章的朋友对于“N-RMB”这个概念已经完全理meng解bi了。嗯,确实这个概念非常抽象,我自己的表达能力又不是特别优秀,真的很羡慕那些能几句话就把事情说得很清楚的人。

具体实例

这里我对之前的文章做一个补充,举一个具体的例子来说明到底什么是“N-RMB”。

假设现在是单挑游戏,小明和小红双方都只有10个大盲的筹码深度,并且他们都采用全压或弃牌的策略,并且此时双方的策略都已稳定,不会再做调整。这里我们只是用来说明问题,所以不考虑他们的策略是否合理。

小明的策略是在小盲60%全压,40%弃牌。在大盲40%跟注,60%弃牌。

小红的策略是在小盲20%全压,80%弃牌;在大盲20%跟注,80%弃牌。

并且假设双方选用的手牌都是采用Equilab上推荐的手牌,而不是最适合全压或跟注的手牌,这两者是不同的,但为了简便我们忽略它。

模型有了,就可以开始计算了,希望在向下看之前你能自己计算一遍,然后与我的计算进行对照。

我们采用小明视角,计算小明的策略对抗小红策略的N-RMB。

先计算小明在小盲的策略对抗小红在大盲的策略的N-RMB,小明40%的时候弃牌,直接损失0.5bb。60%的时候全压,其中80%的时候会直接获得1bb,20%的时候会和对手进入一个20bb的底池。

Equilab中前60%的范围对抗20%有40.73%的赢率,由于最后的结果可能数字比较小,所以这里就不取近似值了。

N-RMB(小明 VS. 小红 - SB VS. BB)=0.4*(-0.5)+0.6*[0.8*1+0.2*(20*0.4073-10)]=0.05752

再计算小明在大盲的策略对抗小红在小盲的策略的N-RMB,80%的情况小红会弃牌,小明直接获得0.5bb,20%的时候小红全压,其中小明60%的时候弃牌直接损失1bb,40%的时候跟注双方进入一个20bb的底池。前40%对抗20%的范围赢率是43.87%。

N-RMB(小明 VS. 小红 - BB VS. SB)=0.8*0.5+0.2[(-1)*0.6+0.4*(20*0.4387-10)]=0.18192

两者相加就是小明的整体策略对抗小红的整体策略的的N-RMB:

N-RMB(小明VS.小红)= N-RMB(小明VS.小红– SB VS. BB)+ N-RMB(小明VS.小红-BB VS. SB)=0.05752+0.18192=0.23944

最后结果很惊人,小明对抗小红的盈利率可以达到23.944bb/100hands,这是非常大的优势,因此只要小红不改变她的策略,小明就只需按照他的策略打就可以打爆小红。

小明的60%全压频率会给小红一个错觉,小明的全压频率不是很高,小红的水平不足,无法正确评估小明的全压频率,所以小红并没有太大意愿改变策略。

但是如果小明贸然调整,比如他知道小红弃牌率太高,因此开始100%的全压,这给小红的感觉明显不同,这时她有可能就会调整自己的策略,最后达到另一个稳定状态,这时的N-RMB很可能比之前的N-RMB要低,因为小明的调整逼迫小红的策略向纳什均衡趋近。

因此N-RMB的一个关键词是“稳定”,如果策略不断的调整,利润就会来回流动,没有形成稳定收益。

从频率的角度思考扑克

我们仔细看下小明和小红的策略,你会发现什么?

小红明显是从牌力或者说赢率的角度来制定策略的,她对前20%的牌比较有信心,希望一旦打到全压,自己能处于领先的状态。

但她的策略对抗小明的策略的N-RMB却是-0.23944,长期来讲他会输给小明很多。小红在局部上的策略是领先的,总是让自己在全压中处于领先地位,但整体上确是落后的。

再看小明的策略,他没有迷信牌力,没有只玩40%的牌,他在不同的位置,根据行动的不同选择了不同的频率。这是从频率的角度来制定策略的。

孰优孰劣一目了然。

其实扑克一直都是一个关于频率的游戏,根据不同的情况选择不同的频率,再将合适手牌放进相应的范围中去。如果你还在用“某一种牌型应该怎么打”这种思维模式,希望你能尝试换一种思路来思考问题。我之所以提出N-RMB这个概念,就是为了提供一个思考扑克的工具。

如果你只考虑当前的牌局,而忽略了整体,有可能会出现,每一次你的决定似乎都是正确,但整体确实输钱的。因为你用了错误的频率,导致你的策略对抗对手损失掉了很多的N-RMB。

N-RMB是思考扑克的一个强大的工具,当你彻底理解了它,并刻意去运用它,很多情况你会自动做出更正确的决定。

并且可以用来帮助我们完善我们的策略系统,一个强大的策略系统能让增加我们水平的稳定性,大部分情况在牌桌外都已经思考过了,在牌桌上就可以花更多的精力来观察和分析对手。


作者: 泥中土    时间: 2017-6-5 22:50
提示: 作者被禁止或删除 内容自动屏蔽
作者: mnsgdhr    时间: 2017-6-5 23:06
本帖最后由 mnsgdhr 于 2017-6-5 23:09 编辑
泥中土 发表于 2017-6-5 22:50
频率问题很多书已经提到了,扑克数学,单挑专家一,二,指南一,乃至今年6月的指南二。希望能够谈点具体 ...

翻牌后打法在《应用指南》这本书里已经讲了很多了,我没有自大到认为我会比他们讲得好啊。。不过我会在我的知乎专栏和微信公众号里不断地发表一些我的思考,但我看你也是看了不少书了,水平一定也很不错,我的能力未必能帮到你。
另外你说指南二,是Matthew Janda又出新书了吗?


作者: 泥中土    时间: 2017-6-5 23:26
提示: 作者被禁止或删除 内容自动屏蔽
作者: 吹牛无罪    时间: 2017-6-6 00:40
G-Buck说反了。高方说的是我方的范围对敌方的具体一手牌。
作者: benny_xmy    时间: 2017-6-6 04:11
lililili11 发表于 2017-6-6 02:21
Gbucks确实说反了。

楼主说的这个概念还是挺有用的,Gbucks我真不知道有什么用,求各位大侠指点迷津。 ...

高方已经很久没出什么成绩了。。
作者: AKsReid    时间: 2017-6-6 13:27
benny_xmy 发表于 2017-6-6 04:11
高方已经很久没出什么成绩了。。

高方转PLO很久了吧,他不怎么打比赛,主要是Cash。
作者: mnsgdhr    时间: 2017-6-6 18:55
吹牛无罪 发表于 2017-6-6 00:40
G-Buck说反了。高方说的是我方的范围对敌方的具体一手牌。

你这么一说好像确实是,这下尴尬了。。。。

你就当我把它延伸了,让G-BUCKS包含了:我方范围对对手手牌,我方手牌对对方范围,我方范围对对方范围。

嗯,这下圆过去了。。。


作者: mnsgdhr    时间: 2017-6-6 19:01
泥中土 发表于 2017-6-5 23:26
怎么会帮不到了,已经搜索阅读过知乎你14篇文章,有很多还不错的内容。只是觉得应该还可以探讨得更深入, ...

哈,能帮到就好!一篇文章篇幅有限,再加上我自己的笔力不足,有些事情确实无法表达得非常清楚。毕竟文章属于单向表达,由于笔者和读者的知识结构有差异,难免会有我以为不用说的东西其实有必要说。这方面我还需要提高啊!
另外那本新书我在亚马逊上看不到啊,你是从哪里得知的?有链接吗?谢谢!

作者: mnsgdhr    时间: 2017-6-6 19:06
lililili11 发表于 2017-6-6 02:21
Gbucks确实说反了。

楼主说的这个概念还是挺有用的,Gbucks我真不知道有什么用,求各位大侠指点迷津。 ...

如果把G-BUCKS延伸成范围对范围,应该还是有用的吧。
范围对手牌的话,我得去翻翻那篇文章了,已经不记得他具体说的什么了。。。。

作者: Ander_AK    时间: 2017-6-6 19:57
本帖最后由 Ander_AK 于 2017-6-6 20:01 编辑

概念似乎不错,但名字最好换下。。。。
作者: 泥中土    时间: 2017-6-7 20:44
提示: 作者被禁止或删除 内容自动屏蔽
作者: pongba    时间: 2017-6-8 05:26
因此,在某个决策点利润最大化不是我们的目的,整个策略系统的期望值才是。


假设在决策树的每个节点都做max EV的动作,能使得total game strategy是max EV的吗?(假定对手不会adjust)
我记得传统的扑克理论的建议是在每一个spot做MAX EV的决策,然而实际上从total game strategy的角度看,完全可以在turn上做一个suboptimal的决策(小于max EV,甚至-EV),然后进入河牌的新的决策树分支,在这个分支中得到更大的补偿,从而使得turn+river这个subgame的EV是更大的。

作者: xiaoyuer    时间: 2017-6-8 08:10
感觉你好厉害的样子

作者: benny_xmy    时间: 2017-6-9 04:56
pongba 发表于 2017-6-8 05:26
假设在决策树的每个节点都做max EV的动作,能使得total game strategy是max EV的吗?(假定对手不会adjust ...

interesting,不晓得能不能举个例子说明一下这个sub optimal -> total optimal的过程





欢迎光临 智游城 (http://zhiyoucheng.co/) Powered by Discuz! X3.2