河牌下注/跟注的GTO策略

我是Jsli · 发表于 2015-8-9 02:52:24

K先生发表于 2015-3-13 01:55
看了此贴怎么觉得德州扑克变成了自然科学
我觉得研究精神是好的，可是这么大套的理论对于实战的指导意义 ...

理论的目的是找出个临界点
计算过程可以忽略了

不给出用于实践的结论而只写出过程的
是纯理论工作者

我是Jsli · 发表于 2015-8-9 03:06:12

lililili11 发表于 2015-1-24 03:19
前面说的安排自己的range分布是一大问题。另外对手B河牌check的时候，在实战中，几乎一定有一定比例的慢打 ...

而做出适合实战的安排,则是浩大的工程了,甚至可能没办法做到.
----------------------------------------------------------------------------
可以设想一下
现场现金桌人人带一副谷歌眼镜
...

尼玛,这牌没法子打了
扑克也失去了它存在的基础

美国扑克存在的基础是什么？
是给退休的老人家们休闲误乐
扑克(现场现金)是政治是选票

leisong · 发表于 2015-8-9 03:15:16

dengxianqi 发表于 2015-8-9 02:35
你没看懂人家的意思。他说0.8中下注0.1，check0.7，这样加起来等于下注0.3。他说的不是bluff频率，是下注 ...

老邓，这个33.3%，是bluff的频率，不是下注频率。按y总预设的我们强牌的比例，我们的下注频率是整体手牌的0.3。其中，66.6%是value，33.3%是bluff。

leisong · 发表于 2015-8-9 03:18:08

yyy6 发表于 2015-8-9 02:02
33.3%太高了这样对方100%call 下注就可以提高ev 我们的好牌只有20% air还bluff了80%*33.3%即26.66%那我们 ...

y总，你说的对，我们最佳的bluff频率不可能超过50%。但，频率肯定和下注额是有关联度，如果我们超池下注，自然，我们的bluff频率就会增加，就是说，我们可以更多的bet我们的弱牌组合。

leisong · 发表于 2015-8-9 03:26:11

dengxianqi 发表于 2015-8-9 02:35
你没看懂人家的意思。他说0.8中下注0.1，check0.7，这样加起来等于下注0.3。他说的不是bluff频率，是下注 ...

我又看了看，好像咱俩说的是一个意思，嘿嘿，不好意思

dengxianqi · 发表于 2015-8-9 09:13:00

leisong 发表于 2015-8-9 03:26
我又看了看，好像咱俩说的是一个意思，嘿嘿，不好意思

不是，是我误解你的意思了。

JCreeks11 · 发表于 2016-5-2 06:39:19

本帖最后由 JCreeks11 于 2016-5-2 09:59 编辑

首先必须赞赏楼主的文章。楼主花了很多时间，很用心。应该说，楼主文章的结论还是非常接近正确的结果的。下面指出文章里面的几个错误：

一、首先GTO的定义不应该是“使得对方无法通过改变策略来提高他的期望回报（ev）的策略”。由于定义不合理，导致后面出现了“B弃牌的策略会优于GTO”这样不合理的的结论。

GTO的定义应如下：针对A的策略S_A，B有最大化B的EV（EVB) 的策略S_B(S_A), 使得EVB(S_B(S_A))=max_{S_B}EVB(S_B|S_A）。而A的GTO策略S*_A，应该满足EVB（S_B（S*_A))=min_{S_A}(EVB(S_B(S_A)))。A的大部分GTO策略S*_A，都是使得EVB(S_B|S*_A)关于S_B的导数为0的。简单地说，A的大部分GTO策略，都使得B无论100%跟还是0%跟都没有区别，这和楼主的定义一样。但是有例外。比如当R非常接近1的时候，B是应该选择0%跟的。有兴趣的牌友可以验证一下。

如果没看懂，这就好比我要最大化一个函数，大部分函数这个最优点都在导数为零的点，但有时候也会在边界点取到最大值。而楼主相当于直接定义最优点是导数为零的值，这显然不合理。

二、在1中，F的”GTO值“（楼主定义下的）RX/(1+X-R-RX)并不是恒小于1的。事实上，当R=.9, X=1, 这个值等于4.5。F应该等于min(1, RX/(1+X-R-RX)。用我的定义可以得出这个值。有兴趣的牌友可自行验证。

三、在2中，X/(2X+1)并不是是A给B的底池赔率，X/(X+1)才是。当然这是小问题。更大的问题是楼主没有办法解释，A的EV是X的单调递增函数。也就是说，A下注越大越好，最好正无穷。这肯定不符合直觉。因为如果A的好牌比较多，R很大的时候，A还是希望下点儿注让B跟的。而A下注正无穷会导致B没法跟，永远拿不到价值。我这里省却数学推导，直接下结论：

当R>0.5，也就是A好牌比例大的时候，X的最佳下注额是(1-R)/(2R-1)。
当R<0.5，也就是A好牌比例不大的时候，A希望下注正无穷使得B没法跟。但前提是A用弱牌诈唬的概率不能超过R/(1-R)。

yyy6 · 发表于 2016-5-2 10:14:48

JCreeks11 发表于 2016-5-2 06:39
首先必须赞赏楼主的文章。楼主花了很多时间，很用心。应该说，楼主文章的结论还是非常接近正确的结果的。下 ...

首先谢谢你的仔细阅读。

一、首先GTO的定义不应该是“使得对方无法通过改变策略来提高他的期望回报（ev）的策略”。由于定义不合理，导致后面出现了“B弃牌的策略会优于GTO”这样不合理的的结论。

二、在1中，F的”GTO值“（楼主定义下的）RX/(1+X-R-RX)并不是恒小于1的。事实上，当R=.9, X=1, 这个值等于4.5。F应该等于min(1, RX/(1+X-R-RX)。用我的定义可以得出这个值。有兴趣的牌友可自行验证。

三、在2中，X/(2X+1)并不是是A给B的底池赔率，X/(X+1)才是。当然这是小问题。更大的问题是楼主没有办法解释，A的EV是X的单调递增函数。也就是说，A下注越大越好，最好正无穷。这肯定不符合直觉。因为如果A的好牌比较多，R很大的时候，A还是希望下点儿注让B跟的。而A下注正无穷会导致B没法跟，永远拿不到价值。我这里省却数学推导，直接下结论：

当R>0.5，也就是A好牌比例大的时候，X的最佳下注额是(1-R)/(2R-1)。
当R<0.5，也就是A好牌比例不大的时候，A希望下注正无穷使得B没法跟。但前提是A用弱牌诈唬的概率不能超过R/(1-R)。

一二三好像是一个问题，都是先界定边界条件还是后界定边界条件的问题。比如F（弃牌率)在0到1之间。比如对方的EV必须要>=弃牌ev。我们可以定义GTO为必须满足这些边界条件，那公式里面就到处都有MIN/MAX，也可以按我说的定义先求导，最后再看结论是否满足边界条件，像你说的第一点，既然B的GTO跟注ev还小于弃牌ev，那当然B只能弃牌。你说的二是一个意思。求出的对方弃牌率是4.5，那当然意味着对方100%弃牌就好。这并不影响任何推导和结论。

对第三点，在不先界定边界的时候，A的EV的确就是单调递增函数，R比例足够大的时候B的策略就是弃牌。也许你没看完，你说的结论我在原文里面都写了，R>0.5的时候R/(2R-1)-1，打开和你写的式子是一样的。而你说的”直觉“是个理解偏差。我们好牌足够多的时候，只需要下注这个底池赔率或以上都可以迫使对方对我们的整个range弃牌。我们不存在”希望“对方跟注，这都不是GTO应该使用的语言和思维方式。另，X(2X+1)和X(X+1)都可以表示底池赔率，个人使用的习惯不同而已，我习惯加上自己需要跟注的钱，因为这个概率跟胜率更好比较，比如X=1即对方POT下注的时候我的公式赔率是1/3，我们需要的胜率也是1/3.

JCreeks11 · 发表于 2016-5-2 12:05:39

本帖最后由 JCreeks11 于 2016-5-2 12:35 编辑

yyy6 发表于 2016-5-2 10:14
首先谢谢你的仔细阅读。

一、首先GTO的定义不应该是“使得对方无法通过改变策略来提高他的期望回报（ev） ...

我刚才确实想错了，当R>.5时，X在(1-R)/(1-2R)或以上都是纳什均衡。因为这时候B的GTO决策都是0。当然如果B稍微偏离GTO，A的最佳下注量还是(1-R)/(1-2R)。

另外按照我的定义（就是博弈论中所谓minmax，当然这里纳什均衡必然存在，用minmax或者maxmin都是一样的），并不存在“GTO并不一定是对ev无影响，可能是提高我们的ev，也可能是降低我们的ev”一说。GTO一定是当假设对方是GTO玩家时，自己EV最高的。

JCreeks11 · 发表于 2016-5-2 12:34:33

yyy6 发表于 2016-5-2 10:14
首先谢谢你的仔细阅读。

一、首先GTO的定义不应该是“使得对方无法通过改变策略来提高他的期望回报（ev） ...

楼主这里是把下注固定了，然后把诈唬率拉出来作为决策。如果把X和F都作为决策，假设X没有上限，可以发现无论R是多大，B的跟注率在纳什均衡下竟然都是0！

这个例子的现实意义是，当筹码非常深的时候，玩能拿到nuts的牌的重要性。只要你的range里有nuts，只有你的筹码足够深，只要你是GTO，对手就会被打到必须弃牌。

		自动登录	找回密码
密码			注册

河牌下注/跟注的GTO策略

客服中心

投诉建议