智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: yyy6
打印 上一主题 下一主题

河牌下注/跟注的GTO策略

[复制链接]
31#
我是Jsli 发表于 2015-8-9 02:52:24 | 只看该作者
K先生 发表于 2015-3-13 01:55
看了此贴怎么觉得德州扑克变成了自然科学
我觉得研究精神是好的,可是这么大套的理论对于实战的指导意义 ...

理论的目的是找出个临界点
计算过程可以忽略了

不给出用于实践的结论而只写出过程的
是纯理论工作者

32#
我是Jsli 发表于 2015-8-9 03:06:12 | 只看该作者
lililili11 发表于 2015-1-24 03:19
前面说的安排自己的range分布是一大问题。另外对手B河牌check的时候,在实战中,几乎一定有一定比例的慢打 ...

而做出适合实战的安排,则是浩大的工程了,甚至可能没办法做到.
----------------------------------------------------------------------------
可以设想一下
现场现金桌人人带一副谷歌眼镜
...

尼玛,这牌没法子打了
扑克也失去了它存在的基础

美国扑克存在的基础是什么?
是给退休的老人家们休闲误乐
扑克(现场现金)是政治是选票

33#
leisong 发表于 2015-8-9 03:15:16 | 只看该作者
dengxianqi 发表于 2015-8-9 02:35
你没看懂人家的意思。他说0.8中下注0.1,check0.7,这样加起来等于下注0.3。他说的不是bluff频率,是下注 ...

老邓,这个33.3%,是bluff的频率,不是下注频率。按y总预设的我们强牌的比例,我们的下注频率是整体手牌的0.3。其中,66.6%是value,33.3%是bluff。
34#
leisong 发表于 2015-8-9 03:18:08 | 只看该作者
yyy6 发表于 2015-8-9 02:02
33.3%太高了 这样对方100%call 下注就可以提高ev 我们的好牌只有20% air还bluff了80%*33.3%即26.66%那我们 ...

y总,你说的对,我们最佳的bluff频率不可能超过50%。但,频率肯定和下注额是有关联度,如果我们超池下注,自然,我们的bluff频率就会增加,就是说,我们可以更多的bet我们的弱牌组合。
35#
leisong 发表于 2015-8-9 03:26:11 | 只看该作者
dengxianqi 发表于 2015-8-9 02:35
你没看懂人家的意思。他说0.8中下注0.1,check0.7,这样加起来等于下注0.3。他说的不是bluff频率,是下注 ...

我又看了看,好像咱俩说的是一个意思,嘿嘿,不好意思
36#
dengxianqi 发表于 2015-8-9 09:13:00 来自手机 | 只看该作者
leisong 发表于 2015-8-9 03:26
我又看了看,好像咱俩说的是一个意思,嘿嘿,不好意思

不是,是我误解你的意思了。
37#
JCreeks11 发表于 2016-5-2 06:39:19 | 只看该作者
本帖最后由 JCreeks11 于 2016-5-2 09:59 编辑

首先必须赞赏楼主的文章。楼主花了很多时间,很用心。应该说,楼主文章的结论还是非常接近正确的结果的。下面指出文章里面的几个错误:

一、首先GTO的定义不应该是“使得对方无法通过改变策略来提高他的期望回报(ev)的策略”。由于定义不合理,导致后面出现了“B弃牌的策略会优于GTO”这样不合理的的结论。


GTO的定义应如下:针对A的策略S_A,B有最大化B的EV(EVB) 的策略S_B(S_A), 使得EVB(S_B(S_A))=max_{S_B}EVB(S_B|S_A)。而A的GTO策略S*_A,应该满足EVB(S_B(S*_A))=min_{S_A}(EVB(S_B(S_A)))。A的大部分GTO策略S*_A,都是使得EVB(S_B|S*_A)关于S_B的导数为0的。简单地说,A的大部分GTO策略,都使得B无论100%跟还是0%跟都没有区别,这和楼主的定义一样。但是有例外。比如当R非常接近1的时候,B是应该选择0%跟的。有兴趣的牌友可以验证一下。


如果没看懂,这就好比我要最大化一个函数,大部分函数这个最优点都在导数为零的点,但有时候也会在边界点取到最大值。而楼主相当于直接定义最优点是导数为零的值,这显然不合理。

二、在1中,F的”GTO值“(楼主定义下的)RX/(1+X-R-RX)并不是恒小于1的。事实上,当R=.9, X=1, 这个值等于4.5。F应该等于min(1, RX/(1+X-R-RX)。用我的定义可以得出这个值。有兴趣的牌友可自行验证。

三、在2中,X/(2X+1)并不是是A给B的底池赔率,X/(X+1)才是。当然这是小问题。更大的问题是楼主没有办法解释,A的EV是X的单调递增函数。也就是说,A下注越大越好,最好正无穷。这肯定不符合直觉。因为如果A的好牌比较多,R很大的时候,A还是希望下点儿注让B跟的。而A下注正无穷会导致B没法跟,永远拿不到价值。我这里省却数学推导,直接下结论:


当R>0.5,也就是A好牌比例大的时候,X的最佳下注额是(1-R)/(2R-1)。
当R<0.5,也就是A好牌比例不大的时候,A希望下注正无穷使得B没法跟。但前提是A用弱牌诈唬的概率不能超过R/(1-R)。
38#
 楼主| yyy6 发表于 2016-5-2 10:14:48 | 只看该作者
JCreeks11 发表于 2016-5-2 06:39
首先必须赞赏楼主的文章。楼主花了很多时间,很用心。应该说,楼主文章的结论还是非常接近正确的结果的。下 ...

首先谢谢你的仔细阅读。

一、首先GTO的定义不应该是“使得对方无法通过改变策略来提高他的期望回报(ev)的策略”。由于定义不合理,导致后面出现了“B弃牌的策略会优于GTO”这样不合理的的结论。

二、在1中,F的”GTO值“(楼主定义下的)RX/(1+X-R-RX)并不是恒小于1的。事实上,当R=.9, X=1, 这个值等于4.5。F应该等于min(1, RX/(1+X-R-RX)。用我的定义可以得出这个值。有兴趣的牌友可自行验证。



三、在2中,X/(2X+1)并不是是A给B的底池赔率,X/(X+1)才是。当然这是小问题。更大的问题是楼主没有办法解释,A的EV是X的单调递增函数。也就是说,A下注越大越好,最好正无穷。这肯定不符合直觉。因为如果A的好牌比较多,R很大的时候,A还是希望下点儿注让B跟的。而A下注正无穷会导致B没法跟,永远拿不到价值。我这里省却数学推导,直接下结论:

当R>0.5,也就是A好牌比例大的时候,X的最佳下注额是(1-R)/(2R-1)。
当R<0.5,也就是A好牌比例不大的时候,A希望下注正无穷使得B没法跟。但前提是A用弱牌诈唬的概率不能超过R/(1-R)。


一二三好像是一个问题,都是先界定边界条件还是后界定边界条件的问题。比如F(弃牌率)在0到1之间。比如对方的EV必须要>=弃牌ev。我们可以定义GTO为必须满足这些边界条件,那公式里面就到处都有MIN/MAX,也可以按我说的定义先求导,最后再看结论是否满足边界条件,像你说的第一点,既然B的GTO跟注ev还小于弃牌ev,那当然B只能弃牌。你说的二是一个意思。求出的对方弃牌率是4.5,那当然意味着对方100%弃牌就好。这并不影响任何推导和结论。

对第三点,在不先界定边界的时候,A的EV的确就是单调递增函数,R比例足够大的时候B的策略就是弃牌。也许你没看完,你说的结论我在原文里面都写了,R>0.5的时候R/(2R-1)-1,打开和你写的式子是一样的。而你说的”直觉“是个理解偏差。我们好牌足够多的时候,只需要下注这个底池赔率或以上都可以迫使对方对我们的整个range弃牌。我们不存在”希望“对方跟注,这都不是GTO应该使用的语言和思维方式。另,X(2X+1)和X(X+1)都可以表示底池赔率,个人使用的习惯不同而已,我习惯加上自己需要跟注的钱,因为这个概率跟胜率更好比较,比如X=1即对方POT下注的时候我的公式赔率是1/3,我们需要的胜率也是1/3.
39#
JCreeks11 发表于 2016-5-2 12:05:39 | 只看该作者
本帖最后由 JCreeks11 于 2016-5-2 12:35 编辑
yyy6 发表于 2016-5-2 10:14
首先谢谢你的仔细阅读。

一、首先GTO的定义不应该是“使得对方无法通过改变策略来提高他的期望回报(ev) ...

我刚才确实想错了,当R>.5时,X在(1-R)/(1-2R)或以上都是纳什均衡。因为这时候B的GTO决策都是0。当然如果B稍微偏离GTO,A的最佳下注量还是(1-R)/(1-2R)。

另外按照我的定义(就是博弈论中所谓minmax,当然这里纳什均衡必然存在,用minmax或者maxmin都是一样的),并不存在“GTO并不一定是对ev无影响,可能是提高我们的ev,也可能是降低我们的ev”一说。GTO一定是当假设对方是GTO玩家时,自己EV最高的。
40#
JCreeks11 发表于 2016-5-2 12:34:33 | 只看该作者
yyy6 发表于 2016-5-2 10:14
首先谢谢你的仔细阅读。

一、首先GTO的定义不应该是“使得对方无法通过改变策略来提高他的期望回报(ev) ...

楼主这里是把下注固定了,然后把诈唬率拉出来作为决策。如果把X和F都作为决策,假设X没有上限,可以发现无论R是多大,B的跟注率在纳什均衡下竟然都是0!

这个例子的现实意义是,当筹码非常深的时候,玩能拿到nuts的牌的重要性。只要你的range里有nuts,只有你的筹码足够深,只要你是GTO,对手就会被打到必须弃牌。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-12-22 20:41 , Processed in 0.046668 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部