智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 29093|回复: 53
打印 上一主题 下一主题

河牌下注/跟注的GTO策略

[复制链接]
跳转到指定楼层
1#
yyy6 发表于 2015-1-23 17:20:24 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
模型假设
1,我们假设在河牌的时候玩家A的手牌范围已经极化,而玩家B的牌力只能赢所有A的诈唬。
2,不管是A没有位置先考虑bet,或者B在前位先过牌给A,我们假设这里最多只有一次下注和一次跟注(即不考虑玩家B在前位下阻断注或者B在后位加注A的下注)。
3,通过前面的action。A和B都大概知道这里A的强弱牌比例。

设:
河牌下注前的底池大小为1.
A的下注大小为X(如果下注)
A的强牌比例为R
A的弱牌诈唬频率为F
B的跟注频率为Y(显然R/F/Y都在0和1之间)

我们现在讨论:
1,玩家A的GTO策略

对不熟悉GTO的玩家再提一下,GTO是使得对方无法通过改变策略来提高他的期望回报(ev)的策略。在这里对方B的策略只涉及到以什么频率跟注来试图抓A的诈唬。显然A的所有强牌都必须下注,所以我们实际上是在计算A的弱牌诈唬频率,即F为多少时,可以使得不管B以什么频率Y跟注B的期望回报(ev)都相等。列出B的ev:

a)A放弃诈唬过牌,B直接赢下底池,ev:(1-R)*(1-F).
b)A诈唬下注X,B跟注,ev:(1-R)*F*Y*(X+1)
c)A价值下注X,B跟注,ev: R*Y*(-x)
d)  A诈唬/价值下注X,B弃牌,ev:0. 我们以这里为ev的参考临界点。选择其他临界点不影响结论。

所以B的ev是(1-R)*(1-F)+(1-R)*F*Y*(X+1)-R*Y*X

我们求F使得上面Y的系数为0(这样不管Y多少B的ev相等,即B无法通过改变策略来改变ev),得到A的GTO诈唬频率为:F = RX/(1+X-R-RX)。这时候B的ev就是(1-R)*(1-RX/(1+X-R-RX))

比如A的强牌比例只有20%(R=0.2),而河牌他下注了1个底池(X=1),那么从这个式子可以得出他的GTO诈唬频率应该是12.5%. 而B的ev为0.7.注意到由于A的强牌比例只有20%,在下注前底池为1的时候B的ev是0.8,也就是A通过下注压缩了B的ev。这里有很多人对GTO有一个误区认为GTO是不增加自己ev的行为。实际上从这里可以看出A通过GTO的下注频率提高了自己的ev。

2,玩家B的GTO策略

同理,B的GTO策略是使得A无法通过调整A的诈唬频率来改变A的ev。我们只需要列出A的期望式:

a)A放弃诈唬过牌,B直接赢下底池,ev:0.以此为ev参考点
b)A诈唬下注X, B跟注,ev:(1-R)*F*Y*(-X)
c)A价值下注X,B跟注,ev:R*Y*(X+1)
d) A诈唬/价值下注X,B弃牌,ev:(R+(1-R)*(1-F))(1-Y)

所以A的ev是(1-R)*F*Y*(-X)+R*Y*(X+1)+(R+(1-R)*F)(1-Y) (可以验证A的ev和上面B的ev和为1,即底池的现有死钱

同理,我们解出Y使得F的系数为0,得到B的GTO跟注频率为Y = 1/(1+X).这时候A的ev就是R(2-1/(1+X))

注意这里正好与A的强弱牌比例无关。如果河牌A的下注正好是一个底池,B的GTO跟注频率就是50%(这里我看过一个ISSAC HAXTON的采访他也提到过这个频率,当时没算,现在算是验证了)。而A的ev是1.5R。

细心的读者要问了,如果A这里强牌比例高达90%,他下注了一个底池,B还要去跟注吗?按照定义,跟注50%在这里仍然是GTO。A的ev为1.5×0.9=1.35,不会因为A的bluff频率F改变。但是显然从提高B的ev(压缩A的ev)来说B简单100%弃牌给A的下注就可以。这时候Y=0,A的ev是 R+(1-R)*F=0.9+0.1F。可见A可以通过提高诈唬频率F到100%来“剥削”B,所以B的策略不是GTO。但是即使F=1,他的ev也是1(即拿下现有底池),对方的ev也比1.35要低。那么当A的强牌比例超过多少的时候B应该100%弃牌呢?很简单,数学上看使上式中Y的系数为正即可(设F=1,因为这时候即使A诈唬100%他的弱牌我们也弃牌),即B的跟注频率Y越大,A的ev会越高,可以得出R>=(X+1)/(2X+1).或者说A的弱牌<=1-R=X/(2X+1), 注意,X/(2X+1)正好是A给B的底池赔率。所以当A给出的底池赔率大于他的弱牌比例的时候。B弃牌的策略会优于GTO,这也符合我们的直觉。


这里进一步强调上面的观点,GTO并不一定是对ev无影响,可能是提高我们的ev,也可能是降低我们的ev。

现在我们有双方的GTO策略,那么我们可以来看当某一方偏离GTO的时候另一方针对性策略是什么。

3,玩家A的针对性策略

从两个式子来看A的ev是关于F的单调函数。当B的跟注频率过低即Y<1/(1+X)时,A需要诈唬100%(F=1)达到最大EV。回到最开始假设的例子,如果下注一个底池(X=1),A的强牌比例是0.2,而B的跟注频率<50%的时候A需要诈唬100%,这时候A的ev是1-1.4Y。我们从上面知道当A用GTO策略的时候B的ev为0.7,即A的ev为1-0.7=0.3.因为这里Y<0.5,所以A的ev>0.3且随着Y的减少增大。针对性策略的ev应该永远不小于GTO的ev。


反过来,如果B的跟注频率过高即Y>1/(1+X),我们需要从不诈唬自己的弱牌(F=0),这时候A的ev是R+RYX。回到这个例子变为0.2+0.2Y.因为Y>0.5,所以A的ev同样大于0.3,且随Y的增加而变大。


我们再进一步研究一下A的下注大小X。

a)如果B使用的是GTO策略,我们知道A的ev是R(2-1/(1+X)),是一个对X的单调递增函数。所以A的策略应该是进行最大的下注(NL里面就是ALL IN,PL里面为下注一个pot即X=1).在这样的情况下如果X无限大,A的ev能达到2R。但是我们上面讨论过的边界条件限制了B不会在赔率不够的情况下跟注,所以当R>=0.5时,A只需要根据R来下一个赔率刚好的X就可以,即X=R/(2R-1)-1,并且下注100%的时候。这时候A的ev永远都是1.在POT LIMIT的情况下显然A应该用X=1,这时候A的最大EV是1.5R.

b)如果B偏离GTO。我们知道B的GTO跟注频率应该是1/(1+X), 这里我们需要假设B的偏移的函数形式。再代入A的ev公式对X进行求导使得我们能得出X的最合理值使得A的ev最大化。

举个例子,假设B的跟注频率是1.2/(1+X),显然他跟注太多,我们这里转为从不诈唬。然后将F=0,Y=1.2/(1+X)代入A的ev公式变为:2.2R - 1.2R/(1+X),在这个简单的假设下是一个对于X的单调函数,那么我们这里还是下最大的可能注。在POT LIMIT的情况下EV变为1.6R。而X非常大的时候EV可以达到2.2R。

4,玩家B的针对性策略

从B的ev式子里面可以看出是关于Y的单调函数。所以当A的诈唬频率高于F = RX/(1+X-R-RX)时,B简单的跟注所有下注。比如我们的例子X=1,R=0.2如果A的诈唬高于12.5%的话B的ev变为0.6+0.8F>0.7.当F=1的时候ev可以达到1.4.

反过来如果A的诈唬频率过低。B简单的对所有下注弃牌,Y=0,ev变为(1-R)*(1-F).回到上面的例子,R=0.2,如果F=0,B的ev来到0.8,实现了他的全部死钱价值。

希望通过这个简单的模型加深大家对GTO的理解。这方面国外或者国内很可能有类似或者更系统的讨论,我也懒得去做literature research,如有雷同,纯属巧合。如有错误或者遗漏的地方,欢迎大家批评指正。



评分

1

查看全部评分

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏14
56#
l_icem 发表于 2016-7-29 21:04:51 | 只看该作者
再次拜读。真不愧我扑克圈最大的偶像YYY6
55#
伟大的墙 发表于 2016-7-4 11:47:46 | 只看该作者

顶起来看
54#
小胖 发表于 2016-7-3 17:29:18 | 只看该作者

老墙咋的啦?
53#
伟大的墙 发表于 2016-7-3 14:25:50 | 只看该作者
这里呢
52#
bomb 发表于 2016-5-5 12:07:26 | 只看该作者
JCreeks11 发表于 2016-5-5 11:45
我没说清楚。结论是:

筹码无限深的情况下,有a%nuts牌的一方,最多可以用a%的烂牌bluff走对方,对方没 ...

我是看了你40楼关于"现实意义"的结论跟过来回帖的。我觉得实战中通常不宜假设只有己方才可能有nuts。另外关于最多可以掩护a%的烂牌咋呼也是因为己方牌力极化的假设,实战中肯定远远高于a%。
51#
JCreeks11 发表于 2016-5-5 11:45:42 | 只看该作者
bomb 发表于 2016-5-5 11:33
你的意思是说,如果两个玩家都玩GTO,筹码无限深的情况下,可以互相把对方无条件打fold?那到底是谁fold ...

我没说清楚。结论是:

筹码无限深的情况下,有a%nuts牌的一方,最多可以用a%的烂牌bluff走对方,对方没有任何办法。
50#
bomb 发表于 2016-5-5 11:33:36 | 只看该作者
JCreeks11 发表于 2016-5-5 11:09
诈唬率F可以调整使得对方无法跟啊。我不是说了F和X都是决策吗。

你的意思是说,如果两个玩家都玩GTO,筹码无限深的情况下,可以互相把对方无条件打fold?那到底是谁fold啊?
49#
JCreeks11 发表于 2016-5-5 11:31:05 | 只看该作者
yyy6 发表于 2016-5-5 11:26
对啊。你调整F的意思不就是不能100%诈唬吗?假设我们rep的强牌只有10%,即使你是100倍pot all in。F也大概 ...

这个我同意,1%的nuts最多只能“掩护” x/(x+1)%的bluff。

其实两极分化的问题还是比较容易解决的,难的是还有中间的牌。
48#
 楼主| yyy6 发表于 2016-5-5 11:26:33 | 只看该作者
JCreeks11 发表于 2016-5-5 11:09
诈唬率F可以调整使得对方无法跟啊。我不是说了F和X都是决策吗。

对啊。你调整F的意思不就是不能100%诈唬吗?假设我们rep的强牌只有10%,即使你是100倍pot all in。F也大概只有11%多一点而已。另外80%的时候我们只能过牌放弃,所以不是range里面有nuts就有那么美好的,
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-11-24 06:44 , Processed in 0.049542 second(s), 11 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部