|
本帖最后由 JCreeks11 于 2016-5-2 09:59 编辑
首先必须赞赏楼主的文章。楼主花了很多时间,很用心。应该说,楼主文章的结论还是非常接近正确的结果的。下面指出文章里面的几个错误:
一、首先GTO的定义不应该是“使得对方无法通过改变策略来提高他的期望回报(ev)的策略”。由于定义不合理,导致后面出现了“B弃牌的策略会优于GTO”这样不合理的的结论。
GTO的定义应如下:针对A的策略S_A,B有最大化B的EV(EVB) 的策略S_B(S_A), 使得EVB(S_B(S_A))=max_{S_B}EVB(S_B|S_A)。而A的GTO策略S*_A,应该满足EVB(S_B(S*_A))=min_{S_A}(EVB(S_B(S_A)))。A的大部分GTO策略S*_A,都是使得EVB(S_B|S*_A)关于S_B的导数为0的。简单地说,A的大部分GTO策略,都使得B无论100%跟还是0%跟都没有区别,这和楼主的定义一样。但是有例外。比如当R非常接近1的时候,B是应该选择0%跟的。有兴趣的牌友可以验证一下。
如果没看懂,这就好比我要最大化一个函数,大部分函数这个最优点都在导数为零的点,但有时候也会在边界点取到最大值。而楼主相当于直接定义最优点是导数为零的值,这显然不合理。
二、在1中,F的”GTO值“(楼主定义下的)RX/(1+X-R-RX)并不是恒小于1的。事实上,当R=.9, X=1, 这个值等于4.5。F应该等于min(1, RX/(1+X-R-RX)。用我的定义可以得出这个值。有兴趣的牌友可自行验证。
三、在2中,X/(2X+1)并不是是A给B的底池赔率,X/(X+1)才是。当然这是小问题。更大的问题是楼主没有办法解释,A的EV是X的单调递增函数。也就是说,A下注越大越好,最好正无穷。这肯定不符合直觉。因为如果A的好牌比较多,R很大的时候,A还是希望下点儿注让B跟的。而A下注正无穷会导致B没法跟,永远拿不到价值。我这里省却数学推导,直接下结论:
当R>0.5,也就是A好牌比例大的时候,X的最佳下注额是(1-R)/(2R-1)。
当R<0.5,也就是A好牌比例不大的时候,A希望下注正无穷使得B没法跟。但前提是A用弱牌诈唬的概率不能超过R/(1-R)。
|
|