智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: Howard
打印 上一主题 下一主题

出道题:KQJ 之No Limit局

[复制链接]
11#
竹林居士 发表于 2012-6-23 02:25:05 | 只看该作者
本帖最后由 竹林居士 于 2012-6-22 13:30 编辑

先看甲的策略:甲拿K一定CALL,拿J一定FOLD。

乙拿J bet%= x
甲拿Q call%=y

对甲分析6种情况
1、K vs Q                        EV1=1
2、K vs J                        EV2=(1+b)x + (1-x)=bx+1
3、Q vs K                        EV3=-yb
4、Q vs J                        EV4=xy(1+b) +(1-x)=1-x+xy+bxy
5、J vs K                        EV5=0
6、J vs Q                        EV6=0

对y求偏导数
-b+x+bx=0
x+bx=b

对乙分析6种情况
1、K vs Q                        EV1=(b+1)y+(1-y)=by+1
2、K vs J                        EV2=1
3、Q vs K                        EV3=0
4、Q vs J                        EV4=1
5、J vs K                        EV5=-bx
6、J vs Q                        EV6=-bxy+x(1-y)=x-xy-bxy

对x求偏导数
1-b-y-by=0
对b求偏导数
y-x-xy=0
y+xy=y

x+bx=b
1-b-y-by=0
x+xy=y

y=b
bb+2b-1=0
(b+1)(b+1)=2
b=sqrt(2)-1
y=sqrt(2)-1
x=b/(1+b)=1-sqrt(2)/2



解得:
b=sqrt(2)-1
y=sqrt(2)-1
x=1-sqrt(2)/2

得乙的最佳bet量b是0.41
拿J时29%时BET
甲拿Q时41% CALL

12#
zdy32167 发表于 2012-6-23 02:45:50 | 只看该作者
本帖最后由 zdy32167 于 2012-6-23 02:46 编辑
Howard 发表于 2012-6-23 01:05
推理、计算过程?


这不是填空题么?霍老师还要过程……
高中程度的计算实在不好意思拿出来
我等着吃饭的时候算的,有一些地方没有严格的证明

借用2L的式子(我自己用的是abc)
1/6*(3+b(y-x-xy)+x(1-y))
=1/6*(3+x-bx-y(x+xb-b))
其中b和x是乙决定的,y由甲来选择
固定了x和b后,EV函数是关于y的一次函数,应该在y=0或y=1时取最小值(这里有什么办法直接推出x+xb-b=0?我不会了)
两种情况下的EV函数分别为1/6*(3+x-bx)和1/6*(3+b-2bx)
我们要找出其中较小一个的最大值。
因为两个函数关于x和b的单调性是相反的,因此最大值出现在他们相等的这条线上(仍然很ugly,等达人解答)
由x-bx=b-2bx得x=1-1/(1+b), bx = b-x = b-1+1/(1+b)
1/6*(3+b-2bx) = 1-1/6*[(1+b)+2/(1+b)]<=1-1/3*sqrt(2),当1+b=2/(1+b)即b=sqrt(2)-1~=0.414的时候取等号,对应的bluff频率x=1-1/(1+b)=1-sqrt(2)/2~=0.293,EV为1-1/3*sqrt(2)~=0.528,跟甲call的频率无关。
13#
notch 发表于 2012-6-23 12:47:58 | 只看该作者
本帖最后由 notch 于 2012-6-23 13:12 编辑
竹林居士 发表于 2012-6-23 02:25
先看甲的策略:甲拿K一定CALL,拿J一定FOLD。

乙拿J bet%= x


我之前认为乙的ev应该是有个极值
但这个值和x,y相关,和b无关

如果按照optimized game来解释,那就是说乙定了x,b以后,甲无法靠改变y来获利
把公式改一下
y(b-bx-x)+x-bx
那么就是应该使b-bx-x=0,且x-bx有最大值
x=b/(b+1)
x-bx=b/(b+1)-b^2/(b+1)=b(1-b)/(1+b)在b>0的范围内有极大值
求导数不在行,估计竹林的结果是对的
14#
zdy32167 发表于 2012-6-23 13:30:12 | 只看该作者
notch 发表于 2012-6-23 12:47
我之前认为乙的ev应该是有个极值
但这个值和x,y相关,和b无关

y(b-bx-x)+x-bx
那么就是应该使b-bx-x=0,且x-bx有最大值

这一步我一直不知道是怎么得出来的,包括以前看霍老师的文章也有过这样的疑问,是不是我的知识里缺了什么内容,能不能帮我详细解释一下?
如果有另一组x1,b1,使得y的系数b1-b1x1-x1不为0,使得甲可以通过改变y来使EV有最小值,但这个最优的EV仍然大于x-bx,那通过让b-bx-x=0得出的不就不是最优策略了么?
比方说,如果EV的表达式正好是y(b-bx-x)+100x-bx怎么办?是说有什么判定的原则什么的么?
15#
notch 发表于 2012-6-23 14:23:56 | 只看该作者
zdy32167 发表于 2012-6-23 13:30
y(b-bx-x)+x-bx
那么就是应该使b-bx-x=0,且x-bx有最大值

说实话自己没仔细想过这一点的证明
只是觉得应该如此
试证明如下:

这是一个y的一次函数y: [0,1]
如果b-bx-x>0,那么y取0为极小值,x-bx
b>(b+1)x,所以x<b/(b+1)
代入上式,得极值为x-bx=x(1-b)<b(1-b)/(1+b),后面这个公式在b=sqr(2)-1时最大为3-2sqr(2)
那么当b-bx-x>0时,该值不可能大于3-2sqr(2)

如果b-bx-x<0,那么y取1为极小值,b-bx-x+x-bx=b-2bx
同样得x>b/(b+1),代入得
b-2bx=b(1-2x)<b(1-b)/(1+b)
也和之前的结论相同

所以只有当b-bx-x=0的时候,该式有极值b(1-b)/(1+b)

如果公式变了,意味着题目的条件也变了
按照你写的公式,意味着当你bet的时候,你有一个100的额外收入
这么一来结论当然也不一样了
16#
zdy32167 发表于 2012-6-23 15:27:59 | 只看该作者
notch 发表于 2012-6-23 14:23
说实话自己没仔细想过这一点的证明
只是觉得应该如此
试证明如下:

这样的证明好像跟你之前的思路不太一样
你之前好像是一步得出来的,就像是引用了什么定理
比方说f(b,x,y) = y*g(x,y) + h(x, y), 当满足xxx条件时当y=0时有极值……如果这样的话,x的系数是1还是100根本就是一样的。我自己的步骤也像你后面的帖子一样,还不如你严密,而且看上去更像一个偶然,而无法像你前一个帖子一样好像一步得出结果,所以如果你是用了什么我不知道的方法,还望不吝赐教
17#
notch 发表于 2012-6-23 22:50:24 | 只看该作者
zdy32167 发表于 2012-6-23 15:27
这样的证明好像跟你之前的思路不太一样
你之前好像是一步得出来的,就像是引用了什么定理
比方说f(b,x,y) ...

当时的思路是因为说要optimized strategies,也就是说无论y怎么变,都不影响结果
所以直接出了那个系数=0
并没有想得很细

看到你的回帖后想说你的说法也好像有道理
于是反过去重新证明了一下
18#
 楼主| Howard 发表于 2012-6-24 16:40:57 | 只看该作者
本帖最后由 Howard 于 2012-6-25 02:48 编辑

我就不说什么了,只有佩服。zdy32167和竹林的回帖我认真学习了,虽然看起来比较吃力,基本上还是看懂了,完全正确!

尤其是竹林的11楼回帖,清晰、明确、思路顺畅。说实话跟Bill Chen书上的计算方法不同,但我认为竹林的方法更清晰,更容易理解,要胜过原书的解答方法。

而zdy兄等吃饭的时间就能计算出来,更是让我叹服不已。两位的数学造诣实在是比我高不少。

竹林兄一举解答出了x y b 三个值。其中y=b=sqrt(2)-1。而题目已经表明,甲是无法靠改变y获利的,也就是说,y是多少其实没有关系。那么为什么y还有固定的值呢?因为如果甲和乙都知道对方策略的话,甲就只能用y=sqrt(2)-1,这样他才可以说自己的策略是GTO的,乙无法靠改变x来获利。如果甲不使用sqrt(2)-1,那么他call的频率或者高,或者低。高了,乙就never bluff J,也就是x=0%;低了,乙就always bluff J,也就是x=100% 。 所以,甲要使用这个固定的y值,才能说自己是GTO
19#
zdy32167 发表于 2012-6-25 01:56:27 | 只看该作者
Howard 发表于 2012-6-24 16:40
我就不说什么了,只有佩服。zdy32167和竹林的回帖我认真学习了,虽然看起来比较吃力,基本上还是看懂了,完 ...

关于y的部分学习了,多谢
霍老师的溢美之词让我太惭愧了
运气不好的时候等吃饭是要等很久的……
主要的困难在于没有纸笔,因此答案基本是靠猜的,中间跳过了不少步骤
您要是说我算错了,我还得老老实实回家慢慢算……
20#
 楼主| Howard 发表于 2012-6-25 02:46:53 | 只看该作者
zdy32167 发表于 2012-6-25 01:56
关于y的部分学习了,多谢
霍老师的溢美之词让我太惭愧了
运气不好的时候等吃饭是要等很久的……

你给出根号2减一的正确答案我就吃了一惊,但是没有立刻说正确,因为怕打击后来回答问题的人积极性,同时也确实想看看你是怎么算的。这个我真得承认,我光凭心算是算不出来的
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-12-30 00:56 , Processed in 0.047164 second(s), 8 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部