智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: Howard
打印 上一主题 下一主题

扑克的本质笔记(1-15)

  [复制链接]
11#
撲克夢 发表于 2009-10-15 13:48:24 | 只看该作者

扑克的本质笔记(1-15)

"我们看看UTG。他有K,可以bet,希望BU拿Q去call,BU拿J一定扔牌。UTG也可以check,希望引诱拿Q的对方bet,然后自己insta call。"

上面那句的後半應該是不成立的
UTG拿K如果CHECK,BU拿Q在任何情況下也不會BET的
因為這個BET一定是-EV

但是UTG還是可以CHECK,希望對手拿J bluff而不是拿Q BLUFF
所以會有的動作如下
拿K BET, CHECK, CALL
拿Q CHECK,CALL
拿J  BET,CHECK



排除了以上4个低级错误,其实留给玩家的选择已经不多了,我们看看UTG。他有K,可以bet,希望BU拿Q去call,BU拿J一定扔牌。UTG也可以check,希望引诱拿Q的对方bet,然后自己insta call。如果UTG有J,他最自然的选择当然是check,如果BU bet他就insta fold;当然他也可以bluff bet,希望对手是Q并可能fold。
12#
 楼主| Howard 发表于 2009-10-15 20:30:46 | 只看该作者

扑克的本质笔记(1-15)

多谢多谢,原文后半句写错了,应该是“引诱拿J的对方bluff”才对。我刚才在原文修正了一下。
"我们看看UTG。他有K,可以bet,希望BU拿Q去call,BU拿J一定扔牌。UTG也可以check,希望引诱拿Q的对方bet,然后自己insta call。"

上面那句的後半應該是不成立的
UTG拿K如果CHECK,BU拿Q在任何情況下也不會BET的
因為這個BET一定是-EV

但是UTG還是可以CHECK,希望對手拿J bluff而不是拿Q BLUFF
所以會有的動作如下
拿K BET, CHECK, CALL
拿Q CHECK,CALL
拿J  BET,CHECK




[quote="Howard":2mprcikq]

排除了以上4个低级错误,其实留给玩家的选择已经不多了,我们看看UTG。他有K,可以bet,希望BU拿Q去call,BU拿J一定扔牌。UTG也可以check,希望引诱拿Q的对方bet,然后自己insta call。如果UTG有J,他最自然的选择当然是check,如果BU bet他就insta fold;当然他也可以bluff bet,希望对手是Q并可能fold。
[/quote:2mprcikq]
13#
leeker 发表于 2009-10-15 22:48:11 | 只看该作者

扑克的本质笔记(1-15)

好久不来,来了能看到这种有内涵的帖子,真好


好久以来一直想学点逻辑方面的知识,希望楼主有空讲讲
14#
 楼主| Howard 发表于 2009-10-16 05:59:34 | 只看该作者

扑克的本质笔记(1-15)

上一集说要先研究一下BU在不同情况下的决策问题。因为BU的决策比UTG要简单一点,他只有两个决策需要做。第一,他拿J的时候,bluff的频率,我们拿q1表示。第二,他拿Q的时候,他call的频率,我们拿q2表示。注意当BU拿K的时候他没有什么决策好做的,100%或者bet或者call就行了。q1和q2都是从0到1的数。

UTG的情况要稍微复杂一点,他要做三个决策。第一,他拿J的时候bluff的频率,用p1表示;第二,他拿Q的时候call BU的bet的频率,用p2表示;第三,他拿K的时候bet的频率,用p3表示。

有人说,p3=1。UTG拿K还不肯定bet啊?不一定。假如UTG偷偷看到了BU的牌是个J,那么他的最佳策略就是check,希望引诱bluff。

好,现在我们有5个变量,UTG有三个p1 p2 p3,BU有两个q1 q2。这5个都是频率(概率,我混用两个词),他们5个完全决定了两者的策略。

现在定义一下两者的EV。我们把EV定义为双方Anti 100之后的EV。也就是说,那100块钱的anti算作sunk cost,不算成我们的支出。200块钱的底锅不属于任何一个玩家。例如,UTG check, BU bet, UTG fold。我们就给UTG记0,给BU记+200.

对于UTG和BU来说,他们的牌的情况总共有P(3,2)=6种,我们下面把所有6种情况一一列出进行分析。好不容易琢磨这么一个简单的游戏,就是为了能用最简单最有效的方法:穷举啊!每个玩家他有四个可能的结果:或者输100,或者赢200,或者赢300,或者0.  当双方check-check时输的那一方收益就是零。零收益对我们的计算没有影响,因此我们只需要考虑非零收益的三个结果。

-------------回头再写(3)---------------回来了-----

情况之一,UTG 是个J,BU是个Q。如果UTG bluff,并且被call了,他-100,发生的概率是p1q2 (p1是UTG bluff J的概率,q2是BU call Q的概率)。如果UTG bluff 成功,BU扔牌,他+200,概率是p1(1-q2)。如果UTG直接check,我们已经知道BU一定也check,UTG 收益0,就不算概率了。

情况之二,UTG有J,BU有K。这种情况UTG只有一种非零收益的可能就是-100,发生在他bluff的时候。概率是p1.

情况之三,UTG有Q,BU有J。UTG必然check。BU在1-q1的概率下随后check,UTG收入+200. 另外BU也可能Bluff被UTG call,概率为q1p2,此时UTG -300.

情况之四,UTG有Q,BU有K。此时UTG注定赢不了任何的锅,他只可能输100,当他call的时候。概率为p2

情况之五,UTG有K,BU有J。此时若UTG成功引诱bluff,收益+300,概率(1-p3)q1。其他任何时候UTG都是收益+200,概率为1-(1-p3)q1.

情况之六,UTG有K,BU有Q。如果UTG bet,BU可能call,UTG收益+300,概率为p3q2. 其他任何时候UTG都是收益+200,概率为1-p3q2.

这六种情况是均匀分布,每种概率都是六分之一。现在就可以把UTG所有情况下的权重EV简单相加,得到他的最终总EV。这个加起来的式子相当的长,写出来大概是这样的:

100/6 * (-p1q2-p1-q2) + 100/6 (2p1 - 2p1q2 +6 -4q1 + 2p3q1 - 2p3q2) + 100/6 (3p2q1 + 3q1 -3p3q1 + 3p3q2)

这个式子写出来,恐怕耐着心看到这里的朋友们都想起了伟大的墙的话:数学对扑克有用,沉迷于数学则误入歧途!于是终于愤愤得关上这个帖子。没关系,任何公式您都可以跳过,只看结论也无伤大雅。反正这些东东也是自己写着玩的。但是我确信,结论还是能对您有一定的吸引力的。

刚才这个公式是UTG在post anti的EV,单位是元。为了简化,我们把单位变成100元,就把100全都消掉了。我们还要变成pre-anti,也就是玩牌之前的EV,于是在公式后面-1. 再合并一下同类项,变成下面这个公式

UTG的EV (100$) = 1/6  * [ p1(1-3q2) + p2(3q1-1) + p3(q2-q1) -q1]

我们把p1, p2, p3看成自变量,把q1,q2看成他们的系数。我们会发现一个奇怪的现象:如果q1和q2都是1/3的话,三个自变量的系数都成了0,公式就变成 UTG的EV = -1/18, 而不取决于p1, p2,和p3.

这也就是说,如果BU以1/3的概率bluff J,以1/3的概率call Q,那么碰管你UTG怎么玩,我保证你UTG平均每一把输1/18 (个100元)。真是太奇妙了,BU只要用这种打法,无论UTG怎么玩,只要他不犯低级错误,他们的收益都是固定的。无论UTG拿J全bluff,还是全fold;无论拿Q全call,还是全checkfold,谁也不会多赢,谁也不会多输. UTG以每手牌十八分之一的速度稳定向BU送钱。
15#
 楼主| Howard 发表于 2009-10-17 01:00:53 | 只看该作者

扑克的本质笔记(1-15)

上集说到如果BU把自己的策略定于q1=q2=1/3,其结果就是他的EV固定是1/18,无论UTG怎么玩。我们把q1=q2=1/3成为BU的“中立策略”

如果BU偏离了这个中立策略,他就是在某种意义上“犯错误”,因为UTG可以通过选取合适的“对应策略”来使自己的EV提高到-1/18以上,甚至高于零。

举几个例子来说明这个问题。假如BU拿J的时候Bluff太少,而拿Q的时候call的太少。这相当于正常扑克局里面的tight-timid类型玩家。Phil Hellmuth不是刚刚进城吗,咱就用他的话说。他把所有玩家分为老鼠、大象、野狼、狮子,和老鹰。分别对应tight-timid, calling station, loose-aggressive, rock, 和good player。Phil天下第一自负,当然自诩老鹰。说实在的我非常的不喜欢他,不是因为他自负或者牌技之类的问题,而是他在牌桌上经常不尊重对手,口出秽言肆意污蔑。不过人家是站长请来的客人,咱一届小鱼跟人家战绩没法比,只有高山仰止,远远观望的份。

我靠又跑题了,刚才假设BU是老鼠,bluff太少,call太少。再进一步假设他call的比bluff的还少(算是一只疑神疑鬼的,给对方太多credit的老鼠)。所以我们有q2 < q1 < 1/3。这个时候UTG应该怎么办呢?我们再回忆一下UTG的EV公式

UTG的EV  = 1/6 * [ p1(1-3q2) + p2(3q1-1) + p3(q2-q1) -q1]    (单位:100$)

我们看到,p1的系数大于零,p2的系数小于零,p3的系数小于零。UTG的对应策略就出来了:让p1=100%, p2=p3=0。翻译成白话文,就是拿到J的时候肆无忌惮的,张牙舞爪的100% bluff;拿到Q的时候如果面临bet,想都不要想就扔牌。拿到K的时候一律check,引诱对方bluff。

UTG的EV (对方是疑神疑鬼的老鼠) = 1/6 * [ -q1 -3q2 + 1]

因为q2 < q1 < 1/3,所以上面公式中UTG的EV一定是大于-1/18的,搞不好还要大于零。比如,当q2=1/6,q1=1/4,这时候UTG的EV就等于1/24。

反过来站在BU的角度看,如果UTG是大象,也就是passive的calling station怎么办?我们先看看大象有哪些漏洞。大象有好牌的时候也不bet,我们假设UTG的p3=0。BU聪明的看到了这一点,并决定bluff概率为1/6,也就是q1=1/6。

-----待续----------继续---------------

以前我都是用五笔,现在改用google拼音了,经常会有错字出现,还请原谅。

前文说了假设UTG是大象,永远check K,所以p3=0。如果这时候BU拿了个J,BU就开始想了,UTG不是Q就是K,当他拿K的时候永远check,所以他拿Q和拿K的概率是相等的都是1/2。在他拿K的那一半里,我bluff也没用;在他拿Q的那一半里,我应该以一定概率bluff。bluff多少呢?根据死磕兰斯基的定理,我bluff 100,以取得200的锅,我需要正好bluff 100/(200+100)= 1/3。但是这是指UTG拿Q的一半里面的1/3,所以我总体上应该bluff 1/6。

BU认为自己很聪明,根据“UTG永远check K”的额外信息做了这个bluff 1/6的决定。想不到他已经犯错了!UTG不用改变他永远check K 的做法,就可以盈利。我们再来看看,UTG的EV公式为

UTG的EV  = 1/6 * [ p1(1-3q2) + p2(3q1-1) + p3(q2-q1) -q1]    (单位:100$)

现在已知的是p3=0,只要UTG选择永远不bluff J, 也永远不call Q, 也就是p1=p2=p3=0的话,UTG的EV就是 1/6 * (-1/6) = -1/36。虽然还是负的,但是已经比-1/18要好。button是轮流的,当UTG转到BU的时候可以使自己q1=q2=1/3以获得1/18的收益,这样他一回合下来总收益就是 -1/36 + 1/18 = 1/36,他赚大了。

总的说来,BU就是q1=q2=1/3,以稳赚1/18的EV。
16#
建设2008 发表于 2009-10-17 06:21:03 | 只看该作者

扑克的本质笔记(1-15)

呵呵,虽然有些我还看不太懂,但是受教了,多谢楼主!
17#
PROPK 发表于 2009-10-17 11:50:29 | 只看该作者

扑克的本质笔记(1-15)

学习了。好帖!
18#
pokerfan 发表于 2009-10-17 13:56:43 | 只看该作者

扑克的本质笔记(1-15)

楼主的理论没大明白。 但这段感受很真切。 别翻成e文 [s:149]
"天下第一自负,当然自诩老鹰。说实在的我非常的不喜欢他,不是因为他自负或者牌技之类的问题,而是他在牌桌上经常不尊重对手,口出秽言肆意污蔑。不过人家是站长请来的客人,咱一届小鱼跟人家战绩没法比,只有高山仰止,远远观望的份。"
19#
entropy 发表于 2009-10-18 21:38:20 | 只看该作者

扑克的本质笔记(1-15)

别的没什么,就是觉得楼主把计算机看的太弱了,ualberta大学的软件就足够在这论坛上横扫了 [s:178]
20#
yoking 发表于 2009-10-18 22:17:19 | 只看该作者

扑克的本质笔记(1-15)

没什么文化,两年前为了做一个小项目,去图书馆借了几本博弈论的书。译著的往往前几十页都看明白,后面就傻了。国内的基本是找古今中外智慧小故事、小寓言来充数,跟于丹的心灵鸡汤差不多。

顶贴兼拿周赛资格。 [s:146]
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-12-25 21:47 , Processed in 0.048137 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部