智游城

标题: GTO(所谓的“博弈论最优”)通俗版 [打印本页]

作者: RichZhu    时间: 2015-11-29 11:00
标题: GTO(所谓的“博弈论最优”)通俗版
GTO这个词汇大概是过去两年中文扑克界使用频率最高的技术词汇了。奇怪的是,随着这个词汇的逐步大众化,越来越多的人却在问同一个问题:到底什么是GTO?好像谁都听说过,但问起来又没有什么人给个实在的答案。

上个月,一位业内知名的牌手在微博上这样问道:“有谁很认真的研究过GTO理论?求你们的解答…”。我是被旁人提示去看的这个微博里面的回复,看过后就想写一个GTO的通俗版。前几天,我那篇关于AK的帖子又被翻出来,争论的还很激烈,回复之余我又想起了GTO,因为八竿子打不着的地方,回帖的人也要小心地解释一下,自己说的最佳“不是GTO那个最佳”。可以说,GTO这个词汇不但本身被用得越来越乱,还殃及到其它技术词汇的正常使用,到了必须要“说道说道”的地步。

下面我就尽量使用人类听得懂的语言解释这个神话般的GTO。

(一)什么是GTO

GTO是英文Game Theory Optimal的缩写。那么Game Theory Optimal翻译成中文是什么呢?随便查一下网络上的英汉字典不难知道:“Game Theory”是“游戏理论/博弈论/对策论”的意思,而“Optimal”是“最佳的/最优的/最理想的”意思。所以“Game Theory Optimal”很自然地会被翻译成:博弈论最优,至少这是百度翻译给出的,此外还有“最优游戏策略”等等类似的翻译。

问题是,到目前为止,所有这些翻译给我们普通人带来的正常理解,跟GTO理论本身的含义,是不同的,这是GTO给大多数人带来困惑的首要原因。这样,我们只能回头来,先不用管它中文怎么称呼,看看GTO到底是什么意思。

在博弈论中,有一个非常著名的纳什均衡理论,(Nash Equilibrium) 大意是说:在非合作类博弈中,存在一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。

如果上面的表述还显得饶舌,没关系。在游戏理论讨论中,英文常常还有一个非常平民化的词组来替代Nash Equilibrum,叫unexploitable strategies。跟GTO不同,这个词组直译没有问题,就是:不被(对手)压榨的策略,或者说最佳防守策略。

GTO算是纳什均衡的另一个别名,不过它只是近些年在扑克理论界得到使用,跳出这个圈子,基本上没人知道。即便是扑克圈子,有些人也根本不用,还有些人用这个词汇,只是因为字母少,写起来方便。总之,这个词汇本身并没有任何新的含义或学术价值。

(著名数学家、博弈论创始人约翰纳什因其发现/证明纳什均衡而获得诺贝尔经济奖,他也是奥斯卡最佳影片《美丽心灵》的原型。他和夫人半年前遇车祸过世。笔者在此对纳什先生表示深深的敬意)


作者: RichZhu    时间: 2015-11-29 11:57
(二)为什么GTO如此流行

经常会听到GTO狂热爱好者给你讲述GTO的两大优点:

1)使用了GTO,不管对手多么厉害,他都奈何不了你,你绝对不会吃亏。这个直觉上好像很容易理解,根据定义,对手单方面更改自己的策略不会带来任何好处,那你自然不会吃亏了。

2)当你使用GTO,而对手偏离GTO,他不但占不了你的便宜,还可能吃亏。

这两点结合在一起就厉害了。

如果仅仅是第一点,充其量不过是金钟罩、铁布衫之类的,没多大意思。谁学功夫只是为了不被人打死?

但这第二点就不同了,对手不但伤不了你,还可能因为想伤害你而自残。你都不用出招应变,对手就会一点点内力全失,无疾而终。金钟罩、铁布衫直接升级为葵花宝典。

不得不承认的是,跟欧美牌手相比,国人牌手多了一些浪漫和疯狂,少了一些理性与思考,所以会更经常地看到一些大白天做扑克梦的牌手,他们最大的愿望就是找到一条成为绝顶高手的捷径。这样,就没有什么比葵花宝典更有吸引力的了。

所以过去两三年凭空冒出一堆所谓的学院派或者代表当今最先进打法的大神,开口闭口GTO。要是碰巧招生做培训,招生简章第二段才提到GTO,那肯定是秘书大意出错了。

作者: Howard    时间: 2015-11-29 12:38
这篇谁敢跟我抢沙发跟谁急。必须先占座学习
作者: 同花顺    时间: 2015-11-29 13:01
葵花宝典太难了,先弄个铁布衫就行。
作者: 我是Jsli    时间: 2015-11-29 13:21
必须说道说道
作者: RichZhu    时间: 2015-11-29 13:30
Howard 发表于 2015-11-29 12:38
这篇谁敢跟我抢沙发跟谁急。必须先占座学习

这帖子你占沙发,我先跟你急!

作者: RichZhu    时间: 2015-11-29 13:31
同花顺 发表于 2015-11-29 13:01
葵花宝典太难了,先弄个铁布衫就行。

要不改练僻邪剑谱?

作者: RichZhu    时间: 2015-11-29 13:34
我是Jsli 发表于 2015-11-29 13:21
必须说道说道

还不确定能说道到哪儿呢?俺胆小。

作者: 我是Jsli    时间: 2015-11-29 13:58
维基百科-納什均衡點
納什平衡(英语:Nash equilibrium),又稱為非合作賽局平衡,是在非合作賽局(Non-cooperative game)狀況下的一個概念解,在博弈论中有重要地位,以约翰·納什命名。

如果某情況下無一參與者可以通过獨自行動而增加收益,則此策略組合被稱為納什均衡點[1]。

例子
其經典的例子就是囚徒困境。囚徒困境是一个非零和博弈。大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。如果两人均不招供,将最有利,只被判刑半年。于是,两人同时陷入招供还是不招供的两难处境。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡点。这时,个体的理性利益选择是与整体的理性利益选择不一致的。

基于经济学中“理性经济人”的前提假设,两个囚犯符合自己利益的选择是坦白招供,原本对双方都有利的策略不招供从而均被判刑半年就不会出现。事實上,这样两人都选择坦白的策略以及因此被判两年的结局被稱作是“纳什均衡”(也叫非合作均衡),換言之,在此情況下,無一參與者可以「獨自行動」(即單方面改變決定)而增加收穫。

学术争议和批评
第一,纳什的关于非合作博弈论的平衡不动点解(equilibrium/fixpoint)学术证明是非构造性的(non-constructive),就是说纳什用角谷静夫不动点定理(英语:Kakutani fixed point theorem)证明了平衡不动点解是存在的,但却不能指出以什么构造算法如何去达到这个平衡不动点解。这种非构造性的发现对现实生活里的博弈的作用是有限的,即使知道平衡不动点解存在,在很多情况下卻找不到,因此仍不能解决问题。

第二,纳什的非合作博弈论模型仅仅是突破了博弈论中的一个局限。一个更大的局限是,博弈论面对的往往是由几十亿节点的庞大对象构成的社会、经济等复杂行为,但冯·诺伊曼和纳什的研究是针对两三个节点的小规模博弈论(有人称之为tiny-scale toy case)。

这个假设的不完善处,可能比假设大家都是合作的更严重。因为在经济学里,一个庞大社会里的人极不可能全部都是合作的,非合作的情况通常在庞大对象的情形中更普遍,而在两三个节点的小规模经济中倒反而影响较小。既然改了合作前提为非合作前提,却仍然停留在两三个节点的小规模博弈论中,这是一个不可忽视的缺陷。MIT的一位计算机科学博士生的博士论文[2]——获得2008年度美国计算机协会学位论文奖——认为经济学家的推测是错误的,找到纳什均衡点是几乎不可能的事。 目前担任MIT电机工程和计算机科学系助理教授的Constantinos Daskalakis与 UC伯克利的Christos Papadimitriou、英国利物浦大学的Paul Goldberg合作,证明对某些博弈来说,穷全世界所有计算机之力,在整个宇宙寿命的时间内也计算不出纳什均衡点。Daskalakis相信,计算机找不到,人类也不可能找到。纳什均衡属于NP问题,Daskalakis证明它属于NP问题的一个子集,不是通常认为的NP-完全问题,而是PPAD-完全问题。这项研究成果被一些计算机科学家认为是十年来博弈论领域的最大进展。

不過在同一篇論文裡,Daskalakis也指出,在參與者匿名的情況下,則僅需多項式時間即可逼近纳什均衡。

相關鏈接       
《Non-Cooperative Games》,约翰 · 纳什 , The Annals of Mathematics 1951
Alfredo ougaowen最后编辑于6月前

作者: 我是Jsli    时间: 2015-11-29 14:01
我是Jsli 发表于 2015-11-29 13:58
维基百科-納什均衡點
納什平衡(英语:Nash equilibrium),又稱為非合作賽局平衡,是在非合作賽局(Non-co ...

别说我歪楼呵
我是对这句话不理解,谷歌一下原意
纳什均衡理论,(Nash Equilibrium) 大意是说:在非合作类博弈中,存在一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。



作者: 我是Jsli    时间: 2015-11-29 14:50
本帖最后由 我是Jsli 于 2015-11-29 15:46 编辑

根据上面纳什均衡理论
扑克游戏中是否有gto?

这里以现金HU来说明
1.双方必须从自身利益为出发点.
2.双方对自身利益有明确的判断,并且可以自愿执行.
3.双方的行为对双方产生的利益相等.

双方筹码一样多,双方永远都不弃牌
这个是不是纳什均衡

当然因为扑克室的抽水
所以双方不打牌才是对双方最有利的
就好像2个罪犯都不承认犯罪
作者: 我是Jsli    时间: 2015-11-29 15:43
刚才在路上把扑克中有关对gto认识的一个现象想明白了

再回到这个例子
其經典的例子就是囚徒困境。囚徒困境是一个非零和博弈。大意是:一个案子的两个嫌疑犯被分开审讯,警官分别告诉两个囚犯,如果你招供,而对方不招供,则你将被立即释放,而对方将被判刑十年;如果两人均招供,将均被判刑两年。如果两人均不招供,将最有利,只被判刑半年。于是,两人同时陷入招供还是不招供的两难处境。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡点。这时,个体的理性利益选择是与整体的理性利益选择不一致的。

这里有2点:
1.两个囚犯地位条件对等。设想如果其中一位的爹叫李钢,这个囚犯指定不认罪,因为他爹李刚能摆平.
2.双方自愿达成了这个平衡,任何一方试图不认罪都可能将自己置于更坏的境地.

而扑克双方条件是不对等的
大白话就是扑克水平有差别

所以现实扑克中
双方都愿意把把不弃牌这个纳什均衡的情况不会出现
双方都会想方设法脱离这个平衡

作者: starbit    时间: 2015-11-29 18:07
请教一下老大 知不知道matthew janda的
对他有什么评价吗

我觉得GTO就是追求一种平衡的打法从而不被对手剥削

当对手的打法是不平衡的时候
你也可以跳出GTO  也可以打得不平衡从而去剥削他的
作者: taiji18    时间: 2015-11-29 18:55
学习
作者: haoqianruhaose    时间: 2015-11-29 20:32
能举点例子么?
作者: jimmyking    时间: 2015-11-29 23:48
對於這種通俗的討論,非常的適合我,所以也來說幾句。

我想gto用在撲克中,最通俗的說法,就是“你吹我唔脹策略”。

即是你沒好的對付我的辦法。

例子:一個岩石型的玩家在河牌下注,而且是一個嚴肅的下注如pot size,你對付他的策略很簡單,只是要簡單的棄牌。差不多你拿到2nd nuts才考慮一下,那些第五/第六nuts馬上棄。

所以岩石型不是gto。同理,把把下注亦不是gto。

就以下注而言,gto就是一個黄金比例,有value bet亦有bluff bet,對手不可以簡單全跟又或者全棄來處理,這樣對手無所適從。

另外,跟注亦一樣,你不能全是拿著很強的牌(如2nd到6th nuts)才跟注,否則對手只要把把下注對付你即可。

gto其實是平衡策略,平衡到洽到好處,對方吹你唔脹。

大學之道,在明明德,在親民,在止於至善。

gto,就是止於至善。

我們做的每個決定,包括check/bet/raise/reraise/fold都平衡得很好,就是gto,讓對手難以觸摸。

問題是這個平衡得很好,是一個概念,這裏非常複雜。

因為不同對手,理論上黄金比例不一樣,而且多幾個對手又會不同,而對手不同時段不同狀況又會有影響。

所以,gto 只是理論上的追求。

明乎此,就會知道pre flop raise AK是一個難以定論的課題。
作者: RichZhu    时间: 2015-11-30 00:47
我是Jsli 发表于 2015-11-29 15:43
刚才在路上把扑克中有关对gto认识的一个现象想明白了

再回到这个例子

囚徒困境中是有很多假设/简化的,比如你你招供了,不会一出监狱就因为背叛被同伙打死,自然也不能附带上另一个人的爸爸是李刚。

话说回来,如果罪犯A知道罪犯B的爸爸是李刚,不会认罪,他怎么选择?(假设他出狱了,李刚也不能把他怎么着)

他还是应该选择认罪,因为这样他就会被立刻释放,而李刚之子被判十年(他爸把他捞出去算另案处理)

这个例子的有趣之处在于,整体上说,双方都不招供是对双方最好的结果(只判半年),但这个最佳结果却实现不了,双方都坐2年监狱是“合理的”结果。

这个平衡应该说是各自为自己利益最大化做的选择,尽管每个人都知道有对双方更好的结果,所以与其说是“自愿”,不如说是“被迫”,多少有些害人害己,但又不能不害的意思。

看得有点糊涂的朋友可以看一下囚徒A的选项,就明白了:

A做决定的时候,知道B只有两个可能:招供,和不招供。

如果B招供,A选择不招供,会被判10年;A选择招供,只判2年。招供比不招供强。

如果B不招供,A选择不招供,A被判半年;A选择招供,立刻释放。还是招供比不招供好。

也就是说,从A的角度看,不管B怎么选择,他招供都比不招供结果好,所以他只能招供。

同样的道理,B也只能选择招供。这样就达到双方都判2年的结果。

作者: RichZhu    时间: 2015-11-30 00:59
starbit 发表于 2015-11-29 18:07
请教一下老大 知不知道matthew janda的
对他有什么评价吗

不知道这个人。

只知道他写了一本书,Applications of no limit holdem. 这本书我没看,只看了一下简介和评语。虽然是2+2出版,我一直对2+2比较信任,但还是不推荐大家看。

有人会说,你看都没看,怎么会推荐不推荐的?我只能说,这类书有两种可能,一种是写得真好的,对1%的读者会有帮助,另外99%的读者是浪费时间和买书的钱。另一种是写的不好的,对所有人都是浪费。

这书都出版两年了,如果是前者,业界会有不少后续的讨论,所以前者的可能性不大。

当然,我不能完全肯定。但打牌的人一般做决定都是基于不完全信息,做不完全确定的决策。

作者: RichZhu    时间: 2015-11-30 01:04
haoqianruhaose 发表于 2015-11-29 20:32
能举点例子么?

到目前为止,还只是陈述事实,后面如果大家不明白,可以一起讨论例子。

作者: RichZhu    时间: 2015-11-30 01:07
taiji18 发表于 2015-11-29 18:55
学习

我写这篇文章的一个原因,就是希望像你这样的好同志,可以放心使用“最佳应对”这样的描述,而不用担心这个词汇像帝都的空气一样,被轻度污染。

作者: RichZhu    时间: 2015-11-30 01:31
jimmyking 发表于 2015-11-29 23:48
對於這種通俗的討論,非常的適合我,所以也來說幾句。

我想gto用在撲克中,最通俗的說法,就是“你吹我唔 ...

确实,GTO基本上是理论上的追求,至少对大多数人如此。所以,我对招生简章大谈GTO非常不能理解。

极少数的人确实可以研究GTO,通常有两类人:一类是学者或程序员,不管是学术还是商业目的,这类研究是以大量计算为基本前提的,也是希望能更广泛甚至最终整体上解决这个问题。另一类是网络高级别现金局牌手,但也只是试图解决很小一部分特殊情况,比如你提到的河牌下注的问题。

话说,现在这些扑克上使用gto解决的东西,都不太好意思叫GTO,因为这些东西的模型,在GTO或者纳什均衡之前就已经存在了。打个比方,你非要说牛顿第二定律是伯克利物理教程的东西,我也不能说反对,因为它确实在里面。但我一般会说,牛顿第二定律是初中物理的内容。

所以,我不反对GTO,就如同我不反对牛顿第二定律一样。

作者: 同花顺    时间: 2015-11-30 02:30
RichZhu 发表于 2015-11-29 10:47
囚徒困境中是有很多假设/简化的,比如你你招供了,不会一出监狱就因为背叛被同伙打死,自然也不能附带上 ...


这个平衡应该说是各自为自己利益最大化做的选择,尽管每个人都知道有对双方更好的结果,所以与其说是“自愿”,不如说是“被迫”,多少有些害人害己,但又不能不害的意思。

这段话写得好。我理解:GTO包含如下策略,就是最大限度地害人,最小限度地害己。不去追求对双方更好的结果,否则不赌是对双方更好的策略,因为有抽水。
作者: taiji18    时间: 2015-11-30 03:14
RichZhu 发表于 2015-11-30 01:07
我写这篇文章的一个原因,就是希望像你这样的好同志,可以放心使用“最佳应对”这样的描述,而不用担心这 ...

,谢谢

作者: RichZhu    时间: 2015-11-30 04:03
同花顺 发表于 2015-11-30 02:30
这个平衡应该说是各自为自己利益最大化做的选择,尽管每个人都知道有对双方更好的结果,所以与其说是“ ...

关于GTO的说法,有时候要小心一些。它最初并没有说明是指零和游戏这一部分,所以害人和害己的关系并不那么直接和必然。

由于这些年只有扑克界在真正使用GTO这个词,所以很多人也就默认指的零和游戏了。但即便是零和游戏,害人和害己的关系在多于两个玩家时,仍然复杂。实际讨论中,GTO逐步退让,它表现的内容越来越窄,现在的研究基本上就是局限于两人对打的部分特殊情形。

作者: RichZhu    时间: 2015-11-30 05:09
(三)GTO这个词汇的是与非

本文开头说了,GTO这个词汇不但本身被用得越来越乱,还殃及到其它技术词汇的正常使用,这里咱们就真的豁出去“说道说道”吧。

GTO这个词汇在扑克界的流行,一般认为,罪魁祸首是Mathematics of Poker(扑克的数学). GTO具体是谁最先使用的无从考证,只是在MoP之前,扑克界就有人使用,在扑克界使用之前,游戏理论界就有人使用,这些都是可以查到的。但业内开始流行使用,却是始于MoP,而在扑克界之外,现在也没有什么人使用。

前面说过,目前能查到的GTO这个词汇的中文翻译对刚接触这个词汇的玩家都有很强的误导,这一点不能完全怪翻译的人,因为英文本身就带有很强的误导作用,也就是说,不但中文玩家对这个词汇理解产生困惑,美国英国加拿大澳大利亚玩家也有这个困惑。究其原因,就是GTO(Game Theory Optimal)中的这个"Optimal"有点让人头痛。在2+2等英文论坛中,很多人质疑,也有些人在争论数学家和经济学家在词汇使用上的理解和习惯不同等等,越扯越远。

鉴于本文是通俗版,咱就不整这些没有用的了。简单说,大家一致的意见是,GTO这个词汇不好,容易引起大多数思想单纯的玩家的误解。不同的是,一部人悲观的认为生米已经煮成熟饭,也只能吃了;另一部分人认为可以将错就错,以后就用GTO这个词汇,不再是是什么的缩写,就是标准用词,不想再看到"optimal"在这种地方出现。

《扑克的数学》作者之一,Jerrod Ankenman,在各种场合多次表达了对自己使用GTO这个词汇的悔恨。他高调地说:如果当初我知道这本书真的有人会看,甚至还会真的谈论扑克,我肯定会使用"equilibrium"这个词(而不是使用"optimal"这个词),这样大家就不用头痛了。

Ankenman不知道,在遥远的东方,他的用词不慎,给广大扑克爱好者带来更大的麻烦。不但翻译起来困难,更糟糕的是,在对Optimal一词误解的基础上,进一步的发挥创造。

我看到的最经典,最顽固,也是最好笑的,是GTO狂潮中产生的一个词汇和解释,以及它的流传广度和时间长度,就是“EO(Exploitatively Optimal)”这个词组。把“Exploitatively Optimal”输入到google,你不会得到搜索结果,但如果你百度这个英文词组,却可以看到搜索结果。如果作者理解了GTO的含义,根本就不应该有“EO”这个词,“exploitative”跟“optimal”是矛和盾、白天和黑夜的关系,无法一起构成一个有意义的词组。

咱们华人牌手自己创造的英语词汇,然后又缩写下来“出口转内销”介绍给了华语扑克界,不能不让人感叹国人想象力之丰富。可是在使用之前,不能网上随便验证一下英文中是否有这个词组的用法吗?我曾经在论坛和微博等多处指出不要使用这个英文词组,因为实在是说不过去,但在本文开头提到的微博留言里我还是又一次看到了这个用法和解释。可见错误的东西,一旦流行,是很难纠正的。

写到这里,我们回到本文最初的梦想之一,就是不要让GTO再来干扰其它跟GTO无关的词汇和讨论。

这里倡议,我们也可以像老外建议的那样把GTO当作一个专有名词,不要再使用各种翻译。或者,我们也可以翻译成“不被剥削策略”,甚至可以勉强使用更吸引眼球的“最佳防守策略”。这样当我们讨论牌局的时候说“这是我认为的最佳策略”,我们指的是EV最大的选择,或者是BR允许下EV最大的选择,诸如此类人类能正常理解的普通用法,也就不用诚恐诚惶地解释此“最佳”非彼“最佳”。

必须说明的一点,虽然GTO这么劣迹斑斑,但至少它客观上帮助传播了扑克理论和吸引更多玩家关注这个理论的探讨,这个“不慎”的用词还是在某些方面起了积极的作用。当然,网络扑克的发展,即便没有GTO这个词汇,扑克理论上的研究和应用也是会不断提高的,就如同没有moneymaker扑克boom也会出现一样。但GTO这个词用到今天,确实应该说清楚,有个了断了。

我希望GTO一词引起的混乱到此为止,这样我们下面就可以踏踏实实地开始讨论GTO的内容与应用了。当然,因为GTO不再据有极其吸引眼球效应的说法而不想了解GTO实质的,可以跳过本文剩余内容,直接到广告页面。(广告在制作过程中,马上回来)。






作者: 同花顺    时间: 2015-11-30 05:50
同花顺 发表于 2015-11-29 12:30
这个平衡应该说是各自为自己利益最大化做的选择,尽管每个人都知道有对双方更好的结果,所以与其说是“ ...

我有下列想法,不知是否可行。
GTO是一个庞大的系统,而绝大多数城友感兴趣的只是一个很小的子集。
GTO->扑克GTO->德州扑克GTO->无限注德州扑克GTO。
我猜测:无限注德州扑克GTO占GTO的比例是相当小的,但关注无限注德州扑克GTO的人数却不会比关注GTO的人数少许多。
扑克以外的游戏,如赛马、21点、百家乐、...,这些游戏的GTO绝大多数城友是不感兴趣的。
我觉得讨论一个非常小并且作用大的子集的方法是可取的。
作者: 我是Jsli    时间: 2015-11-30 06:15
[attach]5365[/attach]


作者: 我是Jsli    时间: 2015-11-30 06:22
这样当我们讨论牌局的时候说“这是我认为的最佳策略”
我们指的是EV最大的选择,或者是BR允许下EV最大的选择
---------------
朱老大这句话解决了我一个长时间对扑克的困惑

EV最大选择-hero不同,最佳策略是相同的唯一的
BR允许下EV最大的选择-hero不同最佳策略不同

作者: maomaobiao    时间: 2015-11-30 10:34
老大挖坑了,我当然要跳,虽然姿势比较奇怪。

首先,我是反对动辄就提GTO的,GTO本身的原意可能是寻找动态平衡中的一个均衡策略点,这是我读老大的帖子体会到的。但是,

1)老大首先指出了,由于扑克游戏的变化多样,在一个动态变化的平衡中(即使是两人对局),这样的均衡可能是很容易被打破的,这就不存在某种意义上的金钟罩铁布衫。而这中最优的策略本身就涉及到针对性的调整的反应速度,每个人调整的速度和反应时间又是不同的,所以很可能寻找这样的均衡点,很可能是一厢情愿的举动。

2)即使在一个相当简化的模型,如囚徒困境中,也存在一个与现实严重不符合的假设,就是信息是封闭而不开放的。很多人注意到了囚徒困境中的“不合作”原则,这个原则运用的前提就是,对于两个囚徒而言,信息是封闭的,他们不可能知道对手的策略,也不能互动。先说囚徒困境,这其实无伤大雅,因为两个囚徒知不知道对方的策略,除非可以商量合作,否则最优解其实都是一定的。但是回到现实中来,我们是要把“不合作”与“信息封闭”当作两个条件来看的。因为在扑克这种博弈规则中,“不合作”可以认为是普遍适用的原则(极少的情况除外),但是“信息封闭”却是不存在的情况。博弈的双方在错综复杂的情况下,都或多或少地知道对方的策略,甚至为了迷惑对手,故意showdown bluff的情况屡见不鲜。在这样的原则下,寻找GTO,为什么对手就不能有GTO呢?奇怪,好像回到老大的思路上去了,就是GTO到底是矛还是盾,能不能以子之矛攻子之盾呢?相信大家心里都有自己的答案。

3)在许多简单的对局里,运用GTO其实是可行的。至于叫什么名字,就无所谓了吧。

作者: maomaobiao    时间: 2015-11-30 10:39
RichZhu 发表于 2015-11-30 07:09
(三)GTO这个词汇的是与非

本文开头说了,GTO这个词汇不但本身被用得越来越乱,还殃及到其它技术词汇的正 ...

没错equilibrium 是动态的平衡,optimum 是最优的方案,二者其实差别很大。

作者: 我是Jsli    时间: 2015-11-30 12:14
maomaobiao 发表于 2015-11-30 10:34
老大挖坑了,我当然要跳,虽然姿势比较奇怪。

首先,我是反对动辄就提GTO的,GTO本身的原意可能是寻找动态 ...

毛表哥包括吉米这里对纳什均衡有误解(这里不说gto)
纳什均衡不是矛与盾的问题
是互斗的双方可以处于一个互利的状态

作者: 我是Jsli    时间: 2015-11-30 12:25
我是Jsli 发表于 2015-11-30 12:14
毛表哥包括吉米这里对纳什均衡有误解(这里不说gto)
纳什均衡不是矛与盾的问题
是互斗的双方可以处于一个 ...

两个傻瓜HU
把把都不弃牌最接近扑克的纳什均衡
因为这个状态双方中的一方损失最小

作者: 伟大的墙    时间: 2015-11-30 12:36
我是Jsli 发表于 2015-11-30 12:25
两个傻瓜HU
把把都不弃牌最接近扑克的纳什均衡
因为这个状态双方中的一方损失最小

老李神解读

作者: maomaobiao    时间: 2015-11-30 12:39
本帖最后由 maomaobiao 于 2015-11-30 14:40 编辑
我是Jsli 发表于 2015-11-30 14:14
毛表哥包括吉米这里对纳什均衡有误解(这里不说gto)
纳什均衡不是矛与盾的问题
是互斗的双方可以处于一个 ...

这个“互利”的说法也是不准确的,因为

1)双方都不知道对方的决策,也不能商量

2)决策的标准只是对自己有利,所谓有理性的经济人

我提到的矛与盾是在2)的基础上针对GTO粉丝宣扬自己的说法(存在“无法被打败,无法被挖掘更大价值”的策略)提出质疑的方案,而并不是质疑GTO或者纳什均衡本身。

作者: whitegloves    时间: 2015-11-30 14:08
能否解释成在实际操作中我们尽量追求赢得每手我们能拿下的牌,当然每手牌的打法都可能不一样。 但是在整个session中应该保持一定的动态平衡。比如open、raise、cbet的频率等等。
按照您说的 线下如果我读出了对手一定范围的手牌 其实我的针对策略就是当前的GTO 除非能遇见的我的某些平衡形象的行为对未来有超大的隐含赔率  
作者: taiji18    时间: 2015-11-30 20:43
GTO不是我的痛点,其实是个痒点,楼主解释清楚了,省的以后从脑子里冒出来,又要想又弄不清楚,本人数学差。
作者: jimmyking    时间: 2015-11-30 22:03
我是Jsli 发表于 2015-11-30 12:25
两个傻瓜HU
把把都不弃牌最接近扑克的纳什均衡
因为这个状态双方中的一方损失最小

都幾白癡。難得有人埋沒良心加持!



作者: jimmyking    时间: 2015-11-30 22:18
例子:HU,對手all in 6個bb,你有12個bb拿27o,根據納什該如何?是不是call?

笑死人冇命賠。
作者: jimmyking    时间: 2015-11-30 22:22
業餘者的悲哀!
作者: 我是Jsli    时间: 2015-12-1 02:01
伟大的墙 发表于 2015-11-30 12:36
老李神解读

墙爷
德州不就是弃牌的game吗

在其它条件相同的前题下
双方无限时间内都不弃牌
两个牌手只损失抽水吧

作者: RichZhu    时间: 2015-12-1 02:07
(四)GTO的困境

两年前,我在yy语音开免费公开课。在我回答学员提问时说:GTO这个概念还是要知道的,而且需要理解并在实战中有意识地应用,但并不需要把太多时间用在GTO上,否则路就走偏了,不值得。当时一位学员直接问我:“你懂GTO吗?我的教练就是靠GTO在PS高额桌赚钱,4bb/100手。”

请相信,这是我听到的关于GTO的一个比较低调的版本,大概对方觉得我免费讲课也不容易,说话给了点面子。人家这样客气,我就不知道该说什么了。不是所有的人都愿意或者能够接受你的好意,何必坏了人家的美梦呢?

我对GTO的保留态度是有原因的。当然我们说GTO的时候,需要区分两种情况:一种是简单的GTO概念和应用,原则上是一种定性的东西,上课的时候充其量花几分钟解释一下,更多的是处理牌的时候,比较“务虚”的考虑;另一种则是GTO原理指导下的具体操作策略,更多的是定量的东西。我在跟牌手交流时,对后者一直持谨慎和保守的态度是基于以下几点考虑:

1)GTO并非是真正的金钟罩

很多人忽略了纳什均衡里“那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处”的另外一层含义,就是如果不是单方面更改自己的策略,那么这些更改的人未必不会得到好处。所以,游戏中两位或更多位串通,可能给GTO策略使用者带来损失,自然GTO并不是真的不可打败。

需要说明一点,实际牌局中,并不需要两个骗子合谋,更常见的是玩家无意中偏离GTO。即便是无意的,GTO不可战胜的前提也已经不存在了,这在理论上跟蓄意欺骗也没什么本质的区别了。

所以,人们谈论GTO,常常限于两人对打,因为不存在第三方“搅局”的问题。但因此,GTO的用途也大大地打了折扣。

2)扑克多数情况下并非零和游戏

即便是两人对打,你至始至终使用GTO,结果会怎样?你可以保证对手不赢,但却不能保证自己不输,因为有抽水。或者说这实际上是一个准三人的游戏,牌室是一个傀儡玩家,只不过这个傀儡是个貔貅,只进不出,你必须做到从对手那里赢到的超过自己贡献给貔貅的,才能盈利。GTO只保证你这可怜孤独的对手赚不到你的,并不能承诺你可以从对手那里赚到足够支付貔貅的,自然也就不能保证你不输了。

3)知道GTO的存在和知道它是什么不是一回事

好了,你说你专攻heads up,而且可以找到不抽水的局,那是不是就终于可以畅快淋漓地使用GTO,证明你才是东方不败?不幸的是,还不行,而且是非常的不行。

尽管纳什理论上证明了包括扑克在内一系列游戏的纳什平衡是存在的,但对扑克而言,这个平衡策略是什么,绝大多数情况下,或者说任何常见牌局,还没有人(或机器)解答出来。

年初的时候,阿尔伯塔大学的一组研究人员发布了一个GTO扑克应用,这是个有限扑克两人对打,很多人天真地以为无限德州扑克的GTO计算机应用会很快解决。其实有限德州和无限德州在计算量上的差别是天文数字,两者根本无法相比。就像围棋,9路围棋很容易解,但19路围棋二三十年下来,重赏之下,还是没有一个可以达到职业初段水平的程序。有限德州和无限德州的差异要远远大于9路和19路围棋的差异,即便是两人对打的无限德州GTO求解也还早着呢。。

4)人脑不是机器

即便有一天常见的扑克牌局有了GTO解法,并不等于说,我们能够在牌局中使用。比如说前面提到的有限德州GTO的程序应用,即便所有相关信息都摆在面前,人脑也是根本不可能完成这些记忆和运算的,连万分之一也做不到,更不用说无限德州了。

换句话说,你不要指望有一天看到某个天才或者有特异功能的人,在wsop终桌上表演着GTO,除非wsop修改规则,允许机器人参赛,而这样的机器人在有生之年,各位恐怕也是看不到的。何况真要是机器人参赛,wsop也该改名称了。

5)人不是机器

没错,4)和5)虽然一字之差,我要表达的意思却是完全不同的。

对于大多数牌手来说,打牌只是娱乐、交友,对他们来说GTO绝对不应该占用他们显著的时间,无聊,痛苦,也无效。

那么少数把扑克当成职业的,是否要花时间在GTO应用上面?这少数中的大多数仍然不该把时间放在这种地方,原因却是,这些职业、半职业牌手需要追求最大效率的赢钱,而不是毫无意义的“不可战胜”。

我们必须明白一点,当一个bot可以通过“伪GTO”战胜抽水的时候,它就具有实战价值,因为它可以不吃不喝不睡,几乎不消耗任何东西去积累盈利。但职业牌手不可以,你不但不能一直保持24/7的稳定发挥,就是简单连续打牌也做不到。你要有各种消耗,你还可能需要承担家人的消费,甚至你们未来退休金的积累。所以职业牌手第一追求的永远是赚钱的效率,而不是吹牛的资本(这里暂不考虑吹牛可以折现的情况,太复杂了)。平均每小时盈利低于某一下限,就无法支撑下去。所以对于一个职业牌手来说,寻找对手的弱点最大利益化要远比花大力气修补自己不明显的漏洞现实得多。

我比较确定自己还漏掉一些理由。单单考虑上面这些,我劝大多数牌手,尤其那些上入门课的新人,不要把精力和梦想放在GTO上面,也算是可以理解的吧?

作者: RichZhu    时间: 2015-12-1 02:25
“GTO的困境”这部分,我有些犹豫,想等到第5部分写完一起发。

我写这个主题的目的,并不是要把GTO说得一无是处,只是对中文扑克界在GTO理解和应用方面普遍存在的混乱和误导谈一下我自己的看法,希望至少对部分玩家多少有些帮助,少走些弯路。

我最近比较忙,不太确定下一部分什么时候写出啦,所以就把这部分发出来了。下一部分,准备谈一下到底哪些人在GTO这一点上花多大精力才是比较理性的。我也可能根据大家讨论的内容做些修正,毕竟这个题目太广了,而每个人在这方面的基础差异又很大。


作者: RichZhu    时间: 2015-12-1 03:23
同花顺 发表于 2015-11-30 05:50
我有下列想法,不知是否可行。
GTO是一个庞大的系统,而绝大多数城友感兴趣的只是一个很小的子集。
GTO-> ...

无限德州的GTO完全求解你我此生大概是看不到了。正好写到“GTO的困境”,也算是回复你这个问题了。

作者: Howard    时间: 2015-12-1 05:13
RichZhu 发表于 2015-11-30 13:23
无限德州的GTO完全求解你我此生大概是看不到了。正好写到“GTO的困境”,也算是回复你这个问题了。
...

无限德州GTO完全求解,肯定不可能了。现实中我们只能简化到很简单的步骤,才有计算能力范围之内的解。
现在正在看一本HU NLHE的书,感觉可以列出一些问题的解。比如符合如下几个game:
1. HU, SB Shove/Fold Only,深度不限。
2. HU,SB Fold/Min-raise/Shove,大盲fold/call/Shove,深度不限。
3. HU,SB Fold/Raise/Shove,BB Fold/Shove,深度小于8BB。

其共同特点就是全都是pre-flop game。flop之后的还不敢涉及,太复杂

作者: maomaobiao    时间: 2015-12-1 06:19
jimmyking 发表于 2015-11-30 01:48
對於這種通俗的討論,非常的適合我,所以也來說幾句。

我想gto用在撲克中,最通俗的說法,就是“你吹我唔 ...

又看了一遍富贵和Jimmy的帖子。

尤其是这一楼,很赞!大道至简啊

作者: taiji18    时间: 2015-12-1 07:24
一个游戏讨论到这种程度,颇有感慨,无解,譬如人生宇宙的种种,对人生、科技、科学的求知与一知半解…我这时反倒有一点坦然、释然的感觉。无解、不确定…也许正是让人盲目与无奈、妄动与自持、放纵与自肆、迷蒙与洞察、、
作者: taiji18    时间: 2015-12-1 07:32
深邃与着迷的种种的缘由。无解,很多时候我们在胡打,犹然生傲慢与偏见,固执与凌人。我曾说说过,你再聪mibg
作者: taiji18    时间: 2015-12-1 07:39
明也未必如牌,未必如人。信息不明,盲目无解,犹秉烛夜行,摸石过河,战战兢兢,不能快意随行,也是醉了
作者: taiji18    时间: 2015-12-1 07:41
不能快意随行,或纵马奔驰,或登高一呼,也是醉了。
作者: 我是Jsli    时间: 2015-12-1 07:41
本帖最后由 我是Jsli 于 2015-12-1 07:52 编辑
taiji18 发表于 2015-12-1 07:24
一个游戏讨论到这种程度,颇有感慨,无解,譬如人生宇宙的种种,对人生、科技、科学的求知与一知半解…我这 ...

都有解了也就不会有耶稣释迦牟尼默罕默德

作者: 我是Jsli    时间: 2015-12-1 07:44
taiji18 发表于 2015-12-1 07:41
不能快意随行,或纵马奔驰,或登高一呼,也是醉了。

太级这么大感触干啥
不就是一个gto吗

作者: lililili11    时间: 2015-12-1 11:31
RichZhu 发表于 2015-12-1 02:07
(四)GTO的困境

两年前,我在yy语音开免费公开课。在我回答学员提问时说:GTO这个概念还是要知道的,而且 ...

这5点太赞了。

作者: youngtercel    时间: 2015-12-1 13:26
我是Jsli 发表于 2015-11-29 15:43
刚才在路上把扑克中有关对gto认识的一个现象想明白了

再回到这个例子

这个例子是纳什均衡的一个通俗的例子,但我认为是一个不好的例子。尽管逻辑上似乎无懈可击。但我们有必要从源头上分析,是否本身的条件设置即指向了这个结果。

首先,我们必须假设博弈规则制定者(这里算是警方)制定的规则有合理性和一致性。可以被理解的出发点是,第一,警方至少需要一份供词才能定罪,第二,如果有人主动招供的话,警方必须给予优待。第三,如果主动招供的人多的话,根据市场的稀缺性原则,优待条件将贬值。
在这种规则下,我们假定基准刑期为10年。
如果均不招供,只能都释放
如果有一个人招供,则此人减为两年,另一人10年。
如果两人都招供,则两人都判5年。

容易看出,这种情况下就没有直观的平衡点。但如果双方都是理性的人(单一追求自己的利益最大),是容易达到共赢点的。
因为设想行动有先后的话,如果一方不招,那他明白对方必然会选择不招。如果他招,他也明白对方必然会选择招供。所以策略是大家都不招。

而原例子中,不合理地地把优待条件调到极致(无罪释放),而以后不合理地将不能定罪的情形(都不招供)加上半年刑期。这种对系统的OVERTUNE导致了一个所谓的(非最佳)平衡点,从而给人造成一种有简单共赢却无法达成的悖论景象。






作者: taiji18    时间: 2015-12-1 16:17
我是Jsli 发表于 2015-12-1 07:44
太级这么大感触干啥
不就是一个gto吗

主要看到无解这个词,触动浮想联翩,人生很多难题啊

作者: taiji18    时间: 2015-12-1 16:20
我是Jsli 发表于 2015-12-1 07:41
都有解了也就不会有耶稣释迦牟尼默罕默德

据载,释祖对于宇宙是有限还是无限的之类的问题也是不回答的

作者: 我是Jsli    时间: 2015-12-2 05:41
扑克是门科学
扑克不是艺术
作者: RichZhu    时间: 2015-12-2 06:50
youngtercel 发表于 2015-12-1 13:26
这个例子是纳什均衡的一个通俗的例子,但我认为是一个不好的例子。尽管逻辑上似乎无懈可击。但我们有必要 ...

囚徒困境是一个模型,自然模型参数的变化对结果会有影响,但参数提取是否合理跟模型是否有效不是一回事情。

囚徒困境本身也有很多版本。比如说,你跟火花在北京公车上合伙偷朝阳大妈精装大闸蟹一盒被发现扭送到派出所,按规定要拘留半个月,可是机智的民警联想到前两天隔壁居委会光天化日之下被盗现金2万,两案手法惊人相识,严重怀疑是你们两个干的。事实上也确实是你们两个干的,只不过警察没有证据。于是警察就跟你们两个分别挑明:给你坦白从宽的机会,你要是坦白并检举火花而火花没坦白,你有重大立功表现,从宽处理,立刻释放,火花拒不认罪劳改2年。如果你不坦白,被火花举报,他立刻释放,你劳教2年。如果你们两个都坦白了,那就从宽处理,但因为不能算检举立功,所以各劳教3个月。当然,警察也很实在,跟你们明着说,你们要是都不坦白,我也没有证据,就按偷大闸蟹算,每人拘留半个月。

听上去这第一反应肯定是不坦白啊,可是一琢磨:我要是不坦白,火花这小子检举了我,我得劳改2年啊,而这孙子却逍遥快活,一天罪也没受,我不是太冤枉了?

退一步说,火花就是不坦白,我也应该坦白啊。他不坦白我坦白,我不直接就出来了吗?那傻子到底是关3个月还是2年,关我屁事?反正我们也就是刚见面的网友,以后不见了就是。

想来想去,不管火花选择坦白还是不坦白,你都是坦白比不坦白好,对吧?

不用说,火花的思维过程跟你一样,于是你们两个就都坦白了,各蹲3个月,尽管你们两个都不坦白只需要各蹲半个月。



作者: t54352    时间: 2015-12-2 09:20
如果能举一个例子说明GTO,就更好了。最好是牌例,或具有一定可操作性的深入浅出的说明就更好了,反正我是看不懂太深的理论,就是懂了点点,也联系不到实践。
作者: youngtercel    时间: 2015-12-2 09:41
RichZhu 发表于 2015-12-2 06:50
囚徒困境是一个模型,自然模型参数的变化对结果会有影响,但参数提取是否合理跟模型是否有效不是一回事情 ...


这个例子好一些,为了达到明确均衡点而引入另外一个变量,也就是大案+小案,这个例子具有现实意义。
我们再构想另外一个例子,假如两个人乘车,遇到了劫匪。假设,

如果你反抗,而同伴没有反抗,你被劫X万元,而同伴被劫Y万元;
如果你们都反抗了,劫匪将被制服;
如果你们都不反抗,每人将被劫5万元。

是否存在明确的均衡点,将严重依赖于X、Y的设置。









作者: luckypanda    时间: 2015-12-2 10:05
RichZhu 发表于 2015-12-1 17:50
囚徒困境是一个模型,自然模型参数的变化对结果会有影响,但参数提取是否合理跟模型是否有效不是一回事情 ...

一天没看,赫然发现GTO已经延伸到Howard去蹲牢房了。

作者: RichZhu    时间: 2015-12-2 13:29
t54352 发表于 2015-12-2 09:20
如果能举一个例子说明GTO,就更好了。最好是牌例,或具有一定可操作性的深入浅出的说明就更好了,反正我是 ...

最容易理解的例子就是石头剪刀布的游戏,如果你每次出手有1/3的机会是拳头,1/3的机会是剪刀,1/3的机会是布,并且不给对手任何额外信息,比如眼神或肢体语言等,对手就拿你没办法了,因为不管他出什么,都是1/3的机会赢,1/3的机会输,1/3的机会平,这样他就不能通过改变自己对策获得利益,他出什么都是一样的。你的这个策略就是纳什均衡。

具体到扑克上面,一个简单的例子就是,在河牌圈,你不能总是价值下注,也不能总是诈牌,这样你就要考虑自己bluff的频率。比如说,你河牌下注一个底池,你希望自己的价值下注和诈牌的频率使得对手跟注和弃牌没什么区别,你需要什么样的bluff频率呢?从对手的角度讲,他跟注赢了,赢2个pot;输了,输一个pot,所以他需要1/3的机会是对的才能持平。换个位置说,就是你的诈牌和价值下注的比例是1:2,这样不管对手跟注还是弃牌,EV都是一样的(0),这样你的下注策略就是GTO。

扑克中这样简单的应用并不多,可以很快就变得很复杂,而且因为模型或参数的问题,实用性下降很快,所以初学者不必刻意去学这一部分。话说上面给的这个例子,虽然是GTO中最常见的一个例子,在GTO之前大家也知道要这样打牌,只不过那个时候不叫GTO罢了。

作者: RichZhu    时间: 2015-12-2 14:11
youngtercel 发表于 2015-12-2 09:41
这个例子好一些,为了达到明确均衡点而引入另外一个变量,也就是大案+小案,这个例子具有现实意义。
我 ...

理论上说,双方均不坦白是一种不稳态,因为在双方不坦白的状态下,双方都有坦白的动机,因为这样可以直接释放。但双方都坦白后,虽然情况更糟了,却没有人想改变决策,因而是个稳态。

据说很多实验表明,实际情况下,会出现一些双方不坦白的情况,也就是说,人们会对合作有一定程度的考虑。

我前面举的这个例子,如果做实验的话,可能美国人和中国人的实验结果会有看得见的不同。


作者: jimmyking    时间: 2015-12-2 17:29
學習gto,不如花時間揾魚,實際得多!
作者: 同花顺    时间: 2015-12-3 01:26
Howard 发表于 2015-11-30 15:13
无限德州GTO完全求解,肯定不可能了。现实中我们只能简化到很简单的步骤,才有计算能力范围之内的解。
现 ...

既然无限德州GTO完全求解,肯定不可能了,能不能求出一部份来。求无限德州GTo的部分解,这里我把o小写,含义是搞一个比较粗的GTo,用来在实战中参考。如果无论怎么简化都不能求出解来,那GTO就太虚无缥缈了,不具有任何可操作性。如果真的是这样,那我觉得远离GTO是上策。

作者: kinder    时间: 2015-12-3 01:28
jimmyking 发表于 2015-12-2 17:29
學習gto,不如花時間揾魚,實際得多!

同意吉米,就是这个道理。不过了解一下也不错,在别的地方也绝对看不到这么深入浅出的专业讲解了!

作者: RichZhu    时间: 2015-12-3 07:00
(五)回归真实的GTO

写到这里,有些犹豫。如果跳过那部分“少数中的少数”对GTO的研究,这个主题就不够完整;但要是写这一部分,恐怕很快就变成了纯学术讨论,而我本人无论如何不希望这个主题最初面对的群体稀里糊涂地就趟到这片浑水中来。好在我在21楼多少介绍了一些,真有兴趣的朋友,咱们可以开一个曲高和寡的“GTO美声版”,一不留神弄出个笑傲江湖也说不定,咳咳。

我在上一个回帖中提到,写这个主题的目的,并不是要把GTO说得一无是处,只是对中文扑克界在GTO理解和应用方面普遍存在的混乱和误导谈一下我自己的看法,希望至少对部分玩家有些帮助,少走些弯路。

打个比方,我们初中就学了万有引力定律。日常生活中,知道苹果掉地下走的是直线,用水龙头给草坪浇水走的是抛物线等都是重力的作用就差不多了。稍微偏理科一点的,还可以解释月亮为什么绕着地球转,以及吴刚要达到什么样的飞行速度才能脱离地球。一般人不会去计算哈雷彗星的轨道,更不会去研究什么情况下这个定律不再适用而必须转向广义相对论。其实,即便你完全不知道万有引力定律,你还是知道苹果掉下来一般离树根都不远。不知道这个定律,并不等于不知道这个名词相关的内容。

GTO对牌手来说也是这样。一般说,有实用价值的GTO都是自己学的,而不是别人教的。不同阶段有不同的理解,当你到需要对它了解更多的时候,自然知道去学。对于初学者来说,简单的平衡概念就够了。虽然现在大家一说平衡就想到GTO,实际上这是一个非常古老的概念,可以从纳什平衡、冯·诺依曼的“最小最大原理”一直追溯到柏拉图的文字记载中。

你看,扑克本身,就是这样朴实。

从学习的角度看,这个游戏的特点决定了它的学习曲线在最初阶段上升很快。这并不是说,你不努力就可以轻松成为赢家。相反,它需要踏踏实实地学习,更重要的是不断思考。我曾经说过,德州扑克最冷的笑话就是不动脑子就可以成为赢家。这个真的不是一套固定策略,几个表格偏方就解决问题的。那些初始阶段学的慢的,一般都是基本概念没搞清楚,基本功不扎实,或者没学会自己用脑子思考的,而不是错过了什么武功秘籍。

对牌手而言,一个决定的过与不及都是错误的。打牌是这样,学牌也是这样。这也是GTO的核心思想。

作者: taiji18    时间: 2015-12-3 12:34
对于不解内情的一般容易望文生义,至少我有时是那样,game theory optimal,看上去感觉,一则game theory 似涵盖所有游戏,大气,放之四海而皆准,二则optimal, 最佳,最优,似乎是终极的,“至善”,油然使人艳羡、探索、追求。总体看起来,很高大上。但是实际上呢,正如楼主所言,起名的后来都觉不妥,实际就一均衡,在扑克里也就属于防守,EV为零,如果非要加上最佳的话,也就是最佳防守。用词不当的结果,可能有忽悠的特点和性质,自然地也真有人拿去忽悠。所谓忽悠,小则夸大,大则欺诈。
作者: taiji18    时间: 2015-12-3 12:40
本帖最后由 taiji18 于 2015-12-3 12:58 编辑

楼主见种种迷、谬与不平,以通俗言,寻根索源,正本清原,息争与迷,善哉,呵呵
作者: taiji18    时间: 2015-12-3 12:55
作为扑克爱好者,会经常遇到难题,得不到答案时,也会病急乱投医,效果不一定好,最后可能都是简单的药解决的,好医生开的药又便宜又管用。而自己常常就是医生,打扑克,如鱼饮水,冷暖自知,解铃还须系铃人,心病还须心药治。

正确的东西是错误中来,很多平衡是发现不平衡后做成的,诸如此类,都是自调的,不是现成的。至于哪出错了,说的简单,未必一时能发现。扑克内外因素很多,可以简,也会繁,会时而失衡,靠的现悟现解。说的容易,所谓精一生也在此,而不是往上最求一个很高很虚渺的东西。
作者: taiji18    时间: 2015-12-3 13:08
最优、最佳这类词,相比于用于防守有点牵强,在即时即景的进与退,做大与做小等,所谓剥削也好,低调也好,放弃也好,反显贴切,因为做出了最佳的决定,或近乎最佳的决定,从而打出了A game,这应该是打牌者的追求目标。
作者: taiji18    时间: 2015-12-3 13:13
至于平衡这种东西,也是不一定的,打弱局就不需要那么平衡,打弱局有弱局的平衡…哪有什么藏于昆仑山的最佳?
作者: 我是Jsli    时间: 2015-12-3 14:30
本帖最后由 我是Jsli 于 2015-12-3 14:32 编辑
taiji18 发表于 2015-12-3 13:13
至于平衡这种东西,也是不一定的,打弱局就不需要那么平衡,打弱局有弱局的平衡…哪有什么藏于昆仑山的最佳 ...

太极啥时候出来
跟我混吧(还有那个德夫)

满大街绿绿的负离子




作者: Howard    时间: 2015-12-3 14:47
RichZhu 发表于 2015-12-2 17:00
(五)回归真实的GTO

写到这里,有些犹豫。如果跳过那部分“少数中的少数”对GTO的研究,这个主题就不够完 ...

老大放心科普,列表、公式、计算那些枯燥的东西让我来好了。只会列数据,不会说道理,没办法
准备在德州版弄一个“GTO长什么样”的帖子,先吆喝出来,免得没动力


作者: monox0    时间: 2015-12-3 17:05
技术贴,其实贵在坚持, 你坚持了,最后总能整出点有意义有价值的货。

这比在外围瞎嚷嚷强多了,知识都是高中数学加一点谷歌百度,区别仅仅在于行动与否。

所以特别赞成老霍的调调, 先把自己套牢。我脸皮太厚,套不套没啥区别, 期待大作 GTO 长什么样。


关于nash equilibrium , 我觉得老大的帖子写的很好了。

这里面的一个前提,就是对人是理性人的一个假设。 这还是很重要的,也就是说面对非理性的玩家,其实不需要考虑太多的平衡。 很多人也说了。
作者: taiji18    时间: 2015-12-3 20:38
我是Jsli 发表于 2015-12-3 14:30
太极啥时候出来
跟我混吧(还有那个德夫)

我现在澳门呢,明天走,呆了几天也没见到AA王长啥样

作者: taiji18    时间: 2015-12-3 20:39
Howard 发表于 2015-12-3 14:47
老大放心科普,列表、公式、计算那些枯燥的东西让我来好了。只会列数据,不会说道理,没办法
准备在德州 ...

好耶

作者: jimmyking    时间: 2015-12-4 00:06
我認為gto是滑稽,毫無用處。

記得有個朋友,曾經幫poker stars辦一所學校,在珠海。

說穿了,就是請一班人,幫你打,給人工,贏輸歸你。

你做這個,很簡單,請一班人,做人肉機器人。

你做了一個最佳策略(optimal strategies),如何去打。然後,你請的人跟你的最佳策略。

AJ在前位如何?中位又如何,尾位又怎樣?將所有preflop的可能性都做一個策略。

這個最佳策略最後做到,並且薄有微利。

但是,只能在短碼(自己短碼約20bb)情況下才能做到。

後來,PS將短碼與深碼分開,我朋友的最佳策略崩潰了。

崩潰之後改過幾次,但都無力改變。

最最最後,最佳策略不能適應100bb的打法,而在全部短碼又發揮不到,學校倒閉了。

實際上,最佳策略有深籌碼找不到出路。


作者: jimmyking    时间: 2015-12-4 00:11
追求簡單的打法做唔到,以為打poker是絕對科學的玩意是太過幼稚!
作者: RichZhu    时间: 2015-12-4 01:26
taiji18 发表于 2015-12-3 13:13
至于平衡这种东西,也是不一定的,打弱局就不需要那么平衡,打弱局有弱局的平衡…哪有什么藏于昆仑山的最佳 ...

是啊。虽然GTO核心是平衡,但寻求平衡点的后面却是追求稳态、静态,以不变应万变。凡事有得必有失,金钟罩练多了,独孤九剑也就使不出来了。

不用说弱局有弱局的平衡,就是一个正常局中有弱人,你的平衡也要调整。比如3人钱圈还剩4人,你下家是个跟注站,到了大小盲攻防,你要是按着gto策略,push的范围会很宽,可是常识告诉我们,这是在找死。你下家是傻子,就把你这个聪明的gto上家也变傻了。他没有赚到你的便宜,但你也没有因为他吃亏而自己赚便宜,更可能的是,你照着他脸打一拳,他不躲,抱着你一起往悬崖下面跳。


作者: RichZhu    时间: 2015-12-4 01:34
我是Jsli 发表于 2015-12-3 14:30
太极啥时候出来
跟我混吧(还有那个德夫)

太极要是跟你混了,就也带上我吧。最近中文西文都退化的厉害,我要找机会重新学习。

作者: 我是Jsli    时间: 2015-12-4 01:49
RichZhu 发表于 2015-12-4 01:34
太极要是跟你混了,就也带上我吧。最近中文西文都退化的厉害,我要找机会重新学习。
...

朱老大取笑俺

凡是能靠扑克维生的
太极德芙又是特别对文化有认识有体会的
来拉斯维加斯吧

作者: RichZhu    时间: 2015-12-4 01:53
Howard 发表于 2015-12-3 14:47
老大放心科普,列表、公式、计算那些枯燥的东西让我来好了。只会列数据,不会说道理,没办法
准备在德州 ...

这是好事啊。

可是说好的“GTO美声版”呢?名字要不要太土,会影响观众心情的。高大上,必须要高大上。


作者: 我是Jsli    时间: 2015-12-4 01:58
我是Jsli 发表于 2015-12-4 01:49
朱老大取笑俺

凡是能靠扑克维生的

那年冬天去大理
就想着租个房子平时看看书晒太阳
可是想不出靠啥为生

拉斯维加斯解决了所有问题
能静下心来看gto的贴子

作者: lblayer    时间: 2015-12-4 02:12
这个GTO在经济学上有什么应用,有经济学大咖,金融大鳄来给我们科普科普。
作者: RichZhu    时间: 2015-12-4 02:23
jimmyking 发表于 2015-12-4 00:06
我認為gto是滑稽,毫無用處。

記得有個朋友,曾經幫poker stars辦一所學校,在珠海。

GTO本身不滑稽,是被一些人弄滑稽了。

说起来,这个GTO跟那个sss从市场推广的角度看,也是近亲了。

几年前我在论坛上反对sss,说我宁愿去工地搬砖也不打多桌sss,还被个别人讥讽。现在还有谁反对我这个观点,我倒是想听听。

其实sss是扑克策略学校最成功、也是最臭名昭著的一次市场营销。他们自己在这次营销中赚得钱都数不过来了,但却留下一堆只会打两条街的半成品牌手。就像我当年说的,这些牌手就是东莞流水线的组装工,连成为工程师的机会都很少,很多最后都伤痕累累,从脖子到腰再到肩膀,更不用说大好年华损失的各种机会成本。

对牌室而言,sss是两面刃。当年上升期,增加流量,网站也乐得其成。当市场萎缩的时候,sss又加速了扑克生态的破坏,于是ps这些牌室挥手一刀,直接把尾巴砍下来。扑克策略学校罪有应得,也赚够了,没什么抱怨的,只是可怜留下一大批夹生饭的牌手,赢不了钱,也做不了别的。

GTO虽然还在处于培养一条街的牌手阶段,但至少还算正路,就是有点弯,走得有点累而已。而sss那两条街的牌手,很多东西根深蒂固,尤其是心理上和习惯上的东西,还不如新手从头学呢。

作者: taiji18    时间: 2015-12-4 02:30
我是Jsli 发表于 2015-12-4 01:49
朱老大取笑俺

凡是能靠扑克维生的

LV 总有一天会去的,不过文化这东西真不敢说,百无一用是书生啊。

作者: taiji18    时间: 2015-12-4 02:31
RichZhu 发表于 2015-12-4 01:34
太极要是跟你混了,就也带上我吧。最近中文西文都退化的厉害,我要找机会重新学习。
...

老大谦虚了,呵呵。

作者: 我是Jsli    时间: 2015-12-4 04:05
本帖最后由 我是Jsli 于 2015-12-4 04:08 编辑

我谷歌了一下sss
https://www.google.com/?gws_rd=s ... 5%AD%A6%E6%A0%A1sss

判断与选择(扑克生活事业交友)
需要些功夫

作者: jimmyking    时间: 2015-12-4 20:54
RichZhu 发表于 2015-12-4 02:23
GTO本身不滑稽,是被一些人弄滑稽了。

说起来,这个GTO跟那个sss从市场推广的角度看,也是近亲了。

分析得非常到位。

我極度懷疑能否將gto轉化為具體的打牌策略。

作者: bluffer    时间: 2015-12-25 01:21
Howard 发表于 2015-12-3 14:47
老大放心科普,列表、公式、计算那些枯燥的东西让我来好了。只会列数据,不会说道理,没办法
准备在德州 ...

我来提醒老霍了。GTO长什么样,在哪里?

作者: Howard    时间: 2015-12-25 12:05
bluffer 发表于 2015-12-24 11:21
我来提醒老霍了。GTO长什么样,在哪里?

这...
还以为没人记得呢,还真有挖坟的啊
这可如何是好
作者: GTO    时间: 2015-12-25 14:56
通读全文,对两件事深感疑惑

首先applications of NL Holdem不值得一读,而MoP更是洪水猛兽。第一本“业界”没有反响,第二本介绍了GTO,从此“德扑界”天下大乱。
其次牌手不应该花精力研究GTO,因为算不明白-你看,计算机都没算明白呢。

Isaac Haxton曾经在做PS直播时明确推荐这两本书,Ike认为这是深入理解扑克运动必读的两本书。Ike作为NL大神,算不算“业界”人士?还是您说的“业界”只存在与您门前的一亩三分地?我是该信他还是信您?

计算机现在算不明白,不代表将来算不明白。就在去年计算机不能自己开车,不会自己写字。往前再倒推几年,计算机连人脸都人不明白。照这么说我们是不是早就应该放弃了呢?

即使计算机算不明白,人就不应该研究了么?我们知道在具有人工智能之前,计算机永远是工具,它做的是人要他做的事。所以“学习”是我们该做的,我们明白了,计算机才能明白。到了您这里反过来了,这个逻辑不免让人困惑。
作者: 伟大的墙    时间: 2015-12-25 21:01
Howard 发表于 2015-12-25 12:05
这...
还以为没人记得呢,还真有挖坟的啊
这可如何是好

还敢得瑟不

作者: RichZhu    时间: 2015-12-26 07:04
GTO 发表于 2015-12-25 14:56
通读全文,对两件事深感疑惑

首先applications of NL Holdem不值得一读,而MoP更是洪水猛兽。第一本“业界 ...

你的这个帖子,是我在后台审核通过的。

通过的时候我就在想,如果不是办智游城,我可能一辈子都不会回答这些愚蠢而又无礼的问题。

看样子,你牌打得不少,英文也还可以,甚至还研究点理论并对GTO很钟爱,说不定还想以GTO为嚼头招生授课之类的。如果我这个帖子影响你招生和习惯性吹牛了,纯属意外。

智游城本来是中文扑克界最先讨论GTO的,而且讨论的深度和广度也不是其它华语论坛所可以比的,这一点想必你也清楚吧?

我并不反对GTO,我是反对拿GTO忽悠人。中文德扑界的技术讨论大多带有太强的功利性,这也是大陆牌手普遍走弯路的原因之一吧。

我不知道你是真的特别生气以至于不能正常阅读,还是本来就有阅读障碍和逻辑混乱。看在你为了回这个帖子特意注册id,并好像很辛苦地写了这么多自我感觉良好的跟帖的份上,我就帮助你纠正一下你对本文数不清的误解。

首先,关于applications of NL Holdem,请参看18楼。我说的是“不推荐大家看”,你看明白了吗?至于你提到的“Ike认为这是深入理解扑克运动必读的两本书”,你是怎么理解“深入理解扑克运动”的?


为什么华语扑克界经常会有这类人,时不时引用一些自己都不理解的话,来给自己打气撑腰啊?你就没有长脑子,不会使用中文来解释说明自己的观点吗?


如果你还理解困难,我建议你看看21楼中我的话。我都不知道该怎样帮助你阅读了。你真愁死我了。

关于MoP,我什么时候说这本书是洪水猛兽了?你是不是脑子进洪水了?

我说GTO这个词汇是因MoP开始流行的,而作者本人也后悔使用GTO这个词汇,因为它带来广泛的不必要的误解。而在中文扑克界它更是错上加错,不但带来翻译上的困扰,更被一些不懂装懂的所谓学院派肆意发挥,成为招摇撞骗的顺手工具。您是其中的一位吗?


至于什么计算机算明白算不明白代表不代表之类的,你还好意思提“逻辑”两个字?

还好,这是一个新id。丢脸就让这个id丢脸吧,不然,你会让你的粉丝多尴尬啊?



作者: 我是Jsli    时间: 2015-12-26 16:23
每次见到rich朱朱老大
每次上智游城都12分感谢感恩
人品好牌技高智游城物以类聚

翻翻我11年刚进智游城的贴子
到现在1/2-1/3级别
基本上可以在任何一个扑克室当恶霸

别小看1/2-1/3game
朋友圈一位每个月4000几这个月5000刀了

by the way
感谢伟大的墙墙爷
作者: yidunxun    时间: 2015-12-26 19:48
哈哈  我说怎么没人过来撕!  原来是要申请新的账号啊!!~~  

现在也不迟!·   

板凳和瓜子已经准备好了!!~~~  
作者: 西红柿哥哥    时间: 2015-12-27 05:01
一只不知道gto是啥,看了老大的帖子,gto不懂也罢,
作者: 泥中土    时间: 2015-12-27 10:33
提示: 作者被禁止或删除 内容自动屏蔽
作者: royalflush    时间: 2015-12-28 15:08
本帖最后由 royalflush 于 2015-12-28 15:09 编辑

Matt Janda的Application of No Limit Hold'em 我是没看过。但是他早在他出书之前在Stoxpoker的视频和在CardRunners的教学视频我都有看。
根据书的Review我可以看到书中很多都是从这些他的视频的内容的。
如果是,这本书的确不错的,好评。。相信很多专业牌手都会给好评。。所以Ike给予好评没什么奇怪。
但是要说这本书是谈GTO 那么我就不赞同了。 要仔细说就太长了。。。
翻牌前Matt谈的是如何建立我们自己的牌范围 以致对手不能以any two cards剥削,但这不是GTO。
以我的理解, How to play with optimal frequency without being exploited by any two cards preflop 和 Optimal from Game Theory Perspective (GTO, Nash Equilibrium) 是有差别的。
无限德州扑克 翻牌前计算GTO的动作和频率目前还是不可能的。 就算是HU还是挺难的,因为要分析的分叉决定点太多,然后翻后也不是check down。
作者: gundamshadow    时间: 2015-12-28 22:08
个人不懂gto,纳什均衡能转化出铁布衫策略好像能够理解,但如果还可以获利就不太好懂,毕竟还有抽水,面对铺天盖地gto的争论也无法分辨。

最近看了ED MILLER 的《1%》,作者在里面提到了pokersnowie,这软件虽然不会读牌,也还没有发展出完美策略,但的确战胜了很多顶尖牌手。

虽然ED只是在书的结尾提了一下,但感觉他对这软件的评价还挺高的,网上的资料也把这软件介绍得挺神的,我挺纠结的,这算gto吗,难道真有独孤九剑,计算机战胜德州的时候快到了?

不知道城里是否有朋友接触过这软件。




欢迎光临 智游城 (http://zhiyoucheng.co/) Powered by Discuz! X3.2