智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: RichZhu
打印 上一主题 下一主题

GTO(所谓的“博弈论最优”)通俗版

[复制链接]
61#
 楼主| RichZhu 发表于 2015-12-2 13:29:06 | 只看该作者
t54352 发表于 2015-12-2 09:20
如果能举一个例子说明GTO,就更好了。最好是牌例,或具有一定可操作性的深入浅出的说明就更好了,反正我是 ...

最容易理解的例子就是石头剪刀布的游戏,如果你每次出手有1/3的机会是拳头,1/3的机会是剪刀,1/3的机会是布,并且不给对手任何额外信息,比如眼神或肢体语言等,对手就拿你没办法了,因为不管他出什么,都是1/3的机会赢,1/3的机会输,1/3的机会平,这样他就不能通过改变自己对策获得利益,他出什么都是一样的。你的这个策略就是纳什均衡。

具体到扑克上面,一个简单的例子就是,在河牌圈,你不能总是价值下注,也不能总是诈牌,这样你就要考虑自己bluff的频率。比如说,你河牌下注一个底池,你希望自己的价值下注和诈牌的频率使得对手跟注和弃牌没什么区别,你需要什么样的bluff频率呢?从对手的角度讲,他跟注赢了,赢2个pot;输了,输一个pot,所以他需要1/3的机会是对的才能持平。换个位置说,就是你的诈牌和价值下注的比例是1:2,这样不管对手跟注还是弃牌,EV都是一样的(0),这样你的下注策略就是GTO。

扑克中这样简单的应用并不多,可以很快就变得很复杂,而且因为模型或参数的问题,实用性下降很快,所以初学者不必刻意去学这一部分。话说上面给的这个例子,虽然是GTO中最常见的一个例子,在GTO之前大家也知道要这样打牌,只不过那个时候不叫GTO罢了。
62#
 楼主| RichZhu 发表于 2015-12-2 14:11:39 | 只看该作者
youngtercel 发表于 2015-12-2 09:41
这个例子好一些,为了达到明确均衡点而引入另外一个变量,也就是大案+小案,这个例子具有现实意义。
我 ...

理论上说,双方均不坦白是一种不稳态,因为在双方不坦白的状态下,双方都有坦白的动机,因为这样可以直接释放。但双方都坦白后,虽然情况更糟了,却没有人想改变决策,因而是个稳态。

据说很多实验表明,实际情况下,会出现一些双方不坦白的情况,也就是说,人们会对合作有一定程度的考虑。

我前面举的这个例子,如果做实验的话,可能美国人和中国人的实验结果会有看得见的不同。

63#
jimmyking 发表于 2015-12-2 17:29:30 | 只看该作者
學習gto,不如花時間揾魚,實際得多!
64#
同花顺 发表于 2015-12-3 01:26:16 来自手机 | 只看该作者
Howard 发表于 2015-11-30 15:13
无限德州GTO完全求解,肯定不可能了。现实中我们只能简化到很简单的步骤,才有计算能力范围之内的解。
现 ...

既然无限德州GTO完全求解,肯定不可能了,能不能求出一部份来。求无限德州GTo的部分解,这里我把o小写,含义是搞一个比较粗的GTo,用来在实战中参考。如果无论怎么简化都不能求出解来,那GTO就太虚无缥缈了,不具有任何可操作性。如果真的是这样,那我觉得远离GTO是上策。
65#
kinder 发表于 2015-12-3 01:28:05 | 只看该作者
jimmyking 发表于 2015-12-2 17:29
學習gto,不如花時間揾魚,實際得多!

同意吉米,就是这个道理。不过了解一下也不错,在别的地方也绝对看不到这么深入浅出的专业讲解了!
66#
 楼主| RichZhu 发表于 2015-12-3 07:00:28 | 只看该作者
(五)回归真实的GTO

写到这里,有些犹豫。如果跳过那部分“少数中的少数”对GTO的研究,这个主题就不够完整;但要是写这一部分,恐怕很快就变成了纯学术讨论,而我本人无论如何不希望这个主题最初面对的群体稀里糊涂地就趟到这片浑水中来。好在我在21楼多少介绍了一些,真有兴趣的朋友,咱们可以开一个曲高和寡的“GTO美声版”,一不留神弄出个笑傲江湖也说不定,咳咳。

我在上一个回帖中提到,写这个主题的目的,并不是要把GTO说得一无是处,只是对中文扑克界在GTO理解和应用方面普遍存在的混乱和误导谈一下我自己的看法,希望至少对部分玩家有些帮助,少走些弯路。

打个比方,我们初中就学了万有引力定律。日常生活中,知道苹果掉地下走的是直线,用水龙头给草坪浇水走的是抛物线等都是重力的作用就差不多了。稍微偏理科一点的,还可以解释月亮为什么绕着地球转,以及吴刚要达到什么样的飞行速度才能脱离地球。一般人不会去计算哈雷彗星的轨道,更不会去研究什么情况下这个定律不再适用而必须转向广义相对论。其实,即便你完全不知道万有引力定律,你还是知道苹果掉下来一般离树根都不远。不知道这个定律,并不等于不知道这个名词相关的内容。

GTO对牌手来说也是这样。一般说,有实用价值的GTO都是自己学的,而不是别人教的。不同阶段有不同的理解,当你到需要对它了解更多的时候,自然知道去学。对于初学者来说,简单的平衡概念就够了。虽然现在大家一说平衡就想到GTO,实际上这是一个非常古老的概念,可以从纳什平衡、冯·诺依曼的“最小最大原理”一直追溯到柏拉图的文字记载中。

你看,扑克本身,就是这样朴实。

从学习的角度看,这个游戏的特点决定了它的学习曲线在最初阶段上升很快。这并不是说,你不努力就可以轻松成为赢家。相反,它需要踏踏实实地学习,更重要的是不断思考。我曾经说过,德州扑克最冷的笑话就是不动脑子就可以成为赢家。这个真的不是一套固定策略,几个表格偏方就解决问题的。那些初始阶段学的慢的,一般都是基本概念没搞清楚,基本功不扎实,或者没学会自己用脑子思考的,而不是错过了什么武功秘籍。

对牌手而言,一个决定的过与不及都是错误的。打牌是这样,学牌也是这样。这也是GTO的核心思想。
67#
taiji18 发表于 2015-12-3 12:34:46 | 只看该作者
对于不解内情的一般容易望文生义,至少我有时是那样,game theory optimal,看上去感觉,一则game theory 似涵盖所有游戏,大气,放之四海而皆准,二则optimal, 最佳,最优,似乎是终极的,“至善”,油然使人艳羡、探索、追求。总体看起来,很高大上。但是实际上呢,正如楼主所言,起名的后来都觉不妥,实际就一均衡,在扑克里也就属于防守,EV为零,如果非要加上最佳的话,也就是最佳防守。用词不当的结果,可能有忽悠的特点和性质,自然地也真有人拿去忽悠。所谓忽悠,小则夸大,大则欺诈。
68#
taiji18 发表于 2015-12-3 12:40:17 | 只看该作者
本帖最后由 taiji18 于 2015-12-3 12:58 编辑

楼主见种种迷、谬与不平,以通俗言,寻根索源,正本清原,息争与迷,善哉,呵呵
69#
taiji18 发表于 2015-12-3 12:55:20 来自手机 | 只看该作者
作为扑克爱好者,会经常遇到难题,得不到答案时,也会病急乱投医,效果不一定好,最后可能都是简单的药解决的,好医生开的药又便宜又管用。而自己常常就是医生,打扑克,如鱼饮水,冷暖自知,解铃还须系铃人,心病还须心药治。

正确的东西是错误中来,很多平衡是发现不平衡后做成的,诸如此类,都是自调的,不是现成的。至于哪出错了,说的简单,未必一时能发现。扑克内外因素很多,可以简,也会繁,会时而失衡,靠的现悟现解。说的容易,所谓精一生也在此,而不是往上最求一个很高很虚渺的东西。
70#
taiji18 发表于 2015-12-3 13:08:20 | 只看该作者
最优、最佳这类词,相比于用于防守有点牵强,在即时即景的进与退,做大与做小等,所谓剥削也好,低调也好,放弃也好,反显贴切,因为做出了最佳的决定,或近乎最佳的决定,从而打出了A game,这应该是打牌者的追求目标。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2025-1-24 05:11 , Processed in 0.045021 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部