智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 78700|回复: 119
打印 上一主题 下一主题

GTO(所谓的“博弈论最优”)通俗版

[复制链接]
跳转到指定楼层
#
RichZhu 发表于 2015-11-29 11:00:48 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
GTO这个词汇大概是过去两年中文扑克界使用频率最高的技术词汇了。奇怪的是,随着这个词汇的逐步大众化,越来越多的人却在问同一个问题:到底什么是GTO?好像谁都听说过,但问起来又没有什么人给个实在的答案。

上个月,一位业内知名的牌手在微博上这样问道:“有谁很认真的研究过GTO理论?求你们的解答…”。我是被旁人提示去看的这个微博里面的回复,看过后就想写一个GTO的通俗版。前几天,我那篇关于AK的帖子又被翻出来,争论的还很激烈,回复之余我又想起了GTO,因为八竿子打不着的地方,回帖的人也要小心地解释一下,自己说的最佳“不是GTO那个最佳”。可以说,GTO这个词汇不但本身被用得越来越乱,还殃及到其它技术词汇的正常使用,到了必须要“说道说道”的地步。

下面我就尽量使用人类听得懂的语言解释这个神话般的GTO。

(一)什么是GTO

GTO是英文Game Theory Optimal的缩写。那么Game Theory Optimal翻译成中文是什么呢?随便查一下网络上的英汉字典不难知道:“Game Theory”是“游戏理论/博弈论/对策论”的意思,而“Optimal”是“最佳的/最优的/最理想的”意思。所以“Game Theory Optimal”很自然地会被翻译成:博弈论最优,至少这是百度翻译给出的,此外还有“最优游戏策略”等等类似的翻译。

问题是,到目前为止,所有这些翻译给我们普通人带来的正常理解,跟GTO理论本身的含义,是不同的,这是GTO给大多数人带来困惑的首要原因。这样,我们只能回头来,先不用管它中文怎么称呼,看看GTO到底是什么意思。

在博弈论中,有一个非常著名的纳什均衡理论,(Nash Equilibrium) 大意是说:在非合作类博弈中,存在一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。如果参与者当前选择的策略形成了“纳什均衡”,那么对于任何一位参与者来说,单方更改自己的策略不会带来任何好处。

如果上面的表述还显得饶舌,没关系。在游戏理论讨论中,英文常常还有一个非常平民化的词组来替代Nash Equilibrum,叫unexploitable strategies。跟GTO不同,这个词组直译没有问题,就是:不被(对手)压榨的策略,或者说最佳防守策略。

GTO算是纳什均衡的另一个别名,不过它只是近些年在扑克理论界得到使用,跳出这个圈子,基本上没人知道。即便是扑克圈子,有些人也根本不用,还有些人用这个词汇,只是因为字母少,写起来方便。总之,这个词汇本身并没有任何新的含义或学术价值。

(著名数学家、博弈论创始人约翰纳什因其发现/证明纳什均衡而获得诺贝尔经济奖,他也是奥斯卡最佳影片《美丽心灵》的原型。他和夫人半年前遇车祸过世。笔者在此对纳什先生表示深深的敬意)

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏6
119#
网中人 发表于 2020-2-13 07:50:51 | 只看该作者
再温习了一遍,其实关于GTO现象的某些观点,几年前的这篇已经有提过了。
118#
东南西北 发表于 2020-2-3 00:10:56 | 只看该作者
这竟然是5年前的帖子!顶起来。
117#
霁月难逢 发表于 2018-8-1 17:20:07 | 只看该作者
随着软件的发展,通过软件训练应该会成为主流,现在围棋象棋软件都是最好的训练方式。
116#
榆木脑袋 发表于 2018-7-25 16:17:04 | 只看该作者
unlimitspeed 发表于 2018-7-25 04:18
完全不明白GTO是什么,不喜欢动脑,看了全部的帖子后略明白一点,感觉这个东西就是想让自己立于不败之地, ...

讨论GTO有没有用 我们可以先回到一个原始的问题 你构建一个平衡的范围有没有用 如果你觉得打鱼根本不需要平衡 那GTO确实屁用没有 甚至大部分打牌的理论都失去了价值 如果认可打牌是需要平衡的 那GTO也许是有用的 因为这是一种帮助你去构筑平衡范围的方法和路径
115#
unlimitspeed 发表于 2018-7-25 04:18:21 来自手机 | 只看该作者
完全不明白GTO是什么,不喜欢动脑,看了全部的帖子后略明白一点,感觉这个东西就是想让自己立于不败之地,然后等着对手犯错,进而歼之。扑克不应该是在桌子上找鱼,根据鱼的打法去调整最大化ev吗?感觉GTO这东西就是给自己累到半死还赢不到钱,就是个名字高大上,其实屁用没有呢?
114#
kaisi 发表于 2018-7-21 12:04:50 | 只看该作者
666666666666
113#
BBlifego 发表于 2018-5-2 21:18:18 | 只看该作者
再读这篇文章,真是中肯。Rich一再强调计算能力和参数在研究GTO模型中的重要性。三年前连piosolver都没有,所有那些拿着极化模型中得出的简单结论试图用在实战中的所谓GTO其实离真正的最优策略差了十万八千里。现在有了piosolver,发现翻牌前的范围即使动了几个combo可能都会对整体策略有比较大的影响,这就是参数的重要性,更别提去实施这些策略过程中人很难像机器那种做好所谓的频率控制了。
112#
MENGNE 发表于 2018-5-1 12:10:56 | 只看该作者
RichZhu 发表于 2016-1-2 03:16
新年快乐!

Miller确实是一位很受欢迎的扑克作者,他的书整体上质量都比较高,智游城也有不少他的粉丝。 ...

好比鸟的飞行和飞机飞行是不同原理一样
111#
 楼主| RichZhu 发表于 2016-1-2 03:16:02 | 只看该作者
gundamshadow 发表于 2015-12-31 22:15
书里对这软件的描述只有两小段,是作为一些补充写的,大概是说可以用来训练及找漏洞的,至于战胜的标准跟 ...

新年快乐!

Miller确实是一位很受欢迎的扑克作者,他的书整体上质量都比较高,智游城也有不少他的粉丝。即便他这样严谨的作者,写出一些不严谨的东西也属正常,比如这个帖子中讨论的:http://www.zhiyoucheng.co/thread-11357-1-1.html

还有一点就是,英语中有句俗语,If you don't have anything nice to say, don't say anything at all,这一点在名人之中尤其如此。所以,一个软件或者一本书,张大神认为好,李大神/王大神/赵大神认为不好,你会听到张大神说好,但几乎不会听到其他大神说不好,于是给人的感觉就是大神们都觉得这个软件或书很好。

其实扑克上的很多东西大家常常会因为一些细节处理上的差别而导致结论上的大不相同。话说,扑克离开细节上的东西,能谈的也不多了。当然,这种细节不是在扣一个数据到小数点后几位,而是一些精细的考虑。

比如说snowie,即便有一天它真的能战胜顶级牌手,你是否可以通过这个软件的训练成为顶级牌手?这是不太可能的,因为人脑打牌跟计算机打牌就不是一个路子。人脑不可能有计算机的存储量和计算速度,但在模式识别等方面又是现代计算机所不能比拟的。所以这样的软件,一般也就是中低级别练手用的,至于效果如何,还是看具体使用的人如何动自己的大脑,而不是机械地记忆软件给出的建议。

记得2+2上有个人说他用snowie做训练一年多,能掌握70-80%snowie的决策,我看了都懒得插嘴。另外,2+2上的snowie用户似乎大致上有个共识,snowie应该可以战胜ps上的nl25,甚至nl50,但还不能打赢nl100.

110#
gundamshadow 发表于 2015-12-31 22:15:56 | 只看该作者
RichZhu 发表于 2015-12-31 06:14
大半年前,卡内基梅隆大学的一个扑克程序跟牌手有过一次比赛,这应该算是人机对决最正式和科学的一次。比 ...

书里对这软件的描述只有两小段,是作为一些补充写的,大概是说可以用来训练及找漏洞的,至于战胜的标准跟牌手名字都没有提过。
会想去了解,也是主观的认为ED的书比较受大众认同,应该不会坑人的这想法,当然不排除他是affiliates。老实说,如果软件的效果是如介绍一样,对我这种只能战胜娱乐型玩家的abc玩家不失为一个福音。

英语不好,2+2很少去,所以才来看看这里的朋友是否用过,不过好像也搜索不到什么。不管如何,如果扑克程序能继续发展的话也不是坏事。

先不聊了,还有一个多小时就2016年了,祝楼主及各位新年快乐!!!

您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-11-14 15:26 , Processed in 0.048782 second(s), 10 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部