智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: RichZhu
打印 上一主题 下一主题

GTO(所谓的“博弈论最优”)通俗版

[复制链接]
21#
 楼主| RichZhu 发表于 2015-11-30 01:31:18 | 只看该作者
jimmyking 发表于 2015-11-29 23:48
對於這種通俗的討論,非常的適合我,所以也來說幾句。

我想gto用在撲克中,最通俗的說法,就是“你吹我唔 ...

确实,GTO基本上是理论上的追求,至少对大多数人如此。所以,我对招生简章大谈GTO非常不能理解。

极少数的人确实可以研究GTO,通常有两类人:一类是学者或程序员,不管是学术还是商业目的,这类研究是以大量计算为基本前提的,也是希望能更广泛甚至最终整体上解决这个问题。另一类是网络高级别现金局牌手,但也只是试图解决很小一部分特殊情况,比如你提到的河牌下注的问题。

话说,现在这些扑克上使用gto解决的东西,都不太好意思叫GTO,因为这些东西的模型,在GTO或者纳什均衡之前就已经存在了。打个比方,你非要说牛顿第二定律是伯克利物理教程的东西,我也不能说反对,因为它确实在里面。但我一般会说,牛顿第二定律是初中物理的内容。

所以,我不反对GTO,就如同我不反对牛顿第二定律一样。
22#
同花顺 发表于 2015-11-30 02:30:34 来自手机 | 只看该作者
RichZhu 发表于 2015-11-29 10:47
囚徒困境中是有很多假设/简化的,比如你你招供了,不会一出监狱就因为背叛被同伙打死,自然也不能附带上 ...


这个平衡应该说是各自为自己利益最大化做的选择,尽管每个人都知道有对双方更好的结果,所以与其说是“自愿”,不如说是“被迫”,多少有些害人害己,但又不能不害的意思。

这段话写得好。我理解:GTO包含如下策略,就是最大限度地害人,最小限度地害己。不去追求对双方更好的结果,否则不赌是对双方更好的策略,因为有抽水。
23#
taiji18 发表于 2015-11-30 03:14:53 | 只看该作者
RichZhu 发表于 2015-11-30 01:07
我写这篇文章的一个原因,就是希望像你这样的好同志,可以放心使用“最佳应对”这样的描述,而不用担心这 ...

,谢谢
24#
 楼主| RichZhu 发表于 2015-11-30 04:03:50 | 只看该作者
同花顺 发表于 2015-11-30 02:30
这个平衡应该说是各自为自己利益最大化做的选择,尽管每个人都知道有对双方更好的结果,所以与其说是“ ...

关于GTO的说法,有时候要小心一些。它最初并没有说明是指零和游戏这一部分,所以害人和害己的关系并不那么直接和必然。

由于这些年只有扑克界在真正使用GTO这个词,所以很多人也就默认指的零和游戏了。但即便是零和游戏,害人和害己的关系在多于两个玩家时,仍然复杂。实际讨论中,GTO逐步退让,它表现的内容越来越窄,现在的研究基本上就是局限于两人对打的部分特殊情形。
25#
 楼主| RichZhu 发表于 2015-11-30 05:09:53 | 只看该作者
(三)GTO这个词汇的是与非

本文开头说了,GTO这个词汇不但本身被用得越来越乱,还殃及到其它技术词汇的正常使用,这里咱们就真的豁出去“说道说道”吧。

GTO这个词汇在扑克界的流行,一般认为,罪魁祸首是Mathematics of Poker(扑克的数学). GTO具体是谁最先使用的无从考证,只是在MoP之前,扑克界就有人使用,在扑克界使用之前,游戏理论界就有人使用,这些都是可以查到的。但业内开始流行使用,却是始于MoP,而在扑克界之外,现在也没有什么人使用。

前面说过,目前能查到的GTO这个词汇的中文翻译对刚接触这个词汇的玩家都有很强的误导,这一点不能完全怪翻译的人,因为英文本身就带有很强的误导作用,也就是说,不但中文玩家对这个词汇理解产生困惑,美国英国加拿大澳大利亚玩家也有这个困惑。究其原因,就是GTO(Game Theory Optimal)中的这个"Optimal"有点让人头痛。在2+2等英文论坛中,很多人质疑,也有些人在争论数学家和经济学家在词汇使用上的理解和习惯不同等等,越扯越远。

鉴于本文是通俗版,咱就不整这些没有用的了。简单说,大家一致的意见是,GTO这个词汇不好,容易引起大多数思想单纯的玩家的误解。不同的是,一部人悲观的认为生米已经煮成熟饭,也只能吃了;另一部分人认为可以将错就错,以后就用GTO这个词汇,不再是是什么的缩写,就是标准用词,不想再看到"optimal"在这种地方出现。

《扑克的数学》作者之一,Jerrod Ankenman,在各种场合多次表达了对自己使用GTO这个词汇的悔恨。他高调地说:如果当初我知道这本书真的有人会看,甚至还会真的谈论扑克,我肯定会使用"equilibrium"这个词(而不是使用"optimal"这个词),这样大家就不用头痛了。

Ankenman不知道,在遥远的东方,他的用词不慎,给广大扑克爱好者带来更大的麻烦。不但翻译起来困难,更糟糕的是,在对Optimal一词误解的基础上,进一步的发挥创造。

我看到的最经典,最顽固,也是最好笑的,是GTO狂潮中产生的一个词汇和解释,以及它的流传广度和时间长度,就是“EO(Exploitatively Optimal)”这个词组。把“Exploitatively Optimal”输入到google,你不会得到搜索结果,但如果你百度这个英文词组,却可以看到搜索结果。如果作者理解了GTO的含义,根本就不应该有“EO”这个词,“exploitative”跟“optimal”是矛和盾、白天和黑夜的关系,无法一起构成一个有意义的词组。

咱们华人牌手自己创造的英语词汇,然后又缩写下来“出口转内销”介绍给了华语扑克界,不能不让人感叹国人想象力之丰富。可是在使用之前,不能网上随便验证一下英文中是否有这个词组的用法吗?我曾经在论坛和微博等多处指出不要使用这个英文词组,因为实在是说不过去,但在本文开头提到的微博留言里我还是又一次看到了这个用法和解释。可见错误的东西,一旦流行,是很难纠正的。

写到这里,我们回到本文最初的梦想之一,就是不要让GTO再来干扰其它跟GTO无关的词汇和讨论。

这里倡议,我们也可以像老外建议的那样把GTO当作一个专有名词,不要再使用各种翻译。或者,我们也可以翻译成“不被剥削策略”,甚至可以勉强使用更吸引眼球的“最佳防守策略”。这样当我们讨论牌局的时候说“这是我认为的最佳策略”,我们指的是EV最大的选择,或者是BR允许下EV最大的选择,诸如此类人类能正常理解的普通用法,也就不用诚恐诚惶地解释此“最佳”非彼“最佳”。

必须说明的一点,虽然GTO这么劣迹斑斑,但至少它客观上帮助传播了扑克理论和吸引更多玩家关注这个理论的探讨,这个“不慎”的用词还是在某些方面起了积极的作用。当然,网络扑克的发展,即便没有GTO这个词汇,扑克理论上的研究和应用也是会不断提高的,就如同没有moneymaker扑克boom也会出现一样。但GTO这个词用到今天,确实应该说清楚,有个了断了。

我希望GTO一词引起的混乱到此为止,这样我们下面就可以踏踏实实地开始讨论GTO的内容与应用了。当然,因为GTO不再据有极其吸引眼球效应的说法而不想了解GTO实质的,可以跳过本文剩余内容,直接到广告页面。(广告在制作过程中,马上回来)。





26#
同花顺 发表于 2015-11-30 05:50:42 来自手机 | 只看该作者
同花顺 发表于 2015-11-29 12:30
这个平衡应该说是各自为自己利益最大化做的选择,尽管每个人都知道有对双方更好的结果,所以与其说是“ ...

我有下列想法,不知是否可行。
GTO是一个庞大的系统,而绝大多数城友感兴趣的只是一个很小的子集。
GTO->扑克GTO->德州扑克GTO->无限注德州扑克GTO。
我猜测:无限注德州扑克GTO占GTO的比例是相当小的,但关注无限注德州扑克GTO的人数却不会比关注GTO的人数少许多。
扑克以外的游戏,如赛马、21点、百家乐、...,这些游戏的GTO绝大多数城友是不感兴趣的。
我觉得讨论一个非常小并且作用大的子集的方法是可取的。
27#
我是Jsli 发表于 2015-11-30 06:15:50 | 只看该作者


本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
28#
我是Jsli 发表于 2015-11-30 06:22:25 | 只看该作者
这样当我们讨论牌局的时候说“这是我认为的最佳策略”
我们指的是EV最大的选择,或者是BR允许下EV最大的选择
---------------
朱老大这句话解决了我一个长时间对扑克的困惑

EV最大选择-hero不同,最佳策略是相同的唯一的
BR允许下EV最大的选择-hero不同最佳策略不同
29#
maomaobiao 发表于 2015-11-30 10:34:51 | 只看该作者
老大挖坑了,我当然要跳,虽然姿势比较奇怪。

首先,我是反对动辄就提GTO的,GTO本身的原意可能是寻找动态平衡中的一个均衡策略点,这是我读老大的帖子体会到的。但是,

1)老大首先指出了,由于扑克游戏的变化多样,在一个动态变化的平衡中(即使是两人对局),这样的均衡可能是很容易被打破的,这就不存在某种意义上的金钟罩铁布衫。而这中最优的策略本身就涉及到针对性的调整的反应速度,每个人调整的速度和反应时间又是不同的,所以很可能寻找这样的均衡点,很可能是一厢情愿的举动。

2)即使在一个相当简化的模型,如囚徒困境中,也存在一个与现实严重不符合的假设,就是信息是封闭而不开放的。很多人注意到了囚徒困境中的“不合作”原则,这个原则运用的前提就是,对于两个囚徒而言,信息是封闭的,他们不可能知道对手的策略,也不能互动。先说囚徒困境,这其实无伤大雅,因为两个囚徒知不知道对方的策略,除非可以商量合作,否则最优解其实都是一定的。但是回到现实中来,我们是要把“不合作”与“信息封闭”当作两个条件来看的。因为在扑克这种博弈规则中,“不合作”可以认为是普遍适用的原则(极少的情况除外),但是“信息封闭”却是不存在的情况。博弈的双方在错综复杂的情况下,都或多或少地知道对方的策略,甚至为了迷惑对手,故意showdown bluff的情况屡见不鲜。在这样的原则下,寻找GTO,为什么对手就不能有GTO呢?奇怪,好像回到老大的思路上去了,就是GTO到底是矛还是盾,能不能以子之矛攻子之盾呢?相信大家心里都有自己的答案。

3)在许多简单的对局里,运用GTO其实是可行的。至于叫什么名字,就无所谓了吧。
30#
maomaobiao 发表于 2015-11-30 10:39:03 | 只看该作者
RichZhu 发表于 2015-11-30 07:09
(三)GTO这个词汇的是与非

本文开头说了,GTO这个词汇不但本身被用得越来越乱,还殃及到其它技术词汇的正 ...

没错equilibrium 是动态的平衡,optimum 是最优的方案,二者其实差别很大。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-12-22 15:34 , Processed in 0.060926 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部