本帖最后由 mnsgdhr 于 2017-4-13 23:26 编辑
GTO,是Game TheoryOptimal的缩…… 看到上面那段开头,我不禁也想说“Shut Up!”几乎所有讲GTO的都是这个开头,接着罗列出一堆理论,公式。我想大多数人都是看的时候看个开头,然后快速向下拉到结尾,看个结论,最后回复一句:“果然是高人,学习了。”你问他这篇具体写的什么,他可能会回答你:“太长了,都是公式,估计不太好懂,先收藏,以后慢慢研究”。然后就没有然后了……
而且GTO这个叫法本身就容易让人产生误解。这里我想尝试用一个不一样的方式,向大众普及下GTO的理论,让大家先对它有一个正确的认识。在以后的文章中,我再比较系统严谨地讲解。 “德扑打得好,人品不会坏”,欢迎来到由“我是牌手”冠名的 highstakes poker 第九季,地点是华山之巅。这期我们依然请来了上一季表现出色的五绝(什么?你没看过《射雕英雄传》?那就百度一下稍作了解吧)。
由于上一季的裘千仞选手被五绝虐得肚子疼病发作,所以这一季将由一名新人南什来顶替他的位置。发牌员依然是我们的小美女黄蓉,郭靖也由于近年来进步神速,获得在旁吃瓜围观的资格。
五绝看看眼前这个清秀的少年,互相递了个眼色,到一边开始讨论。
他们都是的绝顶高手,通晓所有扑克理论,计算能力超越常人,并对别人有着开天眼般的洞察。所以他们每一个决定都是基于当前的状况下从理论上讲最优的选择。
水平到了他们这个地步就已经比不出高低了,所以影响他们最后盈利率的因素就只有相对于这个新人的位置了。 去年就是因为中神通王重阳最后猜拳获胜,抢到了裘千仞左边的位置,才获得了天下第一的称号,今年除了中神通不能再抢这个位置之外,其他人对新人左手边的位置都是虎视眈眈。
经过一番讨价还价,割肉卖肾,最终的座位分配如下: 看到南什的头像五绝更是放松了,原来这个南什是靠跟赞助方的关系混进来的,不足为惧。
开局后,五绝都盯着南什,希望能尽快找到他的漏洞,占得先机。但实际上他们心里都清楚,如果南什的水平和裘千仞差不多,那么最后打出的结果也会和去年类似,五绝实力在伯仲之间,谁都占不到太大的先机。他们甚至可以根据南什的水平,在开始前就计算出最后结果的大致数据。
但渐渐地,五绝吃惊地发现眼前这个年轻人水平之高,竟与他们不相上下。牌局出现了非常戏剧的状况,随着他们不断地调整和反调整,渐渐地,所有人都在使用一套相同的策略,他们达到了一种完美的均衡状态。这种均衡状态的策略从防守上是无懈可击的,牌局中的任何一个人都不可能通过改变打法来提高自己的赢率。
最后统计出的数据表明,在可以接受的误差范围之内,他们之间没有输赢,甚至他们每个人在同一位置的赢率都基本相同。大致情况如下图: 本图中的纯属虚构,并非经过计算的严谨的结果。 由于本次活动的目的是切磋牌技,所以没有抽水,最后大家的盈率整体都接近于零(没看懂的同学把各个位置的盈率相加就明白了)。
由于这场比试太多精彩,主办方让有着惊人记忆力的发牌员黄蓉,将牌局整理,并将他们最终使用的策略记录了下来。新人南什凭着的精彩表现以及和赞助商过硬的关系,拥有了将那种均衡状态以他的名字命名的特权,即南什(shen)均衡。可惜由于记录员的失误,文字档案中记做了纳什均衡。
黄蓉怕那本记录流传出去太多人知道,所以用梵文书写。民间的人们都不懂梵文,只有一个外国人能看懂,但由于语言障碍,人们只听懂了一点点,其中GTO这个词不断出现,最后这种策略就被称为“GTO”。
这期间还有段趣闻,比赛结束后,五绝集体尿急上厕所,这时候傻姑出现了,非要和南什一起玩,于是他们进行了一场headsup(单挑)。傻姑完全不会玩,人又傻,让南什用极具压迫性的打法打得毫无还手之力。黄蓉发现南什使用的策略竟然如此具有统治力,于是也悄悄记录了下来。
事后南什知道了,告诉黄蓉:“这种打法只有在和傻姑这种打得奇差无比且不知道调整的人单挑时才有用。我们的牌局大部分时间都不是单挑,并且桌上经常还有其他的高手,这种打法就更难施展了!”
黄蓉沉思片刻,恍然道:“原来如此!”,便随手把刚才抄录的策略给扔了。这本抄录本后来被一个路人捡到,奉为至宝,他也略懂梵文和洋文,但又都不是很精通,最后装模作样地给这个抄录本起名叫“EO”。并在江湖上大肆宣扬,EO可以达到极高的盈率,完全吊打GTO,吃瓜群众都不明状况,纷纷围观,闹得人尽皆知。此乃后话,按下不表。
花开两朵各表一枝,话说郭靖看得摸不着头脑,忙追问原因,黄蓉刚想解释,南什伸手制止,并向举办方提议,等五绝归来后,由傻姑代替南什入局,大家娱乐娱乐。黄蓉看出南什有意指点郭靖,也乖乖专心发牌。
他们在打时,南什讲解道:“你看,傻姑几乎100%跟注入局,欧阳锋这里理论上可以很松地隔离傻姑,但这样一来老毒物就会漏出破绽,七公在后面就可以更松地3bet和跟注,如果七公想最大化利用老毒物的破绽,自己也会变得可被利用,在他身后的黄老……你岳父也就可以更松的4bet和跟注, 以此类推。
这样,每次欧阳锋从傻姑那里剥削利润,然后再被后面的人逐层分刮。局中之人都需要在全力剥削前面的人和防止被后面的人剥削之间寻找平衡,找到那个利润最高的点。
在其他高手面前露出巨大的漏洞是危险的,所以老毒物不能全力剥削傻姑,必须收紧一些,最后他们也会达到一种平衡的状态,我们姑且称之为傻姑均衡。这种状态下他们的策略的赢率肯定要比我刚才那样的打法低的多!这也是我和傻姑单挑时的策略几乎很少能用到的原因。” 本以为平衡就会这样保持下去,但没过多久,五绝们都不约而同地换了策略,南什立刻露出赞叹的神情。郭靖则看不懂忙问:“为何他们都开始改变策略了呢?刚才那种状态,五绝中的任何一个人不是都不能通过改变策略来提高盈利了吗?”
南什悠然道:“没错,除了傻姑之外任何一个人都不能。但是如果五绝一起则是可能的。不愧是五绝,他们知道如果他们之间互相牵制,最后结果就是大家的盈利都收到影响,但他们都是精于算计之人,并且能力非常相近,所以他们几乎同时算出了另外一种均衡状态,我们可以称之为静默合作均衡,这时的盈利比傻姑均衡状态下要高出不少的。
之前他们没办法最大化利润,是因为他们的一部分牌力的价值用在了互相牵制上了,等于其他人替傻姑防守了一部分的剥削。五绝很快意识到这点,所以他们选择静默合作减少内耗,将全部的牌力价值都最大化的用来剥削傻姑。
一旦多人与傻姑进入同一底池,他们之间通常也不做纠缠,这并非是说五绝互相使眼色或小动作,来打串通,这种属于作弊行为,五绝这样身份的人是不会做的。但他们都是顶尖牌手,知道彼此都能计算出目前状况中,对每个人来说最大化利润的均衡点在哪里。
在这个均衡点上每个人的策略都是固定的,根据他们相对于傻姑的位置会稍有不同,他们都不约而同地选择了这套策略,因为这样他们每个人的利润都比之前的傻姑均衡状态下要高。这其中的微妙变化,不足为外人道也。也只有五绝这样的人物,才能达成如此微妙的平衡。这局对局丝毫不比刚才我们的对局差!”
郭靖在旁听得是热血沸腾,非常想和上去和各位高手较量,经过黄蓉向举办方的求情和南什的推荐,郭靖也终于坐上了这张世界上最难的桌子。南什在心中默默的计算:郭靖的实力比裘千仞稍强,但和五绝比起来还是有一定差距的,所以他们最终的结果可能大致应该是如此: 本图中的数据依然纯属虚构,并无科学依据。
但谁知事情并非如南什所想的那样,郭靖竟然不像他计算的输的那么多,南什细思之下,恍然道:“我机关算尽,却漏算一件事,那就是人心。这局五绝都是报着娱乐和历练新人的心态来打的,对自己的控制就不像之前巅峰对决那样严格了。于是参杂着个人的想法和情绪,他们游戏牌局的目标悄悄地变了。”
段皇爷不想赢别人的钱,但自己也不想输太多,于是采用南什均衡状态下的策略。
欧阳锋想利益最大化剥削郭靖,但洪七公会护着自己的徒儿并故意针对欧阳锋,使得欧阳锋放不开手脚。
黄药师有些不待见自己的笨女婿所以会偶尔针对下郭靖,但郭靖毕竟是自己人,黄老邪最护短,也不想让郭靖在欧阳锋那里吃亏,所以有时会和洪七一起针对老毒物。
王重阳不希望大家有太多纷争,所以会从中牵制平衡。
黄蓉虽然不参与牌局,但她只想让她的靖哥哥赢,于是会经常在牌局关键时刻去和欧阳锋聊《九阴真经》。黄药师想教训郭靖时,黄蓉也会问黄药师关于她娘的事情。试图通过扰乱他们的心神来帮助她的靖哥哥。
正是因为他们有着这样错综复杂的关系,结果正可谓是在意料之外,却又在情理之中。这几人中只有欧阳锋和郭靖是抱着利润最大化的目的在进行游戏的,而其他人则各有各的心思,为达目的不惜牺牲自己的利益。南什不禁感叹:“看来我还是需要修行啊,我计算能力再强,也算不准人心,人心是几乎不可能量化的啊!”
这样的想法让他有些意兴阑珊,但随即他又释然了,德州扑克不正是因为如此,才这么的有魅力吗?真正能达到五绝那样水平的在时间绝无仅有,人们什么都能想控制,但最后会发现我们什么都控制不了,甚至包括我们自己。控制是暂时的,失序才是常态,我又何必做那脆弱的完美主义者呢?于是华山论剑之后,南什也随之销声匿迹。
时光如白驹过隙,世间早已没有多少人记得当年华山之巅上的那场对局,但是GTO和EO这两本记录却流传了下来,造成了江湖上的不少纷争。沉寂多年的神秘年轻人南什突然重出江湖,旨在提醒世人,GTO和EO皆为误传。
“EO”只有在对手打得很差且完全不知调整时才能发生,而“GTO”则是一桌人都必须像五绝那样的不世出的高手才会出现的状态。这两种状态都只是局中人根据当时情况,每个决定都力图做到利益最大化的结果而已。
这等于是两种极端状况:对手足够差或足够好。这个“足够”几乎永远不够,现实中的牌局几乎永远遇不到这样的对手。更何况科技如果没有什么革命性的突破,人类短时间内是不可能达到五绝那样的水准的。
但对这两种均衡状态的研究却有着非常重要的意义,它们是我们在扑克海洋中的信号塔,让我们知道自己和对手在哪里(如果你水平足够好的话),我们只需要做出判断,在当前情况下,我们需要向哪篇靠近。所以GTO和EO从来都不是一套可行的策略,更不是什么研究出来照着打,就可天下无敌的打法。
这世间从来就没有什么GTO或是EO,这里只有poker。
大家看着图个乐就好。
|