智游城

标题: 讨论回答各种gto的问题 [打印本页]

作者: leisong    时间: 2015-6-14 03:54
标题: 讨论回答各种gto的问题
本帖最后由 leisong 于 2015-6-14 04:00 编辑

开帖讨论回答各种gto的问题。最近5/10打的比较多,感觉越来越有必要学习讨论这个主题了。

1、什么是gto?
由数学模型决定的最佳扑克决策理论。
2、扑克真的有gto吗?
有,但还没有达到完美。
3、为什么要学习gto?
因为gto是个auto money maker。

以上说的对于不对都没关系,只是想讨论。欢迎对gto感兴趣的牌友可以随加入讨论,我尽量回答任何问题。

作者: doglas    时间: 2015-6-14 05:58
高深的问题,等高手吧,我这样的小虾米,就等等看
作者: leisong    时间: 2015-6-14 06:51
这也是个问题,你是再问gto高深吗?我的回答是no,very simple。
作者: xiaozhu88    时间: 2015-6-14 11:32
本帖最后由 xiaozhu88 于 2015-6-14 11:37 编辑

我先问两句:

A."......最佳扑克决策理论"的依据是什么?

B."...还没有达到完美"......那你又怎么说是"......最佳"呢?


突然想起:

古代故事传说,有一个人卖矛和盾,夸他的盾最坚固,什么东西也戳不破;又夸他的矛最锐利,什么东西都能刺进去。旁人问他,‘拿你的矛来刺你的盾怎么样?’那人没法回答了(见于《韩非子?难一》)。

作者: leisong    时间: 2015-6-14 11:58
xiaozhu88 发表于 2015-6-14 11:32
我先问两句:

A."......最佳扑克决策理论"的依据是什么?

问的好,我试着回答啊
gto直接意思就是最佳的扑克游戏理论,他是在完全不考虑对手的frequency的情况下,通过数学模型计算出来的策略tree,这个tree的之所以被称为最佳,是因为它不能被任何其它策略盘剥压制。
为什么说是完美的,,,,这个这个,,,你觉得不美吗?但还没有达到完美是说,目前的理论发展和计算能力还无法计算出所有spot的终极tree。

作者: Tamarin    时间: 2015-6-15 11:51
能举个具体例子吗?我今天坐上牌桌,拿到什么牌在什么位置怎么打,在哪条街遇到什么action怎么作出反应。

作者: leisong    时间: 2015-6-15 12:23
Tamarin 发表于 2015-6-15 11:51
能举个具体例子吗?我今天坐上牌桌,拿到什么牌在什么位置怎么打,在哪条街遇到什么action怎么作出反应。
...

在6max中,目前,饭钱几乎所有位置的各种组合的gto基本已经有了定论。饭后还不行,组合太多,参与参数太多,目前还只是部分解决了,但,如果是个给定的场景,gto肯定是能够计算出来的。就比如你那手ak,在a82ccc的flop,gto是能够计算出来的,河牌我还不确定,但bet flop check turn,应该已经很接近gto了。
作者: leisong    时间: 2015-6-16 03:35
一个新的思考
场景:one of sama played hand ,as3s, on the 2s5s10cadkd river,
我们check the river behind 这里是gto吗?如果是,为什么?如果不是,我们该建立怎样的check or bet的ratio以使其更接近gto?如何执行这个ratio?
作者: leisong    时间: 2015-6-16 03:51
leisong 发表于 2015-6-16 03:35
一个新的思考
场景:one of sama played hand ,as3s, on the 2s5s10cadkd river,
我们check the river behi ...

我思考的结果是
确定这里check到底是不是gto的依据不是结果,而是思考过程。有可能是,有可能不是。
我觉得这里bet,从理论上看,应该完全基于gto 的策略出发,这个ratio的目的应该是使我们的river bet更难以或者不可能被exploit。
只有在我们认为我们的river bet已经被exploit 的情况下,我们才有必要考虑一个恰当的ratio去执行。

欢迎参与讨论。

作者: leisong    时间: 2015-6-16 04:00
本帖最后由 leisong 于 2015-6-16 04:17 编辑

学习gto只是为了对抗高手吗?
no, absolutely not.因为即使是一个最差的玩家,也会对一定的spot进行针对性的调整,在我们还不知到他调整的结果是betting two much or checking two much or calling two much or folding two much的时候,gto策略就变得相当给力。

事实上,我认为,即使是在一个session中,我们也有很多的spot的decision making should be armed for gto.

作者: Tamarin    时间: 2015-6-16 06:11
leisong 发表于 2015-6-16 04:00
学习gto只是为了对抗高手吗?
no, absolutely not.因为即使是一个最差的玩家,也会对一定的spot进行针对性 ...

我觉得用gto去玩儿无限单次换应该不错。你能写一个这样的策略吗

作者: leisong    时间: 2015-6-16 10:05
no i cant,sorry(-.-)
作者: leisong    时间: 2015-6-17 04:46
why we should make our opponents indefferent to call with his bluff catcher?i think it is the a good starting point of thinking about gto。
作者: leisong    时间: 2015-6-17 04:46
on the river
作者: pongba    时间: 2015-6-17 06:01
我对GTO有这样一个疑惑:都说GTO的好处在于我们可以只打自己的range,不需要过多考虑对手怎样,就至少能够保证盈利。但是这个似乎只在我们处于防守方的时候适用(即不管对手怎么变化,我们始终保持一个GTO的defense frequency,对手非但无法剥削我们,而且当对手偏离太多的时候我们的proper defense frequency能够自动盈利,比如当对手bluff freq过高时),但当我们处于进攻方的时候,GTO就不那么美好了,因为进攻方的GTO策略依赖于一个很强的假设,即PvBC(Polarized Range vs. Bluff Catchers),只有在完美的符合PvBC模型的时候我们才能通过GTO frequency让对手indifferent between calling or folding,但实战中我们的处于防守方的对手的range并不是BC,比如他们会slow play一些牌,尤其是in position的时候,使得我们的两级下注撞上一个uncapped range,就不那么美好了。
作者: leisong    时间: 2015-6-17 10:38
pongba 发表于 2015-6-17 06:01
我对GTO有这样一个疑惑:都说GTO的好处在于我们可以只打自己的range,不需要过多考虑对手怎样,就至少能够 ...

我试着回答一下啊

用个例子吧,你在btn,raise,sb fold,bb call with j9s。

flop:2810r,bb check,你bet,bb call
turn:3,still rainbow,bb check,你bet,bb call。

river,here the point,假设无论发什么牌,bb都会check。我们发三次河牌。

第一次   7,
第二次,j
第三次,2

for some reason,我们对着这三个河牌,全部all in。现在应该清楚一点了吧,就是,我们只需要让他在第二个河牌的情况下,indefferent。
HE will call 7 and fold 2 river,no indefference we need here。

作者: 我是Jsli    时间: 2015-6-17 12:54

1.什么是gto?
由数学模型决定的最佳扑克决策理论.

以上说的对于不对都没关系,只是想讨论.欢迎对gto感兴趣的牌友可以随加入讨论.
--------------
牌桌上一上智游城就输钱
不知道啥问题


但是还是忍不住看帖回贴
1.是雷哥贴子
2.是新东西.老人家了就怕脑袋成石头不学习.


我先问个问题
建立模型的作用是什么?

作者: 我是Jsli    时间: 2015-6-17 13:02
本帖最后由 我是Jsli 于 2015-6-17 13:17 编辑
我是Jsli 发表于 2015-6-17 12:54
1.什么是gto?
由数学模型决定的最佳扑克决策理论.

道可道非常道
这个是老子对事物的描述

相比西方对事物的描述
差了几亿光年

除非眼见为实
西方用数学建立模型
来表达对事物的认识






作者: 我是Jsli    时间: 2015-6-17 13:13
我是Jsli 发表于 2015-6-17 13:02
道可道非常道这个是老子对事物的描述

相比西方对事物的描述

扑克中的"事物”是什么?
是你看到了对方的两张牌
从而能使你准确的"靠"或“弃”牌

当然现实中不可能看到对方的两张牌
那么是否有可能数学上有一个模型
能知道对方的牌或接近知道对方的牌

我们这里往下引深
看到对方的牌能使我们做出正确的决定
那么如果有一个模型
能使我们大多数时候能做出正确的决定
或者使对方大多数时候做出了错误决定
这个模型就是靠谱的

作者: 我是Jsli    时间: 2015-6-17 13:30
本帖最后由 我是Jsli 于 2015-6-17 13:40 编辑

说了这么多的目的
我试图用上面的理念来解读雷哥的贴子
注意下面两句话
1.我们的action大多数时候能做出正确的决定

2.或者我们的action使对方大多数时候做出了错误决定



作者: 昆仑苍狼    时间: 2015-6-17 14:36
我是Jsli 发表于 2015-6-17 13:30
说了这么多的目的
我试图用上面的理念来解读雷哥的贴子
注意下面两句话

此贴会不会就这样终结了呢lol

作者: leisong    时间: 2015-6-17 21:09
我是Jsli 发表于 2015-6-17 13:30
说了这么多的目的
我试图用上面的理念来解读雷哥的贴子
注意下面两句话

感谢老李捧场,上述思考很有启发性,你看,学习就有帮助吧,哈哈
作者: leisong    时间: 2015-6-17 21:09
昆仑苍狼 发表于 2015-6-17 14:36
此贴会不会就这样终结了呢lol

兄弟何出此言呢?
作者: leisong    时间: 2015-6-17 21:28
pongba 发表于 2015-6-17 06:01
我对GTO有这样一个疑惑:都说GTO的好处在于我们可以只打自己的range,不需要过多考虑对手怎样,就至少能够 ...

再举个例子

viffer曾经在2+2贴出一个牌谱
他在前位open with aq,后位3bet,他跟,hu。
翻拍qxx,viffer check,对手bet,viffer call。
转brick,viffer check,对手bet,viffer call。
河牌brick,viffer check,对手all in。

viffer的问题是,他该fold还call。

这就是gto闪光的地方,首先,viffer的对手已经通过极化的range,让viffer的bluff catcher 处于一个  indefferent to call的状态。
其次,veffer的问题,其实就是gto要解决的问题。
如何解决,就是老李问的问题,即这个数学模型是什么。

作者: pongba    时间: 2015-6-18 02:00
leisong 发表于 2015-6-17 10:38
我试着回答一下啊

用个例子吧,你在btn,raise,sb fold,bb call with j9s。

怎么能假定对手就hold J9呢?如果对手会在turn上call所有的OESD,那么在7和J的river上对手都有一个uncapped range,你在bet一个polarized range的时候,就不能根据PvBC的模型来计算GTO的EV了,因为对手的range里面有相当一部分不是BC。
以上,我的意思是,只有当对手在turn上会fold所有的OESD,我们bet7和J的rv才能利用PvBC模型完美的计算出GTO EV。但是这个依赖于对手turn的tendency的assumption。

作者: Tamarin    时间: 2015-6-18 02:26
leisong 发表于 2015-6-17 21:28
再举个例子

viffer曾经在2+2贴出一个牌谱

我问一个简单的。GTO要求的cbet和call cbet的频率分别是多少?HU与 3人锅有何不同?
作者: leisong    时间: 2015-6-18 04:26
Tamarin 发表于 2015-6-18 02:26
我问一个简单的。GTO要求的cbet和call cbet的频率分别是多少?HU与 3人锅有何不同? ...

先回答你的,这个问题没人能回答,如果能,gto就真的成了石头剪子布了。
必须根据饭前的范围和board texture,才能确定比例。
gto在做决策时,的确是不考虑对手的frequency的,但却一定要计算对手的range。

作者: leisong    时间: 2015-6-18 04:36
pongba 发表于 2015-6-18 02:00
怎么能假定对手就hold J9呢?如果对手会在turn上call所有的OESD,那么在7和J的river上对手都有一个uncapp ...

怎么能假定对手就hold J9呢?

()我这里可能没说清楚,我从来都没有假定让他fold。

如果对手会在turn上call所有的OESD,那么在7和J的river上对手都有一个uncapped range,你在bet一个polarized range的时候,就不能根据PvBC的模型来计算GTO的EV了,因为对手的range里面有相当一部分不是BC。

()这个你说的对,这里,我只是举个例子,可能和你的提问不太切合,即,我们不是要让对手的所有的牌都indefferent to call,只是让他整个range里的bluff cataher那部分 indefferent。

以上,我的意思是,只有当对手在turn上会fold所有的OESD,我们bet7和J的rv才能利用PvBC模型完美的计算出GTO EV。但是这个依赖于对手turn的tendency的assumption。

()没有完美的模型,要是有,就不是gto了,是下棋,或者是看见对手的牌。gto所说的最佳,是建立在不完全信息博弈下的最佳。

总结一下,我觉得回答你的问题的最好的解释是——我们不是要让对手的所有的牌都indefferent to call,只是让他整个range里的bluff cataher那部分 indefferent。

作者: pongba    时间: 2015-6-18 04:44
leisong 发表于 2015-6-18 04:36
怎么能假定对手就hold J9呢?

()我这里可能没说清楚,我从来都没有假定让他fold。

是的,你说的“总结一下,我觉得回答你的问题的最好的解释是——我们不是要让对手的所有的牌都indefferent to call,只是让他整个range里的bluff cataher那部分 indefferent。”这个我知道,我的意思是,让他的整个range中的BC部分indifferent,并不是我们实战当中所关心的最终目的,所以我的意思是GTO回答了以上这个问题,可这个问题的答案却并不是我们实战当中关心的那个最终问题:就是我这个action的EV是多少。完全有可能你根据GTO假设算出来一个+EV,可实际上却是-EV,因为对手的range长什么样,是一个强假设。可能这也是为什么当初dwan在2+2上说NLHE GTO不存在的原因,当然,因为大家的总体打法有一些共通的倾向性,比如在wet board上OOP call raise一般可以排除sets,所以在很多时候对于对手range的assumption是基本能够成立的,但是如果严格来说的话,因为这个游戏本质上的不确定性,poker的“解”和象棋的“解”有一个本质的不同,就是就算你计算机计算出了完整的game tree,你还是需要对对手的range的assumption来选择去tree的哪个分支。



作者: leisong    时间: 2015-6-18 07:21
本帖最后由 leisong 于 2015-6-18 07:25 编辑
pongba 发表于 2015-6-18 04:44
是的,你说的“总结一下,我觉得回答你的问题的最好的解释是——我们不是要让对手的所有的牌都indefferen ...


非常感谢这位兄弟,我们一起学习。

是的,你说的“总结一下,我觉得回答你的问题的最好的解释是——我们不是要让对手的所有的牌都indefferent to call,只是让他整个range里的bluff cataher那部分 indefferent。”
这个我知道,我的意思是,让他的整个range中的BC部分indifferent,并不是我们实战当中所关心的最终目的,所以我的意思是GTO回答了以上这个问题,可这个问题的答案却并不是我们实战当中关心的那个最终问题:就是我这个action的EV是多少。

()首先,我想说的是,gto player always take the most plus ev line。

完全有可能你根据GTO假设算出来一个+EV,可实际上却是-EV,因为对手的range长什么样,是一个强假设。

()我不太明白你这里说的实际上是-ev是什么意思。的确,对手的range是个强假设,但,这个假设是建立在一个稳定且可操作的逻辑之上的,这个逻辑就是game theory。

可能这也是为什么当初dwan在2+2上说NLHE GTO不存在的原因,

()关于gto是否存在,这个命题已经没有任何讨论的必要了,这就好比用石头剪子布的gto基本原理来对比扑克gto的基本原理一样。有意思的是,现在很多人仍然对gto持这种观点。

当然,因为大家的总体打法有一些共通的倾向性,比如在wet board上OOP call raise一般可以排除sets,所以在很多时候对于对手range的assumption是基本能够成立的,但是如果严格来说的话,因为这个游戏本质上的不确定性,poker的“解”和象棋的“解”有一个本质的不同,就是就算你计算机计算出了完整的game tree,你还是需要对对手的range的assumption来选择去tree的哪个分支。

()是的,gto肯定是经过比较,选择most plus ev的那个tree。这里,我这么解释吧,假设我们在某个spot,需要在check和bet之间,作出一个ratio,那也仅仅是因为,这个check和bet的ev是一致的,如果bet的ev大于check,gto永远选择bet,而不在两者之间是选择一个ratio。



作者: 昆仑苍狼    时间: 2015-6-18 08:06
leisong 发表于 2015-6-17 21:09
兄弟何出此言呢?

都说老李是贴子终结者
看来不是真的
此帖仍在继续
开个玩笑



作者: 昆仑苍狼    时间: 2015-6-18 08:16
3、为什么要学习gto?
因为gto是个auto money maker

Gto不是防守型策略么
告诉我们对付高手时如何做到不吃亏
在我的印象中最好只能做到持平
有点像21点的策略表

不太像auto money maker

作者: leisong    时间: 2015-6-18 14:36
本帖最后由 leisong 于 2015-6-18 14:38 编辑
昆仑苍狼 发表于 2015-6-18 08:16
3、为什么要学习gto?
因为gto是个auto money maker


Gto不是防守型策略么

()gto的一个重要策略就是,在河牌让用一个极化的bet,使自己极化的range让对手indefferet to call ,你认为这是防守吗?

告诉我们对付高手时如何做到不吃亏
在我的印象中最好只能做到持平

()这是把石头剪子布gto简单平移到扑克的误导性结论,扑克不是石头剪子布。

有点像21点的策略表

不太像auto money maker

()实际上,gto,是个超级exploit 对手的策略,只是,这种exploit,是均衡状态下做到的。


作者: leisong    时间: 2015-6-19 00:32
gto实战思考,说了很多空洞的理论,现在来点实战的。

我们是否应该在河牌bluff?

假如我们open from btn,bb call,我们bet flop bet turn,然后,河牌是Q8452r,对手check给我们,那么我们是否应该bluff?怎么bluff,gto在这里是如何思考的呢?


作者: leisong    时间: 2015-6-19 00:36
本帖最后由 leisong 于 2015-6-19 00:38 编辑

再来个思路题目,我也一直在想。
如果有两个range让你选择,一个是polarized,一个是condensed,你愿意选择哪一个,为什么?
游泳去了先,有空回来接着聊

作者: Tamarin    时间: 2015-6-19 03:21
leisong 发表于 2015-6-19 00:36
再来个思路题目,我也一直在想。
如果有两个range让你选择,一个是polarized,一个是condensed,你愿意选择哪 ...

Easy game

作者: Tamarin    时间: 2015-6-19 05:45
Tamarin 发表于 2015-6-19 03:21
Easy game

当判断对手在咋呼时,gto要求我们加注还是just call?

作者: 我是Jsli    时间: 2015-6-19 07:45
leisong 发表于 2015-6-19 00:36
再来个思路题目,我也一直在想。
如果有两个range让你选择,一个是polarized,一个是condensed,你愿意选择哪 ...

跟着雷哥学英语

如果两个牌手或多个牌手
都试图gto

那么这里的gto最优化的打法
是相同的还是不同的

作者: 我是Jsli    时间: 2015-6-19 08:51
本帖最后由 我是Jsli 于 2015-6-19 08:53 编辑
我是Jsli 发表于 2015-6-19 07:45
跟着雷哥学英语

如果两个牌手或多个牌手

如果对所有牌手而言
gto是单一的唯一的
那么两个牌手同桌都试图使自己打法最优化
就好比两个武士同时用盾牌对打

如果对所有牌手而言
gto不是单一的唯一的
那么扑克就是剪刀石头布的游戏
简单说就是针对性


作者: 我是Jsli    时间: 2015-6-19 10:17
昆仑苍狼 发表于 2015-6-18 08:06
都说老李是贴子终结者
看来不是真的
此帖仍在继续

这个情况我是很自豪的说

你看霍师傅一贴计算公式
大家就都闭嘴了

作者: 昆仑苍狼    时间: 2015-6-19 10:25
我是Jsli 发表于 2015-6-19 10:17
这个情况我是很自豪的说

你看霍师傅一贴计算公式

哈 哈 哈
作者: leisong    时间: 2015-6-19 11:50
我是Jsli 发表于 2015-6-19 07:45
跟着雷哥学英语

如果两个牌手或多个牌手

感谢老李捧场,你看学习多好,提供技术增进了解,不废话了,继续学习gto。

跟着雷哥学英语

如果两个牌手或多个牌手
都试图gto

那么这里的gto最优化的打法
是相同的还是不同的

()肯定是相同的,说实话,我是花了很长时间,看了大量的资料,才对gto有了入门的认识,仅仅是入门,所以还要刻苦学习。gto是建立在这样的一个假设上的,假设A和B,两个人玩牌,设想一下,他俩玩了数万兆兆(此处省略了n个兆)年,那么,他俩经过无数次调整,最终肯定会达到一个状态,即,谁都没有动机偏离自己既定的策略,这是,两个人就达到了一个均衡(equilibrium,也可以叫做nash equilibrium),这个策略就是所谓的gto。

如果对所有牌手而言
gto是单一的唯一的
那么两个牌手同桌都试图使自己打法最优化
就好比两个武士同时用盾牌对打

()如果谁偏离了这个均衡,谁就会被对方盘剥,即被exploit。

如果对所有牌手而言
gto不是单一的唯一的
那么扑克就是剪刀石头布的游戏
简单说就是针对性

()扑克与势头尖子步不一样,扑克不是对称的游戏,所以不能把势头尖子步的gto,平移到扑克上。

这个情况我是很自豪的说

你看霍师傅一贴计算公式
大家就都闭嘴了

()gto,对于霍爷绝对是小儿科,烦他老人家出手,那就好比用屠龙的刀杀鸡,我等小辈在这里瞎比划比划就行了。

作者: 我是Jsli    时间: 2015-6-19 12:23
leisong 发表于 2015-6-19 11:50
感谢老李捧场,你看学习多好,提供技术增进了解,不废话了,继续学习gto。

跟着雷哥学英语

(1)gto是建立在这样的一个假设上的,假设A和B,两个人玩牌,设想一下,他俩玩了数万兆兆(此处省略了n个兆)年,那么,他俩经过无数次调整,最终肯定会达到一个状态,即,谁都没有动机偏离自己既定的策略,这是,两个人就达到了一个均衡(equilibrium,也可以叫做nash equilibrium),这个策略就是所谓的gto.

(2)如果谁偏离了这个均衡,谁就会被对方盘剥,即被exploit.

(3)扑克与势头尖子步不一样,扑克不是对称的游戏,所以不能把势头尖子步的gto,平移到扑克上.
-----------------------------------------------------------------------
先说简单的 (3)
因为看不到对方的两张牌,所以扑克与围棋相棋不同,是不对称的游戏
剪刀石头布为什么不是不对称的游戏?


(1)(2)意思有相关性
gto与每条街追求最大+EV的行为是不是同一件事?





作者: Ander_AK    时间: 2015-6-19 14:56
关于GTO,我想问的三个问题是:

雷哥你打牌时是严格按照GTO的吗?

如果是,赢钱吗?

如果赢,能透露下winrate吗?
作者: leisong    时间: 2015-6-19 16:05
我是Jsli 发表于 2015-6-19 12:23
(1)gto是建立在这样的一个假设上的,假设A和B,两个人玩牌,设想一下,他俩玩了数万兆兆(此处省略了n个兆)年, ...

刚看完美剧,聊几句碎觉

先说简单的 (3)
因为看不到对方的两张牌,所以扑克与围棋相棋不同,是不对称的游戏
剪刀石头布为什么不是不对称的游戏?


()石头剪子布是对称游戏,扑克是位置游戏。


(1)(2)意思有相关性
gto与每条街追求最大+EV的行为是不是同一件事?


()这个是两个概念,如果你这里的(每条街追求最大+EV的行为)指的是exploit的话。这个要细说,我过两天详细解释这里。普通意义上,回答是yes。

作者: leisong    时间: 2015-6-19 16:20
Ander_AK 发表于 2015-6-19 14:56
关于GTO,我想问的三个问题是:

雷哥你打牌时是严格按照GTO的吗?

问的好,阎总果然犀利,我就厚着脸说几句啊,对错都请阎总包涵。
雷哥你打牌时是严格按照GTO的吗?

()我只能说尽量做到,或是尽量靠近。
首先,gto给我们的是大量的框架。我句个例子,btn加住3bb,大忙以kk3bet,btn call。翻牌,368两个红逃,bb bet,btn call,转红逃8。bb?
就这个spot,要用gto演算出一个策略tree,结果和一个圣诞树差不多。临场要是做到,实在是太难了。这就引出了下面这两点,一,gto,理解比应用重要,二,场上的操作完全取决于下边练习演算。


如果是,赢钱吗?

()最近打5/10的多了一些,感觉和2/5完全不是一个game,如果不懂gto,嘿嘿,基本就靠猜了。

如果赢,能透露下winrate吗?

()还好,娱乐为主。


感谢阎总捧场,多多指导

作者: bomb    时间: 2015-6-19 16:43
leisong 发表于 2015-6-19 16:20
问的好,阎总果然犀利,我就厚着脸说几句啊,对错都请阎总包涵。
雷哥你打牌时是严格按照GTO的吗?

“尽量靠近,尽量做到”是什么意思?你是说你不知道答案,尽量去猜,还是说只是因为临场来不及计算,但事后还是知道gto的应对,从而确认自己的打法跟gto接近?

这是两个不同的概念,前者是你主观认为,后者才有一个参考标准(尽管这个参考标准也是主观上“知道”的,但至少会有相应的具体说法来辩论)

作者: leisong    时间: 2015-6-19 19:52
bomb 发表于 2015-6-19 16:43
“尽量靠近,尽量做到”是什么意思?你是说你不知道答案,尽量去猜,还是说只是因为临场来不及计算,但事 ...

擦,独自装逼被你发现了,嗯,说好尽量一起装的,呵呵,嗯,我很欣赏你。

作者: 我是Jsli    时间: 2015-6-19 20:29
本帖最后由 我是Jsli 于 2015-6-19 20:45 编辑
leisong 发表于 2015-6-19 19:52
擦,独自装逼被你发现了,嗯,说好尽量一起装的,呵呵,嗯,我很欣赏你。
...

打夜场?

一个好的模型一定要应用性强
能郎郎上口

比如星爷解释range翻后的作用
要靠很大的计算量
当然这些计算可以场下练习

但是这类繁复的计算会产生两个问题
1.本末倒置.现场扑克最重要的是了解牌手类型.
描述牌手类型两句话就够了
对方能弃牌吗
对方会bluff吗

2.1/2-2/5扑克在主流国家已经广为普及
而打好1/2-2/5对于牌手的生活需要已经可以满足
高手打生打死的场面没必要
比如智游城墙爷与霍师傅各买入300BB
非要比个高低
这个是要看医生吃药的节奏了

简单直接的应用法则比如小三法
要更有效的多



作者: 我是Jsli    时间: 2015-6-21 07:44
www.zhiyoucheng.co/thread-18389-1-1.html
本来想在这个贴子说的
还是与雷哥熟悉多一些
瞎说也无妨

有一个蒙蒙笼笼的认识
扑克gto最优化理论的依据是
一切围绕对方的"弃牌"

原因很简单
两个人把把打到河牌是分不出输赢的


作者: 老陈    时间: 2015-6-26 20:37
从某种意义上讲,学习、掌握、熟练运用GTO,几乎是成为扑克高手的必要条件。
我认为一个不运用GTO的赢家,熟练运用GTO,就如同如虎添翼。
作者: 老陈    时间: 2015-6-26 20:48
本帖最后由 老陈 于 2015-6-26 06:58 编辑
我是Jsli 发表于 2015-6-20 17:44
www.zhiyoucheng.co/thread-18389-1-1.html
本来想在这个贴子说的
还是与雷哥熟悉多一些


我有不同意见。

不是完全围绕对方“弃牌”。
举例:对手加注后,我们拿77,我们要根据有效筹码量做出跟注或弃牌的决策。

把把打到河牌也有输赢。
你赢我时打进200BB,我赢你时打进20BB,咱俩这样打下去,我最后的几个硬币都得输给你。


作者: leisong    时间: 2015-7-20 09:55
本帖最后由 leisong 于 2015-7-20 09:59 编辑
Ander_AK 发表于 2015-6-19 14:56
关于GTO,我想问的三个问题是:

雷哥你打牌时是严格按照GTO的吗?

rich认为我对阎总的这个帖子回复的不够诚恳,我就尽量再做到非常非常诚恳。

阎总,你问我打牌时,是否严格按照gto?我想说的是,gto本身只是个标杆,即,在我们不了解对手的时候,我们该怎么思考我们的决策。由于最近我打5/10的比以前稍多了一些,难免在桌上遇到很多tough的对手,他们会在后位频繁地对我发起攻击,很多时候,我真的不知道该怎么办,这时,gto就给我了一个比较好的量化的架构。就如我在“三个无价德州扑克公式”帖子里提到的,那些公式,就给了我很好的思考起点。

其实,我觉得,“严格按照”这个词,在这里不是很贴切,gto的那些公式,只是一个架构,他不仅让你在面对tough的玩家时,有了最大化ev的决策依据,同时,当我们面对那些比较差的玩家时,有了这些架构,我们能够知道如何偏离我们的默认策略,从而去盘剥对手。

比如,在河牌,你看到一个人手持AQ,在QJ723彩虹的牌面,在持续下注两天街后,到了河牌,却check behind,那我们就可以判定,他河牌的bluff比例是远远不够的,同时,他河牌的betting range是非常极化的。那么以后,我们当然就可以做出针对性调整,而不是还死板地在他河牌下注时,还要以最佳的跟注频率去应对。这只是个例子,我把结论简单化,因为要说清,需要太多的分析和计算。

作者: leisong    时间: 2015-7-20 10:03
bomb 发表于 2015-6-19 16:43
“尽量靠近,尽量做到”是什么意思?你是说你不知道答案,尽量去猜,还是说只是因为临场来不及计算,但事 ...

“尽量靠近,尽量做到”是什么意思?你是说你不知道答案,尽量去猜,还是说只是因为临场来不及计算,但事后还是知道gto的应对,从而确认自己的打法跟gto接近?

这是两个不同的概念,前者是你主观认为,后者才有一个参考标准(尽管这个参考标准也是主观上“知道”的,但至少会有相应的具体说法来辩论)

说实话,我真的没看懂你要表达什么,如果你有关于gto的疑问,或者有关于我说的gto的疑问,能否详细说一下?我对之前的回复也感到很不妥,rich对我已经提出了批评,我在这里向你道歉。

作者: royalflush    时间: 2015-7-20 15:55
(1)(2)意思有相关性
gto与每条街追求最大+EV的行为是不是同一件事?

()这个是两个概念,如果你这里的(每条街追求最大+EV的行为)指的是exploit的话。这个要细说,我过两天详细解释这里。普通意义上,回答是yes。


gto 与 追求最大EV是不一样的。
gto 只有在 面对 了解我们策略和很会根据我们策略调整来maximally exploit我们策略的对手 的时候 是 最大EV

比如来个非常简化的例子
river pot=1 我们要bet 1, 根据gto  2/3的时候我们的bet 是 nut; 1/3的时候是air
但是面对fish 绝对的calling station的时候 我们应该忽略gto 玩fully exploitative poker, bet的时候 100%是nut



作者: leisong    时间: 2015-7-20 17:56
royalflush 发表于 2015-7-20 15:55
gto 与 追求最大EV是不一样的。
gto 只有在 面对 了解我们策略和很会根据我们策略调整来maximally exploi ...

我部分同意你的观点,gto有时很绕。其实,gto与exploitative play,有时是一样的。gto肯定是max ev。
前几天说要详细解释这里,今天正好就把这里我的认识说一下,如果有错的地方,还请你指出来。

我这里主要用toy game来解释,这样好理解和沟通。

第一个toy game

假如我俩玩这样一个游戏,咱俩每人手里一副牌,每次,咱俩同时在52张牌里拿出一张牌,然后比大小,如果一样大,平,如果你比我大,我给你一块钱,如果你比我大且只大一点,如,我 出8,而你恰好出的是9,那么,我要给你10块钱。

这个游戏的gto很简单 ,就是 咱俩最后都是把把出a。但是,假如你偏离了,不是把把出a,我的策略还是出a,因为,我无法知道你要出什么牌,所以,我出a就是 max ev。但,假如我知道你下手可能出10,那么,我的max ev就变成了出j,但是我无法知道到底 你下手 出 什么 。从这个例子我们可以看出,gto,是个auto money maker,只要对手偏离gto。

第二个toy game

假如我们在河牌,我是后位,你在前卫,你的手牌是99,这时你只有一个选项,check-call,我的手牌是aa和22,我可以选择下注,也可以选择check。这时候我的gto是什么呢?bet aa,check 22,咱俩现在就达到了纳什均衡,就是,在这个点上,没有人能够单方面的通过决策改变ev。这个情况,就是你说的,对手是个calling station。这时,如果我们还选则bet 22 50%,就不是gto了,可以说,只要bet 22,就不是gto。

第三个toy game
还是在河牌,还是上面的情况,这时,你可以选择check-fold or check-call。在我不知道你的frequency的情况下,我的gto是什么呢?就是你说的我们只bet 22 50% of the time。这种情况下,如果用crev测试一下,你就会发现,无论对手怎么调整,他的ev永远是0,我觉得,这也是gto很核心的一个东西,就是indefferent principle,在我们面对不了解的对手时,我们通过indefferent principle,max 我们的ev。






作者: lililili11    时间: 2015-7-20 18:04
本帖最后由 lililili11 于 2015-7-20 18:18 编辑
leisong 发表于 2015-7-20 17:56
我部分同意你的观点,gto有时很绕。其实,gto与exploitative play,有时是一样的。gto肯定是max ev。
前 ...

这一段说出了一个新的内容:GTO是根据新的信息调整的。我觉得这点很有价值。
一般而言,我觉得大家普遍讨论的"gto",更多地好像是那种只看着自己手里两张牌,以及筹码量、位置等等因素,然后就根据数学做决定,而不需要得到对手的信息。这么样一种看似既“无敌”又“省事”的打法。
然而在实践中我们多多少少总会知道一些信息的,我想这也是所有人都会碰到的问题:这时候我们是应该根据信息采取针对性打法呢,还是继续采用死板的“GTO”呢?特别是对于那种我们其实又没有太大把握的信息,这时候应不应该利用上呢?
所以我觉得在这里指出这点,GTO其实也是应该根据新的信息调整的,很有价值。因为明明有信息不用,非要按照一种死板的套路来,不管它是不是已经在数学上被证明了的,感觉都会非常别扭,非常荒谬。

作者: lililili11    时间: 2015-7-20 18:31
当然这里又出现新的问题,就是“新信息到底可信不可信”?
如果其实是个假信号,那么我们调整,其实就是上当了;但是如果是个真信号,那么我们不调整,其实就是吃亏了。

一般来说,目前我看到的“GTO”的讨论,貌似都在讲一种根本不用调整的死板的静态的打法,在不用考虑上当的同时,也显得比较笨拙。
目前我还是比较倾向于一种根据信息调整的动态的均衡。

所以这里有几个要注意的:
1、有没有新信息,如果有的话,要不要用?
2、新信息可信度如何?
3、既然是根据新信息调整的,为什么不称之为剥削打法而仍然叫GTO呢?——因为不是完全信息啊,只是部分新信息啊,所以仍然不能说是彻底剥削,所以说是GTO依然没有错。——说到这里,所谓的剥削和GTO,似乎已经互相融合了→能剥削的地方就剥削,不能剥削的地方就GTO。
作者: lililili11    时间: 2015-7-20 18:45
我觉得这个一下子打开了思路:所谓的剥削打法,你能剥削到哪里去?

除了河牌一锤定音的情况,否则在后续还有几部要走的时候,我们只有一点点信息,更多的是迷茫的未知。
这时候谁敢说,自己忽然就具备了一种“最大化剥削”的能力了?
何来的自信?
咱们依据这点信息,能做到哪一步呢?把全部的range都倾斜过去?就不怕在后面的几步里,被人反剥削成一条狗?

所以现实中的扑克实践,应该永远都是剥削和GTO混合的情况。

我发现上面这一段,提到的“过度剥削”,正是我一直在犯的错误。
作者: xzfromcs    时间: 2015-7-21 01:57
本帖最后由 xzfromcs 于 2015-7-21 02:09 编辑

Sauce
作者: xzfromcs    时间: 2015-7-21 02:01
楼主是打LIVE 2/5 5/10 还是ONLINE ? 如果是LIVE这种级别, 我认为平衡 / 不被剥削  意义很小
作者: Tamarin    时间: 2015-7-21 03:13
xzfromcs 发表于 2015-7-21 01:57
Sauce

好图。你半年赢了Ben sulsky127万?

作者: Tamarin    时间: 2015-7-21 04:08
Tamarin 发表于 2015-7-21 03:13
好图。你半年赢了Ben sulsky127万?

或者是sulsky半年在ps nl500zoom赢了127万,其中你输给他34万?

作者: leisong    时间: 2015-7-21 04:31
Tamarin 发表于 2015-7-21 04:08
或者是sulsky半年在ps nl500zoom赢了127万,其中你输给他34万?

sulsky绝对是大神级的人物,这哥们太狠了,他曾经的一句话给我了很大鼓舞,他说:虽然我的数学不好,但我仍然可以学习gto,我虽然还没有完全掌握poker,但我知道强大的poker看起来是什么样子?(i know what  the strong poker looks like.)我的数学也很差,从那以后我知道了,这并不影响我学习poker。


作者: Tamarin    时间: 2015-7-21 12:09
leisong 发表于 2015-7-21 04:31
sulsky绝对是大神级的人物,这哥们太狠了,他曾经的一句话给我了很大鼓舞,他说:虽然我的数学不好,但我 ...

你对sulsky的数据怎么看?6max里面Vpip 53, pfr33,3bet14?比较松吧?

作者: leisong    时间: 2015-7-21 12:34
Tamarin 发表于 2015-7-21 12:09
你对sulsky的数据怎么看?6max里面Vpip 53, pfr33,3bet14?比较松吧?

我不打线上,但这哥们的数据的确有点晃人,可能是他那个级别的特点吧
我看过他的视频,他说话太快,很难跟上,不过有一点,感觉他确实太牛逼了,我看见,他在很多地方说:i am gonna bluff here,然后就诈唬,对手多数都fold了。真不知道他是怎么能那么快地判断出来。很多地方,感觉匪夷所思。

前几天,他给matt janda出道题,他说假如牌面是k102,hu game,我们在大盲,假如我们check,对手也check,且,我们知道对手的一个tendency,就是,他会bet ak,qk,等,但会check k3,k4,k5,如果转来了个9,我们该怎么办?答案是,我们应该以34 35 45 诈唬,嘿嘿

作者: xzfromcs    时间: 2015-7-21 13:28
Tamarin 发表于 2015-7-21 04:08
或者是sulsky半年在ps nl500zoom赢了127万,其中你输给他34万?

我打的是线上低级别 NL100 , 从来没和高额职业玩家打过。 这是Sauce最近一百来万手牌的盈利曲线。

作者: xzfromcs    时间: 2015-7-21 13:32
leisong 发表于 2015-7-21 12:34
我不打线上,但这哥们的数据的确有点晃人,可能是他那个级别的特点吧
我看过他的视频,他说话太快,很难 ...

我也对GTO有一些研究, 但是我真心觉得对LIVE POKER帮助不大。
作者: xzfromcs    时间: 2015-7-21 13:39
说实话 就是在Online 中低级别, 我们的重点还是要考虑怎么剥削那些差的玩家  而不是一味地去平衡自己的range 这样子会损失非常多的价值 。
作者: leisong    时间: 2015-7-21 13:58
xzfromcs 发表于 2015-7-21 13:39
说实话 就是在Online 中低级别, 我们的重点还是要考虑怎么剥削那些差的玩家  而不是一味地去平衡自己的ran ...

谢谢你的建议,但,我只是部分同意你的观点,今天太晚了,手头还有点事,忙完了就要睡了,改天我们详细讨论。

作者: ggyy1414    时间: 2015-7-21 23:18
xzfromcs 发表于 2015-7-21 01:57
Sauce

这图是哪里看的啊?
没看懂,玩了168k手NL500 ,赢了1.27M刀?  不可能吧
怎么还有3个月是输钱的  看不懂这图  能解释下吗 谢谢

作者: Tamarin    时间: 2015-7-22 00:57
本帖最后由 Tamarin 于 2015-7-22 01:04 编辑
ggyy1414 发表于 2015-7-21 23:18
这图是哪里看的啊?
没看懂,玩了168k手NL500 ,赢了1.27M刀?  不可能吧
怎么还有3个月是输钱的  看不懂 ...

168k手按赢率算是12万,所以不妨假设127万是sulsky在wsop前的500z总盈利,总手数是约176万。168k就是hero跟他同桌次数,34k就是两人交手次数。34万是同桌时sulsky的总盈利。hero还算是比较好的,只输了12bb。这只是我瞎菜的。

作者: leisong    时间: 2015-7-22 06:06
本帖最后由 leisong 于 2015-7-22 06:11 编辑
xzfromcs 发表于 2015-7-21 13:39
说实话 就是在Online 中低级别, 我们的重点还是要考虑怎么剥削那些差的玩家  而不是一味地去平衡自己的ran ...

关于gto和exploitive在 online与live和小级别与中高级别中的应用与价值,其实是个比较大的题目,网络上关于这两点的争论我们几乎也随处可见。我也看了很多相关的讨论,有了一些心得,但要展开全部说清楚,真不是几句话的事,我就试着说说我的看法。



这两者其实是互补的,有事候,他们是一致的,比如我在前一个帖子中说的那个第二个toy game。

在小级别里,gto没有多大用处,主要还是exploitive,这个我完全同意,但是,有一点我们可能忽略了,就是,所有的exploitive play都是针对对手偏离optimal play而采取的相反策略,在我们设计自己的exploitive line的时候,我们思考的出发点一定是optimal play,这就是说,理解optimal play,会扩展我们的exploitive play,使其更加有效。然而,有一点是毫无疑问的,小级别里,经常会出现多人底池,这时optimal play真的就没有太多作用了。这也就是为什么,我们在打小级别是,要更多地采取隔离打法。


如果这个桌子偏弱,这种隔离打法会很有效,如果这个桌子上还有几个reg,比如在北美5/10的桌子上,他们清楚我们在干什么,他们很快就会做出调整,这时候,我们要是没有相应的防守策略,我们几乎就会被完全压制。

在小级别里,的确有很多差的玩家,他们的打法几乎都是严重偏离optimal play,但,如果我们自己对optimal play都没有一个清晰的认识,我们如何更准确地解构他们的错误,如何更准确有效地建立自己的相反的exploitive play呢?如果没有一个清晰的对optimal play的认识,我们在采取exploitive play时,事实却是,我们自己变得expoitable了。比如,我们在桌上看到一个玩家tilt,他的打法突然改变了,这时我们通常就会立即对他发起进攻,但,其实,由于他原来本身就是偏离optimal play,他的变化却是正好让他的策略变得更加平衡了,或者变成完全压制我们将采取策略的策略。

gto除了那些公式以外,其实还有一个重要的的内容,就是学习构建我们自己的range,在这个过程中,我们不仅可以逐渐使自己的range适应任何spot,同时还能深刻理解对手在每个spot上的range构成,如果我们自己都不能理解自己range,我们又如何能够最大化地剥削对手的range呢?

无论online还是live,gto的那些数学是不会改变的,其背后的理论也不会改变的,gto和exploitive是互补的,且越高级别,其价值越大,即使是在小级别,gto也会拓宽我们的剥削策略和提高其效率。

以上是我的粗浅看法,希望能够一起深入讨论。谢谢



作者: leisong    时间: 2015-7-22 06:23
再说一点,我对gto的认识和启蒙,来自我的一个朋友,andy,他是个比较有天赋的年轻人,他的性格非常aggressive,非常适合打牌,我在这方面非常差,他现在是,多伦多有多大的game,他打多大的,他刚开始上5/10,经常被reg打的找不着北,开始的时候只知道蛮干,后来通过学习gto,他已经慢慢地把那些reg给抛在了身后。
作者: xzfromcs    时间: 2015-7-22 09:14
本帖最后由 xzfromcs 于 2015-7-22 09:39 编辑
Tamarin 发表于 2015-7-22 00:57
168k手按赢率算是12万,所以不妨假设127万是sulsky在wsop前的500z总盈利,总手数是约176万。168k就是hero ...

兄弟,这图不是这么看的。  可能是这个图没表示清楚吧, 这个成绩里面是包括高额桌德州和奥马哈的, 而且里面没有HERO。  
500 zoom只是SAUCE 最近打的一个级别,所以显示在最上面。

作者: xzfromcs    时间: 2015-7-22 09:16
本帖最后由 xzfromcs 于 2015-7-22 09:38 编辑
ggyy1414 发表于 2015-7-21 23:18
这图是哪里看的啊?
没看懂,玩了168k手NL500 ,赢了1.27M刀?  不可能吧
怎么还有3个月是输钱的  看不懂 ...

500Z 只是他最近玩的级别, 这168K手包括高额NLHE和PLO在里面 。   
图是在一个收费网站上查的,国外的PRO查CHASH都是在那边查。  还有,这里面是没有HERO的,另外那个朋友是瞎猜的 ,呵呵。


作者: xzfromcs    时间: 2015-7-22 09:32
本帖最后由 xzfromcs 于 2015-7-22 09:41 编辑
leisong 发表于 2015-7-22 06:06
关于gto和exploitive在 online与live和小级别与中高级别中的应用与价值,其实是个比较大的题目,网络上关 ...

我想这个问题, 开这个贴的http://www.zhiyoucheng.co/thread-15018-1-1.html   黄老师最适合跟你讨论。  
原来你是打的国外2 5 , 5 10  , 这个我不了解, 一开始以为你说的是国内的局。

作者: taiji18    时间: 2015-7-22 16:18
GTO是个固定的网,EPV是把叉子或能抡的网




欢迎光临 智游城 (http://zhiyoucheng.co/) Powered by Discuz! X3.2