智游城

标题: 讨论回答各种gto的问题 [打印本页]

作者: leisong 时间: 2015-6-14 03:54
标题: 讨论回答各种gto的问题
本帖最后由 leisong 于 2015-6-14 04:00 编辑

开帖讨论回答各种gto的问题。最近5/10打的比较多，感觉越来越有必要学习讨论这个主题了。

1、什么是gto？
由数学模型决定的最佳扑克决策理论。
2、扑克真的有gto吗？
有，但还没有达到完美。
3、为什么要学习gto？
因为gto是个auto money maker。

以上说的对于不对都没关系，只是想讨论。欢迎对gto感兴趣的牌友可以随加入讨论，我尽量回答任何问题。

作者: doglas 时间: 2015-6-14 05:58
高深的问题，等高手吧，我这样的小虾米，就等等看

作者: leisong 时间: 2015-6-14 06:51
这也是个问题，你是再问gto高深吗？我的回答是no，very simple。

作者: xiaozhu88 时间: 2015-6-14 11:32
本帖最后由 xiaozhu88 于 2015-6-14 11:37 编辑

我先问两句:

A."......最佳扑克决策理论"的依据是什么?

B."...还没有达到完美"......那你又怎么说是"......最佳"呢?

突然想起:

古代故事传说，有一个人卖矛和盾，夸他的盾最坚固，什么东西也戳不破；又夸他的矛最锐利，什么东西都能刺进去。旁人问他，‘拿你的矛来刺你的盾怎么样？’那人没法回答了（见于《韩非子?难一》）。

作者: leisong 时间: 2015-6-14 11:58

xiaozhu88 发表于 2015-6-14 11:32
我先问两句:

A."......最佳扑克决策理论"的依据是什么?

问的好，我试着回答啊
gto直接意思就是最佳的扑克游戏理论，他是在完全不考虑对手的frequency的情况下，通过数学模型计算出来的策略tree，这个tree的之所以被称为最佳，是因为它不能被任何其它策略盘剥压制。
为什么说是完美的，，，，这个这个，，，你觉得不美吗？但还没有达到完美是说，目前的理论发展和计算能力还无法计算出所有spot的终极tree。

作者: Tamarin 时间: 2015-6-15 11:51
能举个具体例子吗？我今天坐上牌桌，拿到什么牌在什么位置怎么打，在哪条街遇到什么action怎么作出反应。

作者: leisong 时间: 2015-6-15 12:23

Tamarin 发表于 2015-6-15 11:51
能举个具体例子吗？我今天坐上牌桌，拿到什么牌在什么位置怎么打，在哪条街遇到什么action怎么作出反应。
...

在6max中，目前，饭钱几乎所有位置的各种组合的gto基本已经有了定论。饭后还不行，组合太多，参与参数太多，目前还只是部分解决了，但，如果是个给定的场景，gto肯定是能够计算出来的。就比如你那手ak，在a82ccc的flop，gto是能够计算出来的，河牌我还不确定，但bet flop check turn，应该已经很接近gto了。

作者: leisong 时间: 2015-6-16 03:35
一个新的思考
场景：one of sama played hand ,as3s, on the 2s5s10cadkd river,
我们check the river behind 这里是gto吗？如果是，为什么？如果不是，我们该建立怎样的check or bet的ratio以使其更接近gto?如何执行这个ratio？

作者: leisong 时间: 2015-6-16 03:51

leisong 发表于 2015-6-16 03:35
一个新的思考
场景：one of sama played hand ,as3s, on the 2s5s10cadkd river,
我们check the river behi ...

我思考的结果是
确定这里check到底是不是gto的依据不是结果，而是思考过程。有可能是，有可能不是。
我觉得这里bet，从理论上看，应该完全基于gto 的策略出发，这个ratio的目的应该是使我们的river bet更难以或者不可能被exploit。
只有在我们认为我们的river bet已经被exploit 的情况下，我们才有必要考虑一个恰当的ratio去执行。

欢迎参与讨论。

作者: leisong 时间: 2015-6-16 04:00
本帖最后由 leisong 于 2015-6-16 04:17 编辑

学习gto只是为了对抗高手吗？
no, absolutely not.因为即使是一个最差的玩家，也会对一定的spot进行针对性的调整，在我们还不知到他调整的结果是betting two much or checking two much or calling two much or folding two much的时候，gto策略就变得相当给力。

事实上，我认为，即使是在一个session中，我们也有很多的spot的decision making should be armed for gto.

作者: Tamarin 时间: 2015-6-16 06:11

leisong 发表于 2015-6-16 04:00
学习gto只是为了对抗高手吗？
no, absolutely not.因为即使是一个最差的玩家，也会对一定的spot进行针对性 ...

我觉得用gto去玩儿无限单次换应该不错。你能写一个这样的策略吗

作者: leisong 时间: 2015-6-16 10:05
no i cant，sorry(-.-)

作者: leisong 时间: 2015-6-17 04:46
why we should make our opponents indefferent to call with his bluff catcher？i think it is the a good starting point of thinking about gto。

作者: leisong 时间: 2015-6-17 04:46
on the river

作者: pongba 时间: 2015-6-17 06:01
我对GTO有这样一个疑惑：都说GTO的好处在于我们可以只打自己的range，不需要过多考虑对手怎样，就至少能够保证盈利。但是这个似乎只在我们处于防守方的时候适用（即不管对手怎么变化，我们始终保持一个GTO的defense frequency，对手非但无法剥削我们，而且当对手偏离太多的时候我们的proper defense frequency能够自动盈利，比如当对手bluff freq过高时），但当我们处于进攻方的时候，GTO就不那么美好了，因为进攻方的GTO策略依赖于一个很强的假设，即PvBC（Polarized Range vs. Bluff Catchers），只有在完美的符合PvBC模型的时候我们才能通过GTO frequency让对手indifferent between calling or folding，但实战中我们的处于防守方的对手的range并不是BC，比如他们会slow play一些牌，尤其是in position的时候，使得我们的两级下注撞上一个uncapped range，就不那么美好了。

作者: leisong 时间: 2015-6-17 10:38

pongba 发表于 2015-6-17 06:01
我对GTO有这样一个疑惑：都说GTO的好处在于我们可以只打自己的range，不需要过多考虑对手怎样，就至少能够 ...

我试着回答一下啊

用个例子吧，你在btn，raise，sb fold，bb call with j9s。

flop：2810r，bb check，你bet，bb call
turn：3，still rainbow，bb check，你bet，bb call。

river，here the point，假设无论发什么牌，bb都会check。我们发三次河牌。

第一次 7，
第二次，j
第三次，2

for some reason，我们对着这三个河牌，全部all in。现在应该清楚一点了吧，就是，我们只需要让他在第二个河牌的情况下，indefferent。
HE will call 7 and fold 2 river，no indefference we need here。

作者: 我是Jsli 时间: 2015-6-17 12:54

1.什么是gto？
由数学模型决定的最佳扑克决策理论.

以上说的对于不对都没关系,只是想讨论.欢迎对gto感兴趣的牌友可以随加入讨论.
--------------
牌桌上一上智游城就输钱
不知道啥问题

但是还是忍不住看帖回贴
1.是雷哥贴子
2.是新东西.老人家了就怕脑袋成石头不学习.

我先问个问题
建立模型的作用是什么？

作者: 我是Jsli 时间: 2015-6-17 13:02
本帖最后由我是Jsli 于 2015-6-17 13:17 编辑

我是Jsli 发表于 2015-6-17 12:54
1.什么是gto？
由数学模型决定的最佳扑克决策理论.

道可道非常道
这个是老子对事物的描述

相比西方对事物的描述
差了几亿光年

除非眼见为实
西方用数学建立模型
来表达对事物的认识

作者: 我是Jsli 时间: 2015-6-17 13:13

我是Jsli 发表于 2015-6-17 13:02
道可道非常道这个是老子对事物的描述

相比西方对事物的描述

扑克中的"事物”是什么？
是你看到了对方的两张牌
从而能使你准确的"靠"或“弃”牌

当然现实中不可能看到对方的两张牌
那么是否有可能数学上有一个模型
能知道对方的牌或接近知道对方的牌

我们这里往下引深
看到对方的牌能使我们做出正确的决定
那么如果有一个模型
能使我们大多数时候能做出正确的决定
或者使对方大多数时候做出了错误决定
这个模型就是靠谱的

作者: 我是Jsli 时间: 2015-6-17 13:30
本帖最后由我是Jsli 于 2015-6-17 13:40 编辑

说了这么多的目的
我试图用上面的理念来解读雷哥的贴子
注意下面两句话
1.我们的action大多数时候能做出正确的决定

2.或者我们的action使对方大多数时候做出了错误决定

作者: 昆仑苍狼 时间: 2015-6-17 14:36

我是Jsli 发表于 2015-6-17 13:30
说了这么多的目的
我试图用上面的理念来解读雷哥的贴子
注意下面两句话

此贴会不会就这样终结了呢lol

作者: leisong 时间: 2015-6-17 21:09

我是Jsli 发表于 2015-6-17 13:30
说了这么多的目的
我试图用上面的理念来解读雷哥的贴子
注意下面两句话

感谢老李捧场，上述思考很有启发性，你看，学习就有帮助吧，哈哈

作者: leisong 时间: 2015-6-17 21:09

昆仑苍狼发表于 2015-6-17 14:36
此贴会不会就这样终结了呢lol

兄弟何出此言呢？

作者: leisong 时间: 2015-6-17 21:28

pongba 发表于 2015-6-17 06:01
我对GTO有这样一个疑惑：都说GTO的好处在于我们可以只打自己的range，不需要过多考虑对手怎样，就至少能够 ...

再举个例子

viffer曾经在2+2贴出一个牌谱
他在前位open with aq，后位3bet，他跟，hu。
翻拍qxx，viffer check，对手bet，viffer call。
转brick，viffer check，对手bet，viffer call。
河牌brick，viffer check，对手all in。

viffer的问题是，他该fold还call。

这就是gto闪光的地方，首先，viffer的对手已经通过极化的range，让viffer的bluff catcher 处于一个 indefferent to call的状态。
其次，veffer的问题，其实就是gto要解决的问题。
如何解决，就是老李问的问题，即这个数学模型是什么。

作者: pongba 时间: 2015-6-18 02:00

leisong 发表于 2015-6-17 10:38
我试着回答一下啊

用个例子吧，你在btn，raise，sb fold，bb call with j9s。

怎么能假定对手就hold J9呢？如果对手会在turn上call所有的OESD，那么在7和J的river上对手都有一个uncapped range，你在bet一个polarized range的时候，就不能根据PvBC的模型来计算GTO的EV了，因为对手的range里面有相当一部分不是BC。
以上，我的意思是，只有当对手在turn上会fold所有的OESD，我们bet7和J的rv才能利用PvBC模型完美的计算出GTO EV。但是这个依赖于对手turn的tendency的assumption。

作者: Tamarin 时间: 2015-6-18 02:26

leisong 发表于 2015-6-17 21:28
再举个例子

viffer曾经在2+2贴出一个牌谱

我问一个简单的。GTO要求的cbet和call cbet的频率分别是多少？HU与 3人锅有何不同？

作者: leisong 时间: 2015-6-18 04:26

Tamarin 发表于 2015-6-18 02:26
我问一个简单的。GTO要求的cbet和call cbet的频率分别是多少？HU与 3人锅有何不同？ ...

先回答你的，这个问题没人能回答，如果能，gto就真的成了石头剪子布了。
必须根据饭前的范围和board texture，才能确定比例。
gto在做决策时，的确是不考虑对手的frequency的，但却一定要计算对手的range。

作者: leisong 时间: 2015-6-18 04:36

pongba 发表于 2015-6-18 02:00
怎么能假定对手就hold J9呢？如果对手会在turn上call所有的OESD，那么在7和J的river上对手都有一个uncapp ...

怎么能假定对手就hold J9呢？

（）我这里可能没说清楚，我从来都没有假定让他fold。

如果对手会在turn上call所有的OESD，那么在7和J的river上对手都有一个uncapped range，你在bet一个polarized range的时候，就不能根据PvBC的模型来计算GTO的EV了，因为对手的range里面有相当一部分不是BC。

（）这个你说的对，这里，我只是举个例子，可能和你的提问不太切合，即，我们不是要让对手的所有的牌都indefferent to call，只是让他整个range里的bluff cataher那部分 indefferent。

以上，我的意思是，只有当对手在turn上会fold所有的OESD，我们bet7和J的rv才能利用PvBC模型完美的计算出GTO EV。但是这个依赖于对手turn的tendency的assumption。

（）没有完美的模型，要是有，就不是gto了，是下棋，或者是看见对手的牌。gto所说的最佳，是建立在不完全信息博弈下的最佳。

总结一下，我觉得回答你的问题的最好的解释是——我们不是要让对手的所有的牌都indefferent to call，只是让他整个range里的bluff cataher那部分 indefferent。

作者: pongba 时间: 2015-6-18 04:44

leisong 发表于 2015-6-18 04:36
怎么能假定对手就hold J9呢？

（）我这里可能没说清楚，我从来都没有假定让他fold。

是的，你说的“总结一下，我觉得回答你的问题的最好的解释是——我们不是要让对手的所有的牌都indefferent to call，只是让他整个range里的bluff cataher那部分 indefferent。”这个我知道，我的意思是，让他的整个range中的BC部分indifferent，并不是我们实战当中所关心的最终目的，所以我的意思是GTO回答了以上这个问题，可这个问题的答案却并不是我们实战当中关心的那个最终问题：就是我这个action的EV是多少。完全有可能你根据GTO假设算出来一个+EV，可实际上却是-EV，因为对手的range长什么样，是一个强假设。可能这也是为什么当初dwan在2+2上说NLHE GTO不存在的原因，当然，因为大家的总体打法有一些共通的倾向性，比如在wet board上OOP call raise一般可以排除sets，所以在很多时候对于对手range的assumption是基本能够成立的，但是如果严格来说的话，因为这个游戏本质上的不确定性，poker的“解”和象棋的“解”有一个本质的不同，就是就算你计算机计算出了完整的game tree，你还是需要对对手的range的assumption来选择去tree的哪个分支。

作者: leisong 时间: 2015-6-18 07:21
本帖最后由 leisong 于 2015-6-18 07:25 编辑

pongba 发表于 2015-6-18 04:44
是的，你说的“总结一下，我觉得回答你的问题的最好的解释是——我们不是要让对手的所有的牌都indefferen ...

非常感谢这位兄弟，我们一起学习。

是的，你说的“总结一下，我觉得回答你的问题的最好的解释是——我们不是要让对手的所有的牌都indefferent to call，只是让他整个range里的bluff cataher那部分 indefferent。”
这个我知道，我的意思是，让他的整个range中的BC部分indifferent，并不是我们实战当中所关心的最终目的，所以我的意思是GTO回答了以上这个问题，可这个问题的答案却并不是我们实战当中关心的那个最终问题：就是我这个action的EV是多少。

（）首先，我想说的是，gto player always take the most plus ev line。

完全有可能你根据GTO假设算出来一个+EV，可实际上却是-EV，因为对手的range长什么样，是一个强假设。

（）我不太明白你这里说的实际上是-ev是什么意思。的确，对手的range是个强假设，但，这个假设是建立在一个稳定且可操作的逻辑之上的，这个逻辑就是game theory。

可能这也是为什么当初dwan在2+2上说NLHE GTO不存在的原因，

（）关于gto是否存在，这个命题已经没有任何讨论的必要了，这就好比用石头剪子布的gto基本原理来对比扑克gto的基本原理一样。有意思的是，现在很多人仍然对gto持这种观点。

当然，因为大家的总体打法有一些共通的倾向性，比如在wet board上OOP call raise一般可以排除sets，所以在很多时候对于对手range的assumption是基本能够成立的，但是如果严格来说的话，因为这个游戏本质上的不确定性，poker的“解”和象棋的“解”有一个本质的不同，就是就算你计算机计算出了完整的game tree，你还是需要对对手的range的assumption来选择去tree的哪个分支。

（）是的，gto肯定是经过比较，选择most plus ev的那个tree。这里，我这么解释吧，假设我们在某个spot，需要在check和bet之间，作出一个ratio，那也仅仅是因为，这个check和bet的ev是一致的，如果bet的ev大于check，gto永远选择bet，而不在两者之间是选择一个ratio。

作者: 昆仑苍狼 时间: 2015-6-18 08:06

leisong 发表于 2015-6-17 21:09
兄弟何出此言呢？

都说老李是贴子终结者
看来不是真的
此帖仍在继续
开个玩笑

作者: 昆仑苍狼 时间: 2015-6-18 08:16
3、为什么要学习gto？
因为gto是个auto money maker

Gto不是防守型策略么
告诉我们对付高手时如何做到不吃亏
在我的印象中最好只能做到持平
有点像21点的策略表

不太像auto money maker

作者: leisong 时间: 2015-6-18 14:36
本帖最后由 leisong 于 2015-6-18 14:38 编辑

昆仑苍狼发表于 2015-6-18 08:16
3、为什么要学习gto？
因为gto是个auto money maker

Gto不是防守型策略么

（）gto的一个重要策略就是，在河牌让用一个极化的bet，使自己极化的range让对手indefferet to call ，你认为这是防守吗？

告诉我们对付高手时如何做到不吃亏
在我的印象中最好只能做到持平

（）这是把石头剪子布gto简单平移到扑克的误导性结论，扑克不是石头剪子布。

有点像21点的策略表

不太像auto money maker

（）实际上，gto，是个超级exploit 对手的策略，只是，这种exploit，是均衡状态下做到的。

作者: leisong 时间: 2015-6-19 00:32
gto实战思考，说了很多空洞的理论，现在来点实战的。

我们是否应该在河牌bluff？

假如我们open from btn，bb call，我们bet flop bet turn，然后，河牌是Q8452r,对手check给我们，那么我们是否应该bluff？怎么bluff，gto在这里是如何思考的呢？

作者: leisong 时间: 2015-6-19 00:36
本帖最后由 leisong 于 2015-6-19 00:38 编辑

再来个思路题目，我也一直在想。
如果有两个range让你选择，一个是polarized,一个是condensed,你愿意选择哪一个，为什么？
游泳去了先，有空回来接着聊

作者: Tamarin 时间: 2015-6-19 03:21

leisong 发表于 2015-6-19 00:36
再来个思路题目，我也一直在想。
如果有两个range让你选择，一个是polarized,一个是condensed,你愿意选择哪 ...

Easy game

作者: Tamarin 时间: 2015-6-19 05:45

Tamarin 发表于 2015-6-19 03:21
Easy game

当判断对手在咋呼时，gto要求我们加注还是just call?

作者: 我是Jsli 时间: 2015-6-19 07:45

leisong 发表于 2015-6-19 00:36
再来个思路题目，我也一直在想。
如果有两个range让你选择，一个是polarized,一个是condensed,你愿意选择哪 ...

跟着雷哥学英语

如果两个牌手或多个牌手
都试图gto

那么这里的gto最优化的打法
是相同的还是不同的

作者: 我是Jsli 时间: 2015-6-19 08:51
本帖最后由我是Jsli 于 2015-6-19 08:53 编辑

我是Jsli 发表于 2015-6-19 07:45
跟着雷哥学英语

如果两个牌手或多个牌手

如果对所有牌手而言
gto是单一的唯一的
那么两个牌手同桌都试图使自己打法最优化
就好比两个武士同时用盾牌对打

如果对所有牌手而言
gto不是单一的唯一的
那么扑克就是剪刀石头布的游戏
简单说就是针对性

作者: 我是Jsli 时间: 2015-6-19 10:17

昆仑苍狼发表于 2015-6-18 08:06
都说老李是贴子终结者
看来不是真的
此帖仍在继续

这个情况我是很自豪的说

你看霍师傅一贴计算公式
大家就都闭嘴了

作者: 昆仑苍狼 时间: 2015-6-19 10:25

我是Jsli 发表于 2015-6-19 10:17
这个情况我是很自豪的说

你看霍师傅一贴计算公式

哈哈哈

作者: leisong 时间: 2015-6-19 11:50

我是Jsli 发表于 2015-6-19 07:45
跟着雷哥学英语

如果两个牌手或多个牌手

感谢老李捧场，你看学习多好，提供技术增进了解，不废话了，继续学习gto。

跟着雷哥学英语

如果两个牌手或多个牌手
都试图gto

那么这里的gto最优化的打法
是相同的还是不同的

（）肯定是相同的，说实话，我是花了很长时间，看了大量的资料，才对gto有了入门的认识，仅仅是入门，所以还要刻苦学习。gto是建立在这样的一个假设上的，假设A和B，两个人玩牌，设想一下，他俩玩了数万兆兆（此处省略了n个兆）年，那么，他俩经过无数次调整，最终肯定会达到一个状态，即，谁都没有动机偏离自己既定的策略，这是，两个人就达到了一个均衡（equilibrium，也可以叫做nash equilibrium），这个策略就是所谓的gto。

如果对所有牌手而言
gto是单一的唯一的
那么两个牌手同桌都试图使自己打法最优化
就好比两个武士同时用盾牌对打

（）如果谁偏离了这个均衡，谁就会被对方盘剥，即被exploit。

如果对所有牌手而言
gto不是单一的唯一的
那么扑克就是剪刀石头布的游戏
简单说就是针对性

（）扑克与势头尖子步不一样，扑克不是对称的游戏，所以不能把势头尖子步的gto，平移到扑克上。

这个情况我是很自豪的说

你看霍师傅一贴计算公式
大家就都闭嘴了

（）gto，对于霍爷绝对是小儿科，烦他老人家出手，那就好比用屠龙的刀杀鸡，我等小辈在这里瞎比划比划就行了。

作者: 我是Jsli 时间: 2015-6-19 12:23

leisong 发表于 2015-6-19 11:50
感谢老李捧场，你看学习多好，提供技术增进了解，不废话了，继续学习gto。

跟着雷哥学英语

(1)gto是建立在这样的一个假设上的,假设A和B,两个人玩牌,设想一下,他俩玩了数万兆兆(此处省略了n个兆)年,那么,他俩经过无数次调整,最终肯定会达到一个状态,即,谁都没有动机偏离自己既定的策略,这是,两个人就达到了一个均衡(equilibrium,也可以叫做nash equilibrium),这个策略就是所谓的gto.

(2)如果谁偏离了这个均衡,谁就会被对方盘剥,即被exploit.

(3)扑克与势头尖子步不一样,扑克不是对称的游戏,所以不能把势头尖子步的gto,平移到扑克上.
-----------------------------------------------------------------------
先说简单的 (3)
因为看不到对方的两张牌,所以扑克与围棋相棋不同,是不对称的游戏
剪刀石头布为什么不是不对称的游戏？

(1)(2)意思有相关性
gto与每条街追求最大+EV的行为是不是同一件事？

作者: Ander_AK 时间: 2015-6-19 14:56
关于GTO，我想问的三个问题是：

雷哥你打牌时是严格按照GTO的吗？

如果是，赢钱吗？

如果赢，能透露下winrate吗？

作者: leisong 时间: 2015-6-19 16:05

我是Jsli 发表于 2015-6-19 12:23
(1)gto是建立在这样的一个假设上的,假设A和B,两个人玩牌,设想一下,他俩玩了数万兆兆(此处省略了n个兆)年, ...

刚看完美剧，聊几句碎觉

先说简单的 (3)
因为看不到对方的两张牌,所以扑克与围棋相棋不同,是不对称的游戏
剪刀石头布为什么不是不对称的游戏？

（）石头剪子布是对称游戏，扑克是位置游戏。

(1)(2)意思有相关性
gto与每条街追求最大+EV的行为是不是同一件事？

（）这个是两个概念，如果你这里的（每条街追求最大+EV的行为）指的是exploit的话。这个要细说，我过两天详细解释这里。普通意义上，回答是yes。

作者: leisong 时间: 2015-6-19 16:20

Ander_AK 发表于 2015-6-19 14:56
关于GTO，我想问的三个问题是：

雷哥你打牌时是严格按照GTO的吗？

问的好，阎总果然犀利，我就厚着脸说几句啊，对错都请阎总包涵。
雷哥你打牌时是严格按照GTO的吗？

（）我只能说尽量做到，或是尽量靠近。
首先，ｇｔｏ给我们的是大量的框架。我句个例子，ｂｔｎ加住３ｂｂ,大忙以ｋｋ３ｂｅｔ,ｂｔｎ　ｃａｌｌ。翻牌，３６８两个红逃，ｂｂ　ｂｅｔ,ｂｔｎ　ｃａｌｌ,转红逃８。ｂｂ?
就这个ｓｐｏｔ，要用ｇｔｏ演算出一个策略ｔｒｅｅ，结果和一个圣诞树差不多。临场要是做到，实在是太难了。这就引出了下面这两点，一，ｇｔｏ，理解比应用重要，二，场上的操作完全取决于下边练习演算。

如果是，赢钱吗？

（）最近打５／１０的多了一些，感觉和２／５完全不是一个ｇａｍｅ，如果不懂ｇｔｏ,嘿嘿，基本就靠猜了。

如果赢，能透露下winrate吗？

（）还好，娱乐为主。

感谢阎总捧场，多多指导

作者: bomb 时间: 2015-6-19 16:43

leisong 发表于 2015-6-19 16:20
问的好，阎总果然犀利，我就厚着脸说几句啊，对错都请阎总包涵。
雷哥你打牌时是严格按照GTO的吗？

“尽量靠近，尽量做到”是什么意思？你是说你不知道答案，尽量去猜，还是说只是因为临场来不及计算，但事后还是知道gto的应对，从而确认自己的打法跟gto接近？

这是两个不同的概念，前者是你主观认为，后者才有一个参考标准（尽管这个参考标准也是主观上“知道”的，但至少会有相应的具体说法来辩论）

作者: leisong 时间: 2015-6-19 19:52

bomb 发表于 2015-6-19 16:43
“尽量靠近，尽量做到”是什么意思？你是说你不知道答案，尽量去猜，还是说只是因为临场来不及计算，但事 ...

擦，独自装逼被你发现了，嗯，说好尽量一起装的，呵呵，嗯，我很欣赏你。

作者: 我是Jsli 时间: 2015-6-19 20:29
本帖最后由我是Jsli 于 2015-6-19 20:45 编辑

leisong 发表于 2015-6-19 19:52
擦，独自装逼被你发现了，嗯，说好尽量一起装的，呵呵，嗯，我很欣赏你。
...

打夜场？

一个好的模型一定要应用性强
能郎郎上口

比如星爷解释range翻后的作用
要靠很大的计算量
当然这些计算可以场下练习

但是这类繁复的计算会产生两个问题
1.本末倒置.现场扑克最重要的是了解牌手类型.
描述牌手类型两句话就够了
对方能弃牌吗
对方会bluff吗

2.1/2-2/5扑克在主流国家已经广为普及
而打好1/2-2/5对于牌手的生活需要已经可以满足
高手打生打死的场面没必要
比如智游城墙爷与霍师傅各买入300BB
非要比个高低
这个是要看医生吃药的节奏了

简单直接的应用法则比如小三法
要更有效的多

作者: 我是Jsli 时间: 2015-6-21 07:44
www.zhiyoucheng.co/thread-18389-1-1.html
本来想在这个贴子说的
还是与雷哥熟悉多一些
瞎说也无妨

有一个蒙蒙笼笼的认识
扑克gto最优化理论的依据是
一切围绕对方的"弃牌"

原因很简单
两个人把把打到河牌是分不出输赢的

作者: 老陈 时间: 2015-6-26 20:37
从某种意义上讲，学习、掌握、熟练运用GTO，几乎是成为扑克高手的必要条件。
我认为一个不运用GTO的赢家，熟练运用GTO，就如同如虎添翼。

作者: 老陈 时间: 2015-6-26 20:48
本帖最后由老陈于 2015-6-26 06:58 编辑

我是Jsli 发表于 2015-6-20 17:44
www.zhiyoucheng.co/thread-18389-1-1.html
本来想在这个贴子说的
还是与雷哥熟悉多一些

我有不同意见。

不是完全围绕对方“弃牌”。
举例：对手加注后，我们拿77，我们要根据有效筹码量做出跟注或弃牌的决策。

把把打到河牌也有输赢。
你赢我时打进200BB，我赢你时打进20BB，咱俩这样打下去，我最后的几个硬币都得输给你。

作者: leisong 时间: 2015-7-20 09:55
本帖最后由 leisong 于 2015-7-20 09:59 编辑

Ander_AK 发表于 2015-6-19 14:56
关于GTO，我想问的三个问题是：

雷哥你打牌时是严格按照GTO的吗？

rich认为我对阎总的这个帖子回复的不够诚恳，我就尽量再做到非常非常诚恳。

阎总，你问我打牌时，是否严格按照gto？我想说的是，gto本身只是个标杆，即，在我们不了解对手的时候，我们该怎么思考我们的决策。由于最近我打5/10的比以前稍多了一些，难免在桌上遇到很多tough的对手，他们会在后位频繁地对我发起攻击，很多时候，我真的不知道该怎么办，这时，gto就给我了一个比较好的量化的架构。就如我在“三个无价德州扑克公式”帖子里提到的，那些公式，就给了我很好的思考起点。

其实，我觉得，“严格按照”这个词，在这里不是很贴切，gto的那些公式，只是一个架构，他不仅让你在面对tough的玩家时，有了最大化ev的决策依据，同时，当我们面对那些比较差的玩家时，有了这些架构，我们能够知道如何偏离我们的默认策略，从而去盘剥对手。

比如，在河牌，你看到一个人手持AQ，在QJ723彩虹的牌面，在持续下注两天街后，到了河牌，却check behind，那我们就可以判定，他河牌的bluff比例是远远不够的，同时，他河牌的betting range是非常极化的。那么以后，我们当然就可以做出针对性调整，而不是还死板地在他河牌下注时，还要以最佳的跟注频率去应对。这只是个例子，我把结论简单化，因为要说清，需要太多的分析和计算。

作者: leisong 时间: 2015-7-20 10:03

bomb 发表于 2015-6-19 16:43
“尽量靠近，尽量做到”是什么意思？你是说你不知道答案，尽量去猜，还是说只是因为临场来不及计算，但事 ...

“尽量靠近，尽量做到”是什么意思？你是说你不知道答案，尽量去猜，还是说只是因为临场来不及计算，但事后还是知道gto的应对，从而确认自己的打法跟gto接近？

这是两个不同的概念，前者是你主观认为，后者才有一个参考标准（尽管这个参考标准也是主观上“知道”的，但至少会有相应的具体说法来辩论）

说实话，我真的没看懂你要表达什么，如果你有关于gto的疑问，或者有关于我说的gto的疑问，能否详细说一下？我对之前的回复也感到很不妥，rich对我已经提出了批评，我在这里向你道歉。

作者: royalflush 时间: 2015-7-20 15:55

(1)(2)意思有相关性
gto与每条街追求最大+EV的行为是不是同一件事？

（）这个是两个概念，如果你这里的（每条街追求最大+EV的行为）指的是exploit的话。这个要细说，我过两天详细解释这里。普通意义上，回答是yes。

gto 与追求最大EV是不一样的。
gto 只有在面对了解我们策略和很会根据我们策略调整来maximally exploit我们策略的对手的时候是最大EV

比如来个非常简化的例子
river pot=1 我们要bet 1, 根据gto 2/3的时候我们的bet 是 nut; 1/3的时候是air
但是面对fish 绝对的calling station的时候我们应该忽略gto 玩fully exploitative poker, bet的时候 100%是nut

作者: leisong 时间: 2015-7-20 17:56

royalflush 发表于 2015-7-20 15:55
gto 与追求最大EV是不一样的。
gto 只有在面对了解我们策略和很会根据我们策略调整来maximally exploi ...

我部分同意你的观点，gto有时很绕。其实，gto与exploitative play，有时是一样的。gto肯定是max ev。
前几天说要详细解释这里，今天正好就把这里我的认识说一下，如果有错的地方，还请你指出来。

我这里主要用toy game来解释，这样好理解和沟通。

第一个toy game

假如我俩玩这样一个游戏，咱俩每人手里一副牌，每次，咱俩同时在52张牌里拿出一张牌，然后比大小，如果一样大，平，如果你比我大，我给你一块钱，如果你比我大且只大一点，如，我出8，而你恰好出的是9，那么，我要给你10块钱。

这个游戏的gto很简单，就是咱俩最后都是把把出a。但是，假如你偏离了，不是把把出a，我的策略还是出a，因为，我无法知道你要出什么牌，所以，我出a就是 max ev。但，假如我知道你下手可能出10，那么，我的max ev就变成了出j，但是我无法知道到底你下手出什么。从这个例子我们可以看出，gto，是个auto money maker，只要对手偏离gto。

第二个toy game

假如我们在河牌，我是后位，你在前卫，你的手牌是99，这时你只有一个选项，check-call，我的手牌是aa和22，我可以选择下注，也可以选择check。这时候我的gto是什么呢？bet aa，check 22，咱俩现在就达到了纳什均衡，就是，在这个点上，没有人能够单方面的通过决策改变ev。这个情况，就是你说的，对手是个calling station。这时，如果我们还选则bet 22 50%，就不是gto了，可以说，只要bet 22，就不是gto。

第三个toy game
还是在河牌，还是上面的情况，这时，你可以选择check-fold or check-call。在我不知道你的frequency的情况下，我的gto是什么呢？就是你说的我们只bet 22 50% of the time。这种情况下，如果用crev测试一下，你就会发现，无论对手怎么调整，他的ev永远是0，我觉得，这也是gto很核心的一个东西，就是indefferent principle，在我们面对不了解的对手时，我们通过indefferent principle，max 我们的ev。

作者: lililili11 时间: 2015-7-20 18:04
本帖最后由 lililili11 于 2015-7-20 18:18 编辑

leisong 发表于 2015-7-20 17:56
我部分同意你的观点，gto有时很绕。其实，gto与exploitative play，有时是一样的。gto肯定是max ev。
前 ...

这一段说出了一个新的内容：GTO是根据新的信息调整的。我觉得这点很有价值。
一般而言，我觉得大家普遍讨论的"gto"，更多地好像是那种只看着自己手里两张牌，以及筹码量、位置等等因素，然后就根据数学做决定，而不需要得到对手的信息。这么样一种看似既“无敌”又“省事”的打法。
然而在实践中我们多多少少总会知道一些信息的，我想这也是所有人都会碰到的问题：这时候我们是应该根据信息采取针对性打法呢，还是继续采用死板的“GTO”呢？特别是对于那种我们其实又没有太大把握的信息，这时候应不应该利用上呢？
所以我觉得在这里指出这点，GTO其实也是应该根据新的信息调整的，很有价值。因为明明有信息不用，非要按照一种死板的套路来，不管它是不是已经在数学上被证明了的，感觉都会非常别扭，非常荒谬。

作者: lililili11 时间: 2015-7-20 18:31
当然这里又出现新的问题，就是“新信息到底可信不可信”？
如果其实是个假信号，那么我们调整，其实就是上当了；但是如果是个真信号，那么我们不调整，其实就是吃亏了。

一般来说，目前我看到的“GTO”的讨论，貌似都在讲一种根本不用调整的死板的静态的打法，在不用考虑上当的同时，也显得比较笨拙。
目前我还是比较倾向于一种根据信息调整的动态的均衡。

所以这里有几个要注意的：
1、有没有新信息，如果有的话，要不要用？
2、新信息可信度如何？
3、既然是根据新信息调整的，为什么不称之为剥削打法而仍然叫GTO呢？——因为不是完全信息啊，只是部分新信息啊，所以仍然不能说是彻底剥削，所以说是GTO依然没有错。——说到这里，所谓的剥削和GTO，似乎已经互相融合了→能剥削的地方就剥削，不能剥削的地方就GTO。

作者: lililili11 时间: 2015-7-20 18:45
我觉得这个一下子打开了思路：所谓的剥削打法，你能剥削到哪里去？

除了河牌一锤定音的情况，否则在后续还有几部要走的时候，我们只有一点点信息，更多的是迷茫的未知。
这时候谁敢说，自己忽然就具备了一种“最大化剥削”的能力了？
何来的自信？
咱们依据这点信息，能做到哪一步呢？把全部的range都倾斜过去？就不怕在后面的几步里，被人反剥削成一条狗？

所以现实中的扑克实践，应该永远都是剥削和GTO混合的情况。

我发现上面这一段，提到的“过度剥削”，正是我一直在犯的错误。

作者: xzfromcs 时间: 2015-7-21 01:57
本帖最后由 xzfromcs 于 2015-7-21 02:09 编辑

Sauce

作者: xzfromcs 时间: 2015-7-21 02:01
楼主是打LIVE 2/5 5/10 还是ONLINE ? 如果是LIVE这种级别，我认为平衡 / 不被剥削意义很小

作者: Tamarin 时间: 2015-7-21 03:13

xzfromcs 发表于 2015-7-21 01:57
Sauce

好图。你半年赢了Ben sulsky127万？

作者: Tamarin 时间: 2015-7-21 04:08

Tamarin 发表于 2015-7-21 03:13
好图。你半年赢了Ben sulsky127万？

或者是sulsky半年在ps nl500zoom赢了127万，其中你输给他34万？

作者: leisong 时间: 2015-7-21 04:31

Tamarin 发表于 2015-7-21 04:08
或者是sulsky半年在ps nl500zoom赢了127万，其中你输给他34万？

sulsky绝对是大神级的人物，这哥们太狠了，他曾经的一句话给我了很大鼓舞，他说：虽然我的数学不好，但我仍然可以学习gto，我虽然还没有完全掌握poker，但我知道强大的poker看起来是什么样子？（i know what the strong poker looks like.）我的数学也很差，从那以后我知道了，这并不影响我学习poker。

作者: Tamarin 时间: 2015-7-21 12:09

leisong 发表于 2015-7-21 04:31
sulsky绝对是大神级的人物，这哥们太狠了，他曾经的一句话给我了很大鼓舞，他说：虽然我的数学不好，但我 ...

你对sulsky的数据怎么看？6max里面Vpip 53, pfr33，3bet14？比较松吧？

作者: leisong 时间: 2015-7-21 12:34

Tamarin 发表于 2015-7-21 12:09
你对sulsky的数据怎么看？6max里面Vpip 53, pfr33，3bet14？比较松吧？

我不打线上，但这哥们的数据的确有点晃人，可能是他那个级别的特点吧
我看过他的视频，他说话太快，很难跟上，不过有一点，感觉他确实太牛逼了，我看见，他在很多地方说：i am gonna bluff here，然后就诈唬，对手多数都fold了。真不知道他是怎么能那么快地判断出来。很多地方，感觉匪夷所思。

前几天，他给matt janda出道题，他说假如牌面是k102，hu game，我们在大盲，假如我们check，对手也check，且，我们知道对手的一个tendency，就是，他会bet ak，qk，等，但会check k3，k4，k5，如果转来了个9，我们该怎么办？答案是，我们应该以34 35 45 诈唬，嘿嘿

作者: xzfromcs 时间: 2015-7-21 13:28

Tamarin 发表于 2015-7-21 04:08
或者是sulsky半年在ps nl500zoom赢了127万，其中你输给他34万？

我打的是线上低级别 NL100 ，从来没和高额职业玩家打过。这是Sauce最近一百来万手牌的盈利曲线。

作者: xzfromcs 时间: 2015-7-21 13:32

leisong 发表于 2015-7-21 12:34
我不打线上，但这哥们的数据的确有点晃人，可能是他那个级别的特点吧
我看过他的视频，他说话太快，很难 ...

我也对GTO有一些研究，但是我真心觉得对LIVE POKER帮助不大。

作者: xzfromcs 时间: 2015-7-21 13:39
说实话就是在Online 中低级别，我们的重点还是要考虑怎么剥削那些差的玩家而不是一味地去平衡自己的range 这样子会损失非常多的价值。

作者: leisong 时间: 2015-7-21 13:58

xzfromcs 发表于 2015-7-21 13:39
说实话就是在Online 中低级别，我们的重点还是要考虑怎么剥削那些差的玩家而不是一味地去平衡自己的ran ...

谢谢你的建议，但，我只是部分同意你的观点，今天太晚了，手头还有点事，忙完了就要睡了，改天我们详细讨论。

作者: ggyy1414 时间: 2015-7-21 23:18

xzfromcs 发表于 2015-7-21 01:57
Sauce

这图是哪里看的啊？
没看懂，玩了168k手NL500 ，赢了1.27M刀？不可能吧
怎么还有3个月是输钱的看不懂这图能解释下吗谢谢

作者: Tamarin 时间: 2015-7-22 00:57
本帖最后由 Tamarin 于 2015-7-22 01:04 编辑

ggyy1414 发表于 2015-7-21 23:18
这图是哪里看的啊？
没看懂，玩了168k手NL500 ，赢了1.27M刀？不可能吧
怎么还有3个月是输钱的看不懂 ...

168k手按赢率算是12万，所以不妨假设127万是sulsky在wsop前的500z总盈利，总手数是约176万。168k就是hero跟他同桌次数,34k就是两人交手次数。34万是同桌时sulsky的总盈利。hero还算是比较好的，只输了12bb。这只是我瞎菜的。

作者: leisong 时间: 2015-7-22 06:06
本帖最后由 leisong 于 2015-7-22 06:11 编辑

xzfromcs 发表于 2015-7-21 13:39
说实话就是在Online 中低级别，我们的重点还是要考虑怎么剥削那些差的玩家而不是一味地去平衡自己的ran ...

关于gto和exploitive在 online与live和小级别与中高级别中的应用与价值，其实是个比较大的题目，网络上关于这两点的争论我们几乎也随处可见。我也看了很多相关的讨论，有了一些心得，但要展开全部说清楚，真不是几句话的事，我就试着说说我的看法。

这两者其实是互补的，有事候，他们是一致的，比如我在前一个帖子中说的那个第二个toy game。

在小级别里，gto没有多大用处，主要还是exploitive，这个我完全同意，但是，有一点我们可能忽略了，就是，所有的exploitive play都是针对对手偏离optimal play而采取的相反策略，在我们设计自己的exploitive line的时候，我们思考的出发点一定是optimal play，这就是说，理解optimal play，会扩展我们的exploitive play，使其更加有效。然而，有一点是毫无疑问的，小级别里，经常会出现多人底池，这时optimal play真的就没有太多作用了。这也就是为什么，我们在打小级别是，要更多地采取隔离打法。

如果这个桌子偏弱，这种隔离打法会很有效，如果这个桌子上还有几个reg，比如在北美5/10的桌子上，他们清楚我们在干什么，他们很快就会做出调整，这时候，我们要是没有相应的防守策略，我们几乎就会被完全压制。

在小级别里，的确有很多差的玩家，他们的打法几乎都是严重偏离optimal play，但，如果我们自己对optimal play都没有一个清晰的认识，我们如何更准确地解构他们的错误，如何更准确有效地建立自己的相反的exploitive play呢？如果没有一个清晰的对optimal play的认识，我们在采取exploitive play时，事实却是，我们自己变得expoitable了。比如，我们在桌上看到一个玩家tilt，他的打法突然改变了，这时我们通常就会立即对他发起进攻，但，其实，由于他原来本身就是偏离optimal play，他的变化却是正好让他的策略变得更加平衡了，或者变成完全压制我们将采取策略的策略。

gto除了那些公式以外，其实还有一个重要的的内容，就是学习构建我们自己的range，在这个过程中，我们不仅可以逐渐使自己的range适应任何spot，同时还能深刻理解对手在每个spot上的range构成，如果我们自己都不能理解自己range，我们又如何能够最大化地剥削对手的range呢？

无论online还是live，gto的那些数学是不会改变的，其背后的理论也不会改变的，gto和exploitive是互补的，且越高级别，其价值越大，即使是在小级别，gto也会拓宽我们的剥削策略和提高其效率。

以上是我的粗浅看法，希望能够一起深入讨论。谢谢

作者: leisong 时间: 2015-7-22 06:23
再说一点，我对gto的认识和启蒙，来自我的一个朋友，andy，他是个比较有天赋的年轻人，他的性格非常aggressive，非常适合打牌，我在这方面非常差，他现在是，多伦多有多大的game，他打多大的，他刚开始上5/10，经常被reg打的找不着北，开始的时候只知道蛮干，后来通过学习gto，他已经慢慢地把那些reg给抛在了身后。

作者: xzfromcs 时间: 2015-7-22 09:14
本帖最后由 xzfromcs 于 2015-7-22 09:39 编辑

Tamarin 发表于 2015-7-22 00:57
168k手按赢率算是12万，所以不妨假设127万是sulsky在wsop前的500z总盈利，总手数是约176万。168k就是hero ...

兄弟，这图不是这么看的。可能是这个图没表示清楚吧，这个成绩里面是包括高额桌德州和奥马哈的，而且里面没有HERO。
500 zoom只是SAUCE 最近打的一个级别，所以显示在最上面。

作者: xzfromcs 时间: 2015-7-22 09:16
本帖最后由 xzfromcs 于 2015-7-22 09:38 编辑

ggyy1414 发表于 2015-7-21 23:18
这图是哪里看的啊？
没看懂，玩了168k手NL500 ，赢了1.27M刀？不可能吧
怎么还有3个月是输钱的看不懂 ...

500Z 只是他最近玩的级别，这168K手包括高额NLHE和PLO在里面。
图是在一个收费网站上查的，国外的PRO查CHASH都是在那边查。还有，这里面是没有HERO的，另外那个朋友是瞎猜的，呵呵。

作者: xzfromcs 时间: 2015-7-22 09:32
本帖最后由 xzfromcs 于 2015-7-22 09:41 编辑

leisong 发表于 2015-7-22 06:06
关于gto和exploitive在 online与live和小级别与中高级别中的应用与价值，其实是个比较大的题目，网络上关 ...

我想这个问题，开这个贴的http://www.zhiyoucheng.co/thread-15018-1-1.html 黄老师最适合跟你讨论。
原来你是打的国外2 5 ， 5 10 ，这个我不了解，一开始以为你说的是国内的局。

作者: taiji18 时间: 2015-7-22 16:18
GTO是个固定的网，EPV是把叉子或能抡的网

欢迎光临智游城 (http://zhiyoucheng.co/)