我理解的“最大化剥削在Multi-Option的含义”

benny_xmy · 发表于 2017-4-28 02:04:57

本帖最后由 benny_xmy 于 2017-4-28 04:23 编辑

最近我一直在思考一个问题：如今大家的GTO讨论都仅限于“preflop“仅限两次two-option” either Allin or Fold”和“在river的“仅限两次two-option”的假设：不管是A没有位置先考虑bet，或者B在前位先过牌给A，我们假设这里最多只有一次下注和一次跟注（即不考虑玩家B在前位下阻断注或者B在后位加注A的下注）”这两种情况，而事实上我们打牌是有很多option组成的line的，那这个时候Multi-Option时候的GTO又是什么呢？

在讨论中受到了“Jimihandrix”的启发：

剥削策略的重要性可能被大大地高估了。
因为即使可能知道对手的策略，制定对于对手策略的剥削策略，但是对手何时开始调整是不可知的。
所以，由于不知道对手何时开始调整，将会导致之前的剥削策略的收益可能在一手牌还给对手。

说的太对了，

因为即使可能知道对手的策略，制定对于对手策略的剥削策略，但是对手何时开始调整是不可知的。

首先我想强调“回合”的概念，即将“preflop”、“flop”、“turn”和“river”视为四个回合，这四个回合会有你和对手的option形成的line，分别有起始和终止的option。不妨设每个回合先只观察前两个option，就看这个回合的1st和2nd option，即只看对手和你各自第一个option（*多个option形成的line会导致终止option的归属不同）。不妨设对手每一回合的每个option都在调整自己的策略，即他每一option都用不同的策略。完美的情况是这回合你打对手有位置，对手在起始option先行动，所以你可以通过对手的option分析出了对手的策略，然后制定对于对手策略的剥削策略。而如果你这回合没有位置，你在起始option先行动，是不可能打得出剥削策略的，因为这时候对手没有option能让你得出对手在这一回合的策略从而制定对于对手策略的剥削策略，因为对手的策略是未知的，也就是说你只能防守。

option是对手策略的直接体现，是我们可以观测的到的。事实上对手策略可能有其他观察不到的诸多因素的影响，比如“对手眼中的我的策略”，这是对手自己对于line的思考，我很难理解也很难猜。不过如果我能正确猜到“对手眼中我的策略”，这更有助于我预测对手当前的策略。

实际上我们目前都是在做的分析预测对手当前的策略，前提是对手在这一段时间内不调整，沿用之前他的策略，那我可以在这段时间制定对于对手策略的剥削策略。然而你说的很对，我不知道对手何时开始调整，所以“发现对手的当前策略”就变的极其困难。如果对手每时每刻都在调整，那除非是对手本身或者是Poker God，我想“发现对手的当前策略”根本不可能实现。所以我一直思考一个命题：“你能不能赢一个随机打牌的人？”很困惑，得不到答案，不晓得有没有教练可以指导一下。
--------------------------------

将会导致之前的剥削策略的收益可能在一手牌还给对手。

说的太对了：*这也正是我在思考的问题：如果我们观察一个line，对手先行动，不妨设对手和我的第(N)th option都是针对各自我和对手之前一个(N-1)th option制定的剥削策略的，其实是很难预测这条line是由对手还是由我结束这个回合的。也就是说，先行动的对手可能在某个option得出了非“raise”的决策，从而是对手的option结束了这个回合，他这个option使得我之前的剥削策略的收益还给了他。或者说，我们的最终目的是在这条line的max(Σ我的每个option的剥削ev - Σ对手的每个option的剥削ev)，而并不是max特定一个option的剥削ev。所以我们在做一个option的时候，不仅仅要分析当前我们针对对手的剥削ev，还要结合我打出这个option是否能限制对手后续的他针对我的剥削ev，是整个回合的宏观计算。这是我理解的“最大化剥削在Multi-Option”的含义。

edindzeko · 发表于 2017-4-28 04:00:11

说得很好，我也思考过这个问题，现在讲GTO的理论还是过于简化了，基本就是polarized range VS capped range，并且只假定只有bet，call or fold的option，y总的文章做了一些扩展，但是对于实战中的各种复杂情况还是帮助不大

yyy6 · 发表于 2017-4-28 10:35:14

最大化剥削必须要知道对方的大致偏离即使对方随机也看是不是固定的随机分布只要这个哪怕是随机的行为频率不对都可以剥削至于允许不允许几个action并不相关我写的文章第三篇已经有bet 对方raise 而实际上再复杂的情况也是基础的几个情况的扩展或者叠加

傻傻的鱼 · 发表于 2017-4-28 14:24:11

首先，楼主这个帖子看懂了一大半，给自己点个赞。

1：最大化剥削，  也就是偏离GTO,只要偏离GTO,必然是可以被剥削的。  在MAX 剥削对手的前提下又不想被剥削，是否有可能性？

2：“对手何时调整是不可知的”，何谓不可知？  对手反过来剥削你的时候就说明他调整了，双方被迫重回GTO.    比如他之前的偏离时在这里总是CHECK,然而他现在开始BET，那最大化剥削就不存在了。直到发现他的下个偏离。

3：偏离有PERMANENT,  RANDOM,  还有conciously,unconciously. 在最大化剥削之前，是否应该搞清楚对方偏离的类型更加重要。  如果不清楚就应该始终维持GTO.

所以最大化剥削和MULTI OPTION是不是应该分开看。只计算MULTI OPTION下的GTO DEFENCE，而最大化剥削被反剥削的时候实际上又重回了GTO DEFENCE.

泥中土 · 发表于 2020-10-21 02:19:26

提示: 作者被禁止或删除内容自动屏蔽

		自动登录	找回密码
密码			注册

我理解的“最大化剥削在Multi-Option的含义”

客服中心

投诉建议