想学GTO

yyy6 · 发表于 2017-2-8 10:56:45

JCreeks11 发表于 2017-2-8 03:28
据我所知，libratus 用的是近乎纳什均衡，也就是所谓GTO的策略，而非盯着对手弱点剥削的策略。在我的认识 ...

那AI不是盈利了吗？为啥说学GTO是不能帮助盈利或者不输钱呢？事实上扑克的GTO和石头剪刀布完全不一样，石头剪刀布是不输钱且不盈利，但扑克是至少不输钱，几乎一定盈利。如果人真能用完全的GTO，在任何级别都能盈利，这个跟对手会不会调整没有关系。你只能说他不会是ev最大化策略罢了。但级别越高GTO就越接近ev最大化策略。

傻傻的鱼 · 发表于 2017-2-8 10:59:33

@keybattle @jcreeks 二位说的对我都有启发，Agent K偏重实战，J偏理论，MIB这是。绝大多数人只想只能学点实战应用，理论搞不了。我打算先根据range和sizing 分析下最近10万手NL25的牌，争取掌握点皮毛，这里谢过K！软件只有flopzilla ，够用吗？

snowsnow · 发表于 2017-2-8 11:00:14

输神发表于 2017-2-8 09:23
今天大家在群里讨论一个问题，一滴水从万米高空掉下来，威力有多大？砸到人会不会死？顿时群里热闹了，有大 ...

今天大家在群里讨论一个问题，一滴水从万米高空掉下来，威力有多大？砸到人会不会死？顿时群里热闹了，有大学生，研究生，博士生一起讨论了两个钟头，然后我说了一句：你们没被雨淋过吗？然后，群里安静了，再然后，我被踢出了QQ群。

snowsnow · 发表于 2017-2-8 11:05:55

GTO play is essentially a defensive strategy, not the maximally profitable one.

说GTO不能帮助盈利本身说不通，他只是说不是考虑最大盈利。
避免风险 > 考虑最大盈利。

青岛纯生 · 发表于 2017-2-8 13:38:37

yyy6 发表于 2017-2-8 10:56
那AI不是盈利了吗？为啥说学GTO是不能帮助盈利或者不输钱呢？事实上扑克的GTO和石头剪刀布完全不一样，石 ...

把大神都炸出来了哈哈

傻傻的鱼 · 发表于 2017-2-8 14:53:40

现学现问。

PokerStars - $0.25 NL (6 max) - Holdem - 4 players
Hand converted by PokerTracker 4

CO: 181.64 BB (VPIP: 29.73, PFR: 20.27, 3Bet Preflop: 11.76, Hands: 76)
BTN: 108.08 BB (VPIP: 25.76, PFR: 19.67, 3Bet Preflop: 10.38, Hands: 1,678)
Hero (SB): 159.64 BB
BB: 104.04 BB (VPIP: 25.56, PFR: 20.00, 3Bet Preflop: 8.45, Hands: 184)

Hero posts SB 0.4 BB, BB posts BB 1 BB

Pre Flop: (pot: 1.4 BB) Hero has J

K

fold, BTN raises to 3 BB, Hero raises to 10 BB, fold, BTN calls 7 BB

Flop: (21 BB, 2 players) 6

5

T

Hero checks, BTN checks

Turn: (21 BB, 2 players) J

Hero bets 13.36 BB, BTN calls 13.36 BB

River: (47.72 BB, 2 players) 9

Hero checks, BTN bets 34.16 BB, Hero calls 34.16 BB

BTN shows K

Q

(Straight, King High)
(Pre 69%, Flop 87%, Turn 25%)
Hero mucks J

K

  (One Pair, Jacks)
(Pre 31%, Flop 13%, Turn 75%)
BTN wins 112.04 BB

这手牌，用GTO的思路是不是应该这样分析。
1：V BET 34.1/(47.72+34.1)=42% 的RANGE. V是标准的REG，2000手数据。F 3BET 83%，所以他的RANGE 88+；BROADY WAY.大约72COMBOS  72*0.42＝32COMBO=QQ

2:HERO 需要DEFEND 1-0.42=58%. 我的3BET 数据不到10%。我的RANGE 大概有87COMBS. 87*0.58＝50COMBOS=AJ+KJs.

如果单纯从我自己的RANGE 来看，我这里CALL没有问题，  然而这里由于V和Hero的RANGE是完全重叠的，显然我们排名50的要弱于V前30，因此这种情况下的GTO应该去匹配对手的RANGE. 也就是QQ+必须得CALL. KJ必须得FOLD.

接下来下面这手牌：
PokerStars - $0.25 NL (6 max) - Holdem - 2 players
Hand converted by PokerTracker 4

BB: 100 BB
Hero (SB): 100 BB

Hero posts SB 0.4 BB, BB posts BB 1 BB

Pre Flop: (pot: 1.4 BB) Hero has  A

T

Hero raises to 2.48 BB, BB raises to 8 BB, Hero calls 5.52 BB

Flop: (16 BB, 2 players) 4

3

6

BB bets 11.6 BB, Hero calls 11.6 BB

Turn: (39.2 BB, 2 players) J

BB bets 80.4 BB and is all-in, fold

BB wins 37.44 BB

这是在6人桌上的HU（PS越来越不像话了，今天我16桌开了半小时都开不满，这桌只坐了2个人）无交手历史，无数据，第一手牌。
当时打的时候直觉对手在BLUFF,  JJ－AA直接排除。有对7的话我就CALL了。

用GTO的思路计算：
1：V bet 80.4/80.4+39.2=67% 默认他的3BET RANGE 10%(考虑到是HU) ，根据FLOP 和TURN的动作，排除掉JJ－AA+，增加76 57ss。剩下大概76COMBOS.    提名第51的是A high＝AQ.
2:hero 需要defend 33% 也就是前29名的COMBO.  =TT

我的疑问来了，我们的29名远远强于对手的51名。  是不是应该放松CALLING RANGE到AK甚至AQ。

结合以上两手。我的想法是，我们Defend range的BOTTOM要和V RANGE的BOTTOM要在同一个牌力范围之内（类似OVER 2 OVER,TP 2 TP,）,如果双方的BOTTOM牌力相差大的话，V VALUE RANGE 占多数的时候要就高不就低，  V BLUFF RANGE 占多数的时候要就低不就高。

以上思路和观点是否正确，求指点。

1025 · 发表于 2017-2-8 15:10:53

期待后续

gulugulubing · 发表于 2017-2-8 15:42:41

傻傻的鱼发表于 2017-2-8 14:53
现学现问。

PokerStars - $0.25 NL (6 max) - Holdem - 4 players

额不太懂唉。首先对手为啥是这个范围呢？
然后你这把对手范围都基本确定了你call或者fold的ev哪个高不就确定了么还要啥gto呢。

当然我对gto的理解也比较肤浅吧我能理解gto是一种用来防守的比如我和一个不熟悉的对手刚开始肯定用gto是最优的然后可以去发现对手不平衡的地方进行针对性调整去战胜对手但这同时也意味着自己也偏离了gto 但我不太理解是完全靠gto本身怎么战胜对手

JCreeks11 · 发表于 2017-2-8 19:40:28

yyy6 发表于 2017-2-8 10:56
那AI不是盈利了吗？为啥说学GTO是不能帮助盈利或者不输钱呢？事实上扑克的GTO和石头剪刀布完全不一样，石 ...

首先，这世上有很多功夫，GTO可算金钟罩。降龙十八掌可能不是GTO，但对很多人也盈利。不一定非要练一门功夫。

谁都知道练成金钟罩铁布衫别人打不过，那么怎么练这套功夫呢？要算清楚GTO，仅仅会算一些简单的河牌模型列几个方程求个导是远远不够的，AI也是通过海量自我学习逼近GTO。那么怎么自我调整逼近GTO呢？

现在有两种调整方法。一种是每次跟对手打完后，反省自己是不是这样打可以增加盈利，下次调整再试。一种是每次打完以后，反省自己是不是这样打可以减少亏损，下次调整再试。

我现在宣称，前一种方法，不会让自己逼进GTO，有可能让自己远离GTO。后一种学习方法，更容易接近GTO。

傻傻的鱼 · 发表于 2017-2-8 20:11:37

我把AGENT J和AGENT K的内容捋了一下，  看看是不是这样：
@JCREEKS  @KEYBATTLE

1:通俗地理解，GTO最终还是为了自己EV最大化服务的，但前提是对手是非常聪明能针对我们打法调整的。-------J认为在对手不会调整的情况下无须关注GTO，剥削就是了。K不完全认同，但同时也表示低级别无须过多关注GTO（没说理由，也许是因为低级别对手不懂调整？）所以这一点来说，两位实际上没有大的分歧。我倒是有两个疑问希望J能释疑：我打ONLINE微级别，每天要面对几百上千个不同的对手，我不知道对手会不会调整，甚至连对手的ID都记不住，尽管他们中的大多数都不会调整，这种情况下追求GTO仍然没有必要吗？将对手分类为会调整和不会调整两类，来做为是否用GTO的前提，为什么不是打得过和打不过两类，或者其他分类？这两个本质上其实是同一个问题。

2：两个绝对正确的人打扑克也是互相不能盈利的。－－－－－K不认同：“为什么说两个绝对正确打牌的人是可以有盈利能力的差别。所谓绝对正确，我们把他定义为bet size和bluff/value ratio perfectly balanced。” 在看到K的回复之前，我觉得J的说法肯定是正确的，但是K的说法也很精妙啊，原来还可以这么想。我没有能力分辨这两种说法，姑且都觉得对或者都不对。

3：你这个例子我觉得这样定义“绝对正确”不合理。因为可以构造偏离GTO而EV反而比“绝对正确”高的打法。－－－－－J反对这个例子，但是并没有明言反对K对绝对正确的定义，也就是“BET SIZE.......PERFECTLY BALANCED”    也就是双方对“绝对正确”的定义没有分歧？

4：Y总“如果人真能用完全的GTO，在任何级别都能盈利，这个跟对手会不会调整没有关系。”  正是因为这样我才想学GTO，只不过小鱼儿不敢说这句话。

根据以上内容，J和K关于GTO的主要分歧在于使用GTO帮助牌手赚钱的效率有多快多大，J偏保守一些。这是我个人的理解，不知道对不对。

		自动登录	找回密码
密码			注册

想学GTO

客服中心

投诉建议