话说回来,其实我猜能构造出一个死钱情况和牌面的极端牌局例子,使得A range Random allin、B range AA call就是该格局双方各自的0ev的平衡,并不偏离。我想说的是“只玩强牌”未必就是不平衡,“平衡”是根据死钱情况和牌面,特定格局而言的。每个格局下的“平衡”或许就一两个;而这个格局下的“偏离”或许有一百种偏离,对应了多种最大剥削方式,可能有更多种普通剥削方式。所以“找到平衡”应该是少的,是前提?“发现偏离了多少->怎样去剥削”的情况会更多,要掌握所有的“偏离->最大化剥削手段”会更难?
------------------------
不过我曾经以为可以通过双方可以对对方的“偏离”进行多次有限次重复最大化剥削从而进入平衡点,但发现双方在以平衡点为起始点进行重复最大化剥削的时候不会产生”偏离“,每一次剥削决策都是原平衡点决策;而以非平衡点为起始点进行重复最大化剥削的时候进入了循环,该循环过程我猜可以认为是像猜拳一样达到了均衡。我想说的是,“平衡”也可以由重复“最大化剥削”、也就是通过重复博弈“最优策略”推导来的,而并不仅仅可以从“无论对手怎么改变策略,都不能改变他的收益,也就是0ev和他的策略无关”来的。
所以照这么说的话,是先有了“偏离?+最大化剥削手段”,才有了“平衡”。举个例子:“我和对手一直在交流沟通:我发现了对手的策略点A,对他进行最大化剥削之后我产生了一个点B,然后对手根据我产生的B又有了一个最大化剥削A’,然后我根据对手产生的A’又有了一个最大化剥削B’;若A=A' && B=B',则A、B称为该格局的平衡”。如果上述命题成立,也就是“最大化剥削手段”已知、容易得到的话,那其实就和“傻傻的鱼”回复里讲的一样了?:
如何找到平衡的点,不正是最难的地方吗?
-------------------------
上述两种方法应该是两种等价的对偶方法:由平衡点推出偏离,得到最大化剥削手段;由假定偏离进行重复最大化剥削手段,得到平衡点。看具体情况了:如果平衡点的推导比较容易,比如“无论对手怎么改变策略,都不能改变他的收益,也就是0ev和他的策略无关”这个计算比较容易,那就用前者;如果最大化剥削手段的推导比较容易,比如“10BB HU Allin or Fold”这个例子,这个时候给定SB range计算BB的最大盈利range(最大化剥削手段)是容易的,那就用后者。