人机大战：人类选手回天乏术

扑克新闻 · 发表于 2017-1-24 21:45:52

本周一的比赛打完后，2017人机大战赛程也已经过半，这天，四位人类选手为自己挖了一个“天坑”。

打完6.4万手牌后（共12万手），Jason Les、Dong Kim、Jimmy Chou和David McAulay现在水下近80万，共8000个大盲注。

上周，人类选手有过反败为胜的迹象，当时一天就打回了三分之二的亏损，可惜之后又遭遇了滑铁卢。

“机器人每天都在变得更强，”Chou说：“它就像是我们人类更难对付的版本。刚开始几天，我们有很大的希望，可每当我们发现一个它的弱点，它就会迅速从我们身上学习，然后第二天这些缺点就不见了。“

Libratus是计算机科学专家Tuomas Sandholm和他的学生Noam Brown一起发明的，他们师徒俩最近几年推出过多款成功的扑克机器人。

人类选手表示，Libratus河牌的处理能力比其它扑克机器人要强很多。它经常在河牌超底池全押诈唬或拿价值，非常具有迷惑性。

每天比赛结束后，Libratus都会在匹兹堡超级计算机Center’s Bridges的帮助下进一步提高策略，特别是打到河牌的情况下。

更多有关德州扑克新闻的精彩内容请关注扑克新闻，加入扑克新闻有惊喜。

四条三最大 · 发表于 2017-1-29 16:14:02

最强大脑里，人类也输给机器人。

输神 · 发表于 2017-1-30 15:25:08

你确定这是德州不是围棋？
棋类的计算是静态的，计算范围永远只能在固定的棋盘内，这样只要随着科技的进步，到电脑的计算力能穷举出棋盘内所有的变化那一天，电脑最终就能战胜人类。
而德州是动态的，电脑只能从前面玩牌的数据计算出最优的决策，没有人类的创造思维。要是有新的数据样本加入，就相当于棋盘发生了变化，原来最优的决策不再是最优，而谁也无法预知棋盘接下来又会变成什么样。
所以我认为电脑适应了那几个高手的套路，能稳定的战胜他们以后，这时候换几个菜鸟上去玩，电脑马上就会被干翻。而等到电脑再稳定干翻了菜鸟的时候，因为统计的样本又发生了变化，再让那几个高手回去玩，又能开始赢电脑了。
可能这就是那个软件没有接受全网公测的原因吧。

Jimihandrix · 发表于 2017-1-30 22:45:41

输神发表于 2017-1-30 15:25
你确定这是德州不是围棋？
棋类的计算是静态的，计算范围永远只能在固定的棋盘内，这样只要随着科技的进步 ...

虽然计算机没有穷举围棋的所有变化，alphaGO/Master也已经击败了人类。
换人就能击败AI是很荒唐的。计算机只需要打好自己的牌（不管对手倾向如何），人类就束守无策了。

Howard · 发表于 2017-1-30 23:07:10

本帖最后由 Howard 于 2017-1-30 09:10 编辑

每次看到这个战绩图就很蛋疼，因为它是反直觉的。
总成绩是左边人类，右边AI，下面4行是分别的成绩。
那详细成绩显然直觉应该是左边四行是四个人类，右边四行是四个AI，每一行是一个对决
就像这样：

人类总成绩：(xxxx)	AI总成绩：xxxx
人类1：a	AI：-a
人类2：b	AI： -b
人类3：c	AI：-c
人类4：d	AI：-d

没想到丫给分了四个象限。

你非得分四个象限也行，至少这四个象限的颜色稍微区分开一点，至少的至少你把边框弄粗一点间距弄大一点，丫不，用非常统一的大红色，且基本无边框分割。

gulugulubing · 发表于 2017-1-31 00:29:49

Howard 发表于 2017-1-30 23:07
每次看到这个战绩图就很蛋疼，因为它是反直觉的。
总成绩是左边人类，右边AI，下面4行是分别的成绩。
那详 ...

额同感开始我都没看懂

gulugulubing · 发表于 2017-1-31 00:38:32

输神发表于 2017-1-30 15:25
你确定这是德州不是围棋？
棋类的计算是静态的，计算范围永远只能在固定的棋盘内，这样只要随着科技的进步 ...

比赛开始之前电脑就已经经过大量数据锻炼了吧这样电脑就可以区分出高手和菜鸟有针对性的应对

001596 · 发表于 2017-1-31 00:49:22

gulugulubing 发表于 2017-1-31 00:38
比赛开始之前电脑就已经经过大量数据锻炼了吧这样电脑就可以区分出高手和菜鸟有针对性的应对 ...

要我猜的话，就是电脑初始策略是GTO，然后根据对局历史加入exploitive play。德州扑克的搜索状态太少了，比围棋少多了，能赢人类一点不稀奇。

输神 · 发表于 2017-1-31 15:26:03

Jimihandrix 发表于 2017-1-30 22:45
虽然计算机没有穷举围棋的所有变化，alphaGO/Master也已经击败了人类。
换人就能击败AI是很荒唐的。计算 ...

你说的很正确，因为人类分析以往数据去平衡GTO的能力永远不及电脑，一定会有弱点，在实战中必须长期游戏的前提下，电脑最终战胜人类。

但是你混淆了一点，就是alphaGO和这个德州扑克AI击败人类的方式完全不相同。因为围棋是有常量的，就是那固定19X19的棋盘，是一定有一个计算的终点。哪怕是alphaGO通过现有的棋局库穷举精简了分支，但战胜人类最终靠的还是强大的静态计算能力，等到围棋完全被破解的那一天，alphaGO穷举精简了分支的做法反而是不完美会有漏洞的。
而德州扑克没有常量，如果有那也只能是底池赔率和出牌概率，学完了基础知识，静态的计算就直接就到了终点。
剩下的计算，比如通过范围和其它对手的数据找GTO，这个穷举也是没有极限的，哪怕你给所有对手都分类了，你也永远无法涵盖人与人不同的特点，这完全是一个动态，不能做到像围棋一样以穷举出所有变化作为目的进行计算。
说的简单一点就跟猜剪刀石头布一样，这个德州扑克AI就和那个网上号称无敌的Veteran猜拳AI是一模一样的。
为什么我说只要换人就可以击败电脑，因为GTO无法改变上一次胜负的结果，也永远只能根据以往的数据做出决策。
所以只要保证永远都是对电脑AI进行第一次的squeeze剥削，等电脑在吸取了教训找到应对策略想squeeze剥削平衡回来的时候，突然换了一个人，以前的经验不适用了，这样又相当于第一次了，不断重复这种“第一次”从概念上来讲就可以打败电脑。
而为什么我说的是换人，而不是让一个人变换风格，那是因为从心理学的角度深层面的习惯人自己无法发觉，会随着跟电脑长时间游戏被电脑给统计进去，自己却浑然不知，除非人格分裂了能完全变成两人。

更进一步来讲，就算电脑把世界上每个人都统计了，可以单独战胜每一个人，但是这时候用快速的轮换的方式，同时保证换上的人是随机决定的，电脑不知道换了的人是谁，人却知道电脑的数据（就算不知道也不一定输，但可能会出现你瞎蒙出了一个剪刀，刚好前面那几位也出的是剪刀电脑早就准备好石头了，导致这一次未能squeeze剥削成功还蚀把米），电脑照样还是会被干翻。
前提是人别犯基础知识的低级错误，比如把赔率胜率和出牌算错，剩下什么时候该squeeze，就跟你觉得什么时候出剪刀石头布一样。

我数学很烂，只能用上面比较冗长的说法了，希望你能明白。

Callyourbet · 发表于 2017-1-31 16:51:04

我只问一句

这种 Heads up有赌场的抽水没有，按照 pot 抽。
我不觉得有抽水的时候机器人能盈利。

而且这种人类可以带shortstack 比如 15bb 上桌吗？
要是可以，我不觉得在有抽水，短码下机器能把人类干翻，大不了一起输

house take rake, house always win.

		自动登录	找回密码
密码			注册

人机大战：人类选手回天乏术

本帖子中包含更多资源

客服中心

投诉建议