智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 7173|回复: 27
打印 上一主题 下一主题

人机大战:人类选手回天乏术

[复制链接]
跳转到指定楼层
1#
扑克新闻 发表于 2017-1-24 21:45:52 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

本周一的比赛打完后,2017人机大战赛程也已经过半,这天,四位人类选手为自己挖了一个“天坑”。

打完6.4万手牌后(共12万手),Jason Les、Dong Kim、Jimmy Chou和David McAulay现在水下近80万,共8000个大盲注。

上周,人类选手有过反败为胜的迹象,当时一天就打回了三分之二的亏损,可惜之后又遭遇了滑铁卢。

“机器人每天都在变得更强,”Chou说:“它就像是我们人类更难对付的版本。刚开始几天,我们有很大的希望,可每当我们发现一个它的弱点,它就会迅速从我们身上学习,然后第二天这些缺点就不见了。“

Libratus是计算机科学专家Tuomas Sandholm和他的学生Noam Brown一起发明的,他们师徒俩最近几年推出过多款成功的扑克机器人。

人类选手表示,Libratus河牌的处理能力比其它扑克机器人要强很多。它经常在河牌超底池全押诈唬或拿价值,非常具有迷惑性。

每天比赛结束后,Libratus都会在匹兹堡超级计算机Center’s Bridges的帮助下进一步提高策略,特别是打到河牌的情况下。


更多有关德州扑克新闻的精彩内容请关注扑克新闻,加入扑克新闻有惊喜

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏
2#
四条三最大 发表于 2017-1-29 16:14:02 | 只看该作者
最强大脑里,人类也输给机器人。
3#
输神 发表于 2017-1-30 15:25:08 | 只看该作者
你确定这是德州不是围棋?
棋类的计算是静态的,计算范围永远只能在固定的棋盘内,这样只要随着科技的进步,到电脑的计算力能穷举出棋盘内所有的变化那一天,电脑最终就能战胜人类。
而德州是动态的,电脑只能从前面玩牌的数据计算出最优的决策,没有人类的创造思维。要是有新的数据样本加入,就相当于棋盘发生了变化,原来最优的决策不再是最优,而谁也无法预知棋盘接下来又会变成什么样。
所以我认为电脑适应了那几个高手的套路,能稳定的战胜他们以后,这时候换几个菜鸟上去玩,电脑马上就会被干翻。而等到电脑再稳定干翻了菜鸟的时候,因为统计的样本又发生了变化,再让那几个高手回去玩,又能开始赢电脑了。
可能这就是那个软件没有接受全网公测的原因吧。
4#
Jimihandrix 发表于 2017-1-30 22:45:41 | 只看该作者
输神 发表于 2017-1-30 15:25
你确定这是德州不是围棋?
棋类的计算是静态的,计算范围永远只能在固定的棋盘内,这样只要随着科技的进步 ...

虽然计算机没有穷举围棋的所有变化,alphaGO/Master也已经击败了人类。
换人就能击败AI是很荒唐的。计算机只需要打好自己的牌(不管对手倾向如何),人类就束守无策了。
5#
Howard 发表于 2017-1-30 23:07:10 | 只看该作者
本帖最后由 Howard 于 2017-1-30 09:10 编辑

每次看到这个战绩图就很蛋疼,因为它是反直觉的。
总成绩是左边人类,右边AI,下面4行是分别的成绩。
那详细成绩显然直觉应该是左边四行是四个人类,右边四行是四个AI,每一行是一个对决
就像这样:

人类总成绩:(xxxx) AI总成绩:xxxx
人类1:a AI:-a
人类2:b AI: -b
人类3:c AI:-c
人类4:d AI:-d



没想到丫给分了四个象限。

你非得分四个象限也行,至少这四个象限的颜色稍微区分开一点,至少的至少你把边框弄粗一点间距弄大一点,丫不,用非常统一的大红色,且基本无边框分割。
6#
gulugulubing 发表于 2017-1-31 00:29:49 来自手机 | 只看该作者
Howard 发表于 2017-1-30 23:07
每次看到这个战绩图就很蛋疼,因为它是反直觉的。
总成绩是左边人类,右边AI,下面4行是分别的成绩。
那详 ...

额 同感 开始我都没看懂
7#
gulugulubing 发表于 2017-1-31 00:38:32 来自手机 | 只看该作者
输神 发表于 2017-1-30 15:25
你确定这是德州不是围棋?
棋类的计算是静态的,计算范围永远只能在固定的棋盘内,这样只要随着科技的进步 ...

比赛开始之前电脑就已经经过大量数据锻炼了吧 这样电脑就可以区分出高手和菜鸟 有针对性的应对
8#
001596 发表于 2017-1-31 00:49:22 | 只看该作者
gulugulubing 发表于 2017-1-31 00:38
比赛开始之前电脑就已经经过大量数据锻炼了吧 这样电脑就可以区分出高手和菜鸟 有针对性的应对 ...

要我猜的话,就是电脑初始策略是GTO,然后根据对局历史加入exploitive play。德州扑克的搜索状态太少了,比围棋少多了,能赢人类一点不稀奇。
9#
输神 发表于 2017-1-31 15:26:03 | 只看该作者
Jimihandrix 发表于 2017-1-30 22:45
虽然计算机没有穷举围棋的所有变化,alphaGO/Master也已经击败了人类。
换人就能击败AI是很荒唐的。计算 ...

你说的很正确,因为人类分析以往数据去平衡GTO的能力永远不及电脑,一定会有弱点,在实战中必须长期游戏的前提下,电脑最终战胜人类。

但是你混淆了一点,就是alphaGO和这个德州扑克AI击败人类的方式完全不相同。因为围棋是有常量的,就是那固定19X19的棋盘,是一定有一个计算的终点。哪怕是alphaGO通过现有的棋局库穷举精简了分支,但战胜人类最终靠的还是强大的静态计算能力,等到围棋完全被破解的那一天,alphaGO穷举精简了分支的做法反而是不完美会有漏洞的。
而德州扑克没有常量,如果有那也只能是底池赔率和出牌概率,学完了基础知识,静态的计算就直接就到了终点。
剩下的计算,比如通过范围和其它对手的数据找GTO,这个穷举也是没有极限的,哪怕你给所有对手都分类了,你也永远无法涵盖人与人不同的特点,这完全是一个动态,不能做到像围棋一样以穷举出所有变化作为目的进行计算。
说的简单一点就跟猜剪刀石头布一样,这个德州扑克AI就和那个网上号称无敌的Veteran猜拳AI是一模一样的。
为什么我说只要换人就可以击败电脑,因为GTO无法改变上一次胜负的结果,也永远只能根据以往的数据做出决策。
所以只要保证永远都是对电脑AI进行第一次的squeeze剥削,等电脑在吸取了教训找到应对策略想squeeze剥削平衡回来的时候,突然换了一个人,以前的经验不适用了,这样又相当于第一次了,不断重复这种“第一次”从概念上来讲就可以打败电脑。
而为什么我说的是换人,而不是让一个人变换风格,那是因为从心理学的角度深层面的习惯人自己无法发觉,会随着跟电脑长时间游戏被电脑给统计进去,自己却浑然不知,除非人格分裂了能完全变成两人。

更进一步来讲,就算电脑把世界上每个人都统计了,可以单独战胜每一个人,但是这时候用快速的轮换的方式,同时保证换上的人是随机决定的,电脑不知道换了的人是谁,人却知道电脑的数据(就算不知道也不一定输,但可能会出现你瞎蒙出了一个剪刀,刚好前面那几位也出的是剪刀电脑早就准备好石头了,导致这一次未能squeeze剥削成功还蚀把米),电脑照样还是会被干翻。
前提是人别犯基础知识的低级错误,比如把赔率胜率和出牌算错,剩下什么时候该squeeze,就跟你觉得什么时候出剪刀石头布一样。


我数学很烂,只能用上面比较冗长的说法了,希望你能明白。
10#
Callyourbet 发表于 2017-1-31 16:51:04 | 只看该作者
我只问一句

这种 Heads up有赌场的抽水没有 ,按照 pot 抽 。
我不觉得 有抽水的时候 机器人能盈利。

而且 这种 人类可以带shortstack 比如 15bb 上桌吗?
要是可以 ,我不觉得在 有抽水 ,短码下 机器能把人类干翻 ,大不了一起输

house take rake, house always win.
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-11-25 09:53 , Processed in 0.063784 second(s), 9 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部