智游城

标题: AI-与扑克界名人小张的对话 [打印本页]

作者: 我是Jsli    时间: 2017-2-26 09:58
标题: AI-与扑克界名人小张的对话
小张是加拿大扑克界前辈
但是对AI的认识大错特错

作者: 我是Jsli    时间: 2017-2-26 10:09
小张(大意):
AI战无不胜说明数学套路在扑克中的意义.
(读人在扑克中意义不大)


看不下去了
从此扑克上与小张扑克理论一刀两段

AI正是扑克读人全数学的体现
是读人到了极至
你那条line被针对的死死的非常绝望
作者: 我是Jsli    时间: 2017-2-26 10:12
人脑不够用
所以那条line打不出来

之前luckystar解释过line的作用
99.999%的牌手没用
作者: 我是Jsli    时间: 2017-2-26 10:15
本帖最后由 我是Jsli 于 2017-2-26 10:24 编辑

很简单
如果AI对不同牌手都是一个打法
说明AI打套路

如果AI对不同牌手打法不同
说明AI针对性读人了

Master横扫围棋界
正说明Master是针对人打
而不是打自己的套路

作者: 我是Jsli    时间: 2017-2-26 10:19
本帖最后由 我是Jsli 于 2017-2-26 10:22 编辑

在对AI的认识上
Zhaoyue赵老师走到前头了

作者: 我是Jsli    时间: 2017-2-26 10:27
本帖最后由 我是Jsli 于 2017-2-26 10:28 编辑

原打算昨天发这个贴子的
让小张失望了24小时没睡急着要看

太忙贴晚了
作者: snowsnow    时间: 2017-2-26 12:02
我是Jsli 发表于 2017-2-26 10:15
很简单
如果AI对不同牌手都是一个打法
说明AI打套路

Master横扫围棋界
正说明Master是针对人打
而不是打自己的套路
...................................................................

AI 下棋 应该是靠计算力。
考虑各种不同走法, N步后那种结果最好。

如果是读人, 计算机专家肯定不清楚要注意哪些问题。
他们要请围棋高手说明思路。
最后实现又难上加难。

AI肯定是靠计算力, 计算每一个可能走法。
计算机专家只要知道基本规则就可以写程序叫机器自己算。


作者: 我是Jsli    时间: 2017-2-26 12:07
本帖最后由 我是Jsli 于 2017-2-26 12:22 编辑
snowsnow 发表于 2017-2-26 12:02
Master横扫围棋界
正说明Master是针对人打
而不是打自己的套路

这个就是读人针对性呵

围棋明的
Master针对对方可能的发展
进行大量人类不能及的计算

扑克虽然暗的
但是针对对手line与行为习惯
AI易如反掌不要太简单了


作者: snowsnow    时间: 2017-2-26 12:16
我是Jsli 发表于 2017-2-26 12:07
这个就是读人针对性呵

围棋明的

对手没走之前, AI不必考虑对手会怎么走。
对手落子后。
AI考虑任何一种回应走法, 每种走法推到N步以后。选最优的一个。

作者: 我是Jsli    时间: 2017-2-26 12:26
本帖最后由 我是Jsli 于 2017-2-26 12:28 编辑
snowsnow 发表于 2017-2-26 12:16
对手没走之前, AI不必考虑对手会怎么走。
对手落子后。
AI考虑任何一种回应走法, 每种走法推到N步以后 ...

这个是针对围棋

AI跟人扑克两圈
差不多对手的
*起手牌
*每条街习惯
*下注量...

可以通过计算
清清楚楚


人类要命的是
大脑容量太小
习惯性
观察敏感性
调整慢

作者: 001596    时间: 2017-2-26 13:22
我是Jsli 发表于 2017-2-26 10:15
很简单
如果AI对不同牌手都是一个打法
说明AI打套路

看到这里看不下去了。扑克的AI目前很简单,不针对人,只追求接近GTO。就这样已经单挑把人类打吐血了。
作者: 我是Jsli    时间: 2017-2-26 13:39
001596 发表于 2017-2-26 13:22
看到这里看不下去了。扑克的AI目前很简单,不针对人,只追求接近GTO。就这样已经单挑把人类打吐血了。 ...

gto可以是另外一个思路
如果有的话

作者: 我是Jsli    时间: 2017-2-26 13:45
本帖最后由 我是Jsli 于 2017-2-26 14:12 编辑

如果gto就是纳什平衡的话
可以知道gto是“双赢”的状态

但是
对其中一方并不是最好的

纳什均衡例子那2个犯人AB
对A而言最佳状态就是B不认罪+A认罪
作者: 我是Jsli    时间: 2017-2-26 13:49
如果A招供,而B不招供,则A将被立即释放,而对B将被判刑10年.
如果两人均招供,将均被判刑2年.
如果两人均不招供,将最有利,只被判刑半年.
-----
对A最有力的当然不是gto状态
作者: 我是Jsli    时间: 2017-2-26 13:59
我是Jsli 发表于 2017-2-26 13:49
如果A招供,而B不招供,则A将被立即释放,而对B将被判刑10年.
如果两人均招供,将均被判刑2年.
如果两人均不招 ...

于是两人同时陷入招供还是不招供的两难处境。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡点。
-------
纳什均衡点对A犯人而言
并不是最佳的选择状态


是4个可能性中(无罪、半年、gto的二年、10年)
倒数第二

作者: 我是Jsli    时间: 2017-2-26 14:01
本帖最后由 我是Jsli 于 2017-2-26 14:13 编辑

老78墙出来整2句吧

贴子到这明白了
扑克中的gto纯属扯蛋

与扑克最佳打法
完全两回事






作者: 001596    时间: 2017-2-27 08:13
我是Jsli 发表于 2017-2-26 13:39
gto可以是另外一个思路
如果有的话

你的意思是,存在比GTO EV更高的打法。有没有?有。有必要么?没有,因为GTO已经够把你打吐血了,你还研究什么超越GTO的打法。就好比一颗核弹就能灭了一个岛,你说那不够,我要100颗核弹那么牛逼的武器我才出手灭那个岛。拜托,假如你手上的武器就是一个鞭炮的话,一颗核弹和100颗核弹对你有区别么?
作者: 有点意思    时间: 2017-2-27 08:25
提示: 作者被禁止或删除 内容自动屏蔽
作者: 我是Jsli    时间: 2017-2-27 09:43
本帖最后由 我是Jsli 于 2017-2-27 09:45 编辑
有点意思 发表于 2017-2-27 08:25
再偏激的牛B,遇到川普就是钱驴鸡穷了。

打算2-3个月的准备体能地形装备
夏天从温哥华游到华盛顿州
[attach]6425[/attach]



作者: 有点意思    时间: 2017-2-27 09:46
提示: 作者被禁止或删除 内容自动屏蔽
作者: snowsnow    时间: 2017-2-27 13:16
我是Jsli 发表于 2017-2-26 12:26
这个是针对围棋

AI跟人扑克两圈

AI跟人扑克两圈
差不多对手的
*起手牌
*每条街习惯
*下注量...

可以通过计算
清清楚楚
..............................................................
不太可能。
1)AI程序是人写的, 人不知道的策略电脑是不知道的。

2) 那需要海量数据, 数据太少电脑也分析不出个啥。


作者: sexrange    时间: 2017-2-27 14:04
Master最恐怖的地方是价值判断。在胜定的情况会下一些很消极的棋。
作者: sexrange    时间: 2017-2-27 14:06
德扑如果让Google的团队来做会弄出个接近牌神的AI
作者: sexrange    时间: 2017-2-27 14:08
围棋马上就是AI对战的时代了,德扑也可以弄。AI和AI打。
作者: sexrange    时间: 2017-2-27 14:09
Master本身就具备自学习功能,自己和自己下。德扑AI也可以。自己和自己打。
作者: 我是Jsli    时间: 2017-2-27 14:43
我是Jsli 发表于 2017-2-26 13:59
于是两人同时陷入招供还是不招供的两难处境。但两人无法沟通,于是从各自的利益角度出发,都依据各自的理 ...

于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡点。
----------
又想了一下
对A而言无论无罪释放(A认罪+B不认罪)
还是都关2年(AB都认罪的纳什均衡状态)
前题都是A认罪


所以对A而言
第一最佳的无罪释放或者第三结果的关两年
行为上没有区别



作者: snowsnow    时间: 2017-2-27 15:22
本帖最后由 snowsnow 于 2017-2-27 15:23 编辑
sexrange 发表于 2017-2-27 14:04
Master最恐怖的地方是价值判断。在胜定的情况会下一些很消极的棋。

这个可能不算。
人下国际象棋把对方吃到只有一个王的时候, 也可以消极的下。

作者: fly    时间: 2017-2-27 21:35
德扑AI读人,围棋AI不读人。

作者: keybattle    时间: 2017-2-27 22:06
fly 发表于 2017-2-27 21:35
德扑AI读人,围棋AI不读人。

德扑AI也不读人

作者: 001596    时间: 2017-2-28 07:12
我是Jsli 发表于 2017-2-27 14:43
于是从各自的利益角度出发,都依据各自的理性而选择了招供,这种情况就称为纳什均衡点。
----------
又想 ...

你就继续瞎掰吧。囚徒困境只有两个决策点,Heads Up No Limit Holdem有10^170个决策点,这能比么?
你研究了一下只有两个决策点的游戏,发现这里面,AI能想到的最优策略,你能想到的最优策略和真实的最优策略,这仨一模一样。于是得出结论说有10^170个决策点的游戏里,AI想到的最优策略和人类的最优策略也一样,都接近于真实的最优策略。嗯,你这个推论简直无法直视。

作者: 伟大的墙    时间: 2017-3-1 05:16
老李不出,谁与争锋
作者: luckystar    时间: 2017-3-1 06:42
我是Jsli 发表于 2017-2-26 10:09
小张(大意):
AI战无不胜说明数学套路在扑克中的意义.
(读人在扑克中意义不大)

这是老李写得最好的一篇文章,深得概率统计思维,大赞




欢迎光临 智游城 (http://zhiyoucheng.co/) Powered by Discuz! X3.2