智游城

标题: AI-与扑克界名人小张的对话 [打印本页]

作者: 我是Jsli 时间: 2017-2-26 09:58
标题: AI-与扑克界名人小张的对话
小张是加拿大扑克界前辈
但是对AI的认识大错特错

作者: 我是Jsli 时间: 2017-2-26 10:09
小张(大意):
AI战无不胜说明数学套路在扑克中的意义.
(读人在扑克中意义不大)

看不下去了
从此扑克上与小张扑克理论一刀两段

AI正是扑克读人全数学的体现
是读人到了极至
你那条line被针对的死死的非常绝望

作者: 我是Jsli 时间: 2017-2-26 10:12
人脑不够用
所以那条line打不出来

之前luckystar解释过line的作用
99.999%的牌手没用

作者: 我是Jsli 时间: 2017-2-26 10:15
本帖最后由我是Jsli 于 2017-2-26 10:24 编辑

很简单
如果AI对不同牌手都是一个打法
说明AI打套路

如果AI对不同牌手打法不同
说明AI针对性读人了

Master横扫围棋界
正说明Master是针对人打
而不是打自己的套路

作者: 我是Jsli 时间: 2017-2-26 10:19
本帖最后由我是Jsli 于 2017-2-26 10:22 编辑

在对AI的认识上
Zhaoyue赵老师走到前头了

作者: 我是Jsli 时间: 2017-2-26 10:27
本帖最后由我是Jsli 于 2017-2-26 10:28 编辑

原打算昨天发这个贴子的
让小张失望了24小时没睡急着要看

太忙贴晚了

作者: snowsnow 时间: 2017-2-26 12:02

我是Jsli 发表于 2017-2-26 10:15
很简单
如果AI对不同牌手都是一个打法
说明AI打套路

Master横扫围棋界
正说明Master是针对人打
而不是打自己的套路
...................................................................

AI 下棋应该是靠计算力。
考虑各种不同走法, N步后那种结果最好。

如果是读人，计算机专家肯定不清楚要注意哪些问题。
他们要请围棋高手说明思路。
最后实现又难上加难。

AI肯定是靠计算力，计算每一个可能走法。
计算机专家只要知道基本规则就可以写程序叫机器自己算。

作者: 我是Jsli 时间: 2017-2-26 12:07
本帖最后由我是Jsli 于 2017-2-26 12:22 编辑

snowsnow 发表于 2017-2-26 12:02
Master横扫围棋界
正说明Master是针对人打
而不是打自己的套路

这个就是读人针对性呵

围棋明的
Master针对对方可能的发展
进行大量人类不能及的计算

扑克虽然暗的
但是针对对手line与行为习惯
AI易如反掌不要太简单了

作者: snowsnow 时间: 2017-2-26 12:16

我是Jsli 发表于 2017-2-26 12:07
这个就是读人针对性呵

围棋明的

对手没走之前， AI不必考虑对手会怎么走。
对手落子后。
AI考虑任何一种回应走法，每种走法推到N步以后。选最优的一个。

作者: 我是Jsli 时间: 2017-2-26 12:26
本帖最后由我是Jsli 于 2017-2-26 12:28 编辑

snowsnow 发表于 2017-2-26 12:16
对手没走之前， AI不必考虑对手会怎么走。
对手落子后。
AI考虑任何一种回应走法，每种走法推到N步以后 ...

这个是针对围棋

AI跟人扑克两圈
差不多对手的
*起手牌
*每条街习惯
*下注量...

可以通过计算
清清楚楚

人类要命的是
大脑容量太小
习惯性
观察敏感性
调整慢

作者: 001596 时间: 2017-2-26 13:22

我是Jsli 发表于 2017-2-26 10:15
很简单
如果AI对不同牌手都是一个打法
说明AI打套路

看到这里看不下去了。扑克的AI目前很简单，不针对人，只追求接近GTO。就这样已经单挑把人类打吐血了。

作者: 我是Jsli 时间: 2017-2-26 13:39

001596 发表于 2017-2-26 13:22
看到这里看不下去了。扑克的AI目前很简单，不针对人，只追求接近GTO。就这样已经单挑把人类打吐血了。 ...

gto可以是另外一个思路
如果有的话

作者: 我是Jsli 时间: 2017-2-26 13:45
本帖最后由我是Jsli 于 2017-2-26 14:12 编辑

如果gto就是纳什平衡的话
可以知道gto是“双赢”的状态

但是
对其中一方并不是最好的

纳什均衡例子那2个犯人AB
对A而言最佳状态就是B不认罪+A认罪

作者: 我是Jsli 时间: 2017-2-26 13:49
如果A招供,而B不招供,则A将被立即释放,而对B将被判刑10年.
如果两人均招供,将均被判刑2年.
如果两人均不招供,将最有利,只被判刑半年.
-----
对A最有力的当然不是gto状态

作者: 我是Jsli 时间: 2017-2-26 13:59

我是Jsli 发表于 2017-2-26 13:49
如果A招供,而B不招供,则A将被立即释放,而对B将被判刑10年.
如果两人均招供,将均被判刑2年.
如果两人均不招 ...

于是两人同时陷入招供还是不招供的两难处境。但两人无法沟通，于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳什均衡点。
-------
纳什均衡点对A犯人而言
并不是最佳的选择状态

是4个可能性中(无罪、半年、gto的二年、10年)
倒数第二

作者: 我是Jsli 时间: 2017-2-26 14:01
本帖最后由我是Jsli 于 2017-2-26 14:13 编辑

老78墙出来整2句吧

贴子到这明白了
扑克中的gto纯属扯蛋

与扑克最佳打法
完全两回事

作者: 001596 时间: 2017-2-27 08:13

我是Jsli 发表于 2017-2-26 13:39
gto可以是另外一个思路
如果有的话

你的意思是，存在比GTO EV更高的打法。有没有？有。有必要么？没有，因为GTO已经够把你打吐血了，你还研究什么超越GTO的打法。就好比一颗核弹就能灭了一个岛，你说那不够，我要100颗核弹那么牛逼的武器我才出手灭那个岛。拜托，假如你手上的武器就是一个鞭炮的话，一颗核弹和100颗核弹对你有区别么？

作者: 有点意思 时间: 2017-2-27 08:25
提示: 作者被禁止或删除内容自动屏蔽

作者: 我是Jsli 时间: 2017-2-27 09:43
本帖最后由我是Jsli 于 2017-2-27 09:45 编辑

有点意思发表于 2017-2-27 08:25
再偏激的牛B，遇到川普就是钱驴鸡穷了。

打算2-3个月的准备体能地形装备
夏天从温哥华游到华盛顿州
[attach]6425[/attach]

作者: 有点意思 时间: 2017-2-27 09:46
提示: 作者被禁止或删除内容自动屏蔽

作者: snowsnow 时间: 2017-2-27 13:16

我是Jsli 发表于 2017-2-26 12:26
这个是针对围棋

AI跟人扑克两圈

AI跟人扑克两圈
差不多对手的
*起手牌
*每条街习惯
*下注量...

可以通过计算
清清楚楚
..............................................................
不太可能。
1）AI程序是人写的，人不知道的策略电脑是不知道的。

2）那需要海量数据，数据太少电脑也分析不出个啥。

作者: sexrange 时间: 2017-2-27 14:04
Master最恐怖的地方是价值判断。在胜定的情况会下一些很消极的棋。

作者: sexrange 时间: 2017-2-27 14:06
德扑如果让Google的团队来做会弄出个接近牌神的AI

作者: sexrange 时间: 2017-2-27 14:08
围棋马上就是AI对战的时代了，德扑也可以弄。AI和AI打。

作者: sexrange 时间: 2017-2-27 14:09
Master本身就具备自学习功能，自己和自己下。德扑AI也可以。自己和自己打。

作者: 我是Jsli 时间: 2017-2-27 14:43

我是Jsli 发表于 2017-2-26 13:59
于是两人同时陷入招供还是不招供的两难处境。但两人无法沟通，于是从各自的利益角度出发，都依据各自的理 ...

于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳什均衡点。
----------
又想了一下
对A而言无论无罪释放(A认罪+B不认罪)
还是都关2年(AB都认罪的纳什均衡状态)
前题都是A认罪

所以对A而言
第一最佳的无罪释放或者第三结果的关两年
行为上没有区别

作者: snowsnow 时间: 2017-2-27 15:22
本帖最后由 snowsnow 于 2017-2-27 15:23 编辑

sexrange 发表于 2017-2-27 14:04
Master最恐怖的地方是价值判断。在胜定的情况会下一些很消极的棋。

这个可能不算。
人下国际象棋把对方吃到只有一个王的时候, 也可以消极的下。

作者: fly 时间: 2017-2-27 21:35
德扑AI读人，围棋AI不读人。

作者: keybattle 时间: 2017-2-27 22:06

fly 发表于 2017-2-27 21:35
德扑AI读人，围棋AI不读人。

德扑AI也不读人

作者: 001596 时间: 2017-2-28 07:12

我是Jsli 发表于 2017-2-27 14:43
于是从各自的利益角度出发，都依据各自的理性而选择了招供，这种情况就称为纳什均衡点。
----------
又想 ...

你就继续瞎掰吧。囚徒困境只有两个决策点，Heads Up No Limit Holdem有10^170个决策点，这能比么？
你研究了一下只有两个决策点的游戏，发现这里面，AI能想到的最优策略，你能想到的最优策略和真实的最优策略，这仨一模一样。于是得出结论说有10^170个决策点的游戏里，AI想到的最优策略和人类的最优策略也一样，都接近于真实的最优策略。嗯，你这个推论简直无法直视。

作者: 伟大的墙 时间: 2017-3-1 05:16
老李不出，谁与争锋

作者: luckystar 时间: 2017-3-1 06:42

我是Jsli 发表于 2017-2-26 10:09
小张(大意):
AI战无不胜说明数学套路在扑克中的意义.
(读人在扑克中意义不大)

这是老李写得最好的一篇文章，深得概率统计思维，大赞

欢迎光临智游城 (http://zhiyoucheng.co/)