智游城

标题: 能不能把一手牌写成Markov decision process的形式？ [打印本页]

作者: benny_xmy 时间: 2017-5-12 04:47
标题: 能不能把一手牌写成Markov decision process的形式？
如图：

作者: snowsnow 时间: 2017-5-12 21:06
本帖最后由 snowsnow 于 2017-5-12 21:09 编辑

LZ NB，你可以写篇论文发表。
图是用啥做的?
理科的论文排版都比文科NB多了。

作者: benny_xmy 时间: 2017-5-12 22:14

snowsnow 发表于 2017-5-12 21:06
LZ NB，你可以写篇论文发表。
图是用啥做的?
理科的论文排版都比文科NB多了。

LaTex

作者: keybattle 时间: 2017-5-12 22:33
这些东西，对打牌来说，都是然并卵

turn based stochastic game is based on perfect information, while poker is not.
把简单的东西搞复杂，就是缘木求鱼

作者: benny_xmy 时间: 2017-5-12 22:47
本帖最后由 benny_xmy 于 2017-5-12 23:04 编辑

keybattle 发表于 2017-5-12 22:33
这些东西，对打牌来说，都是然并卵

turn based stochastic game is based on perfect information, while ...

原ppt确实以deterministic来引入的概念，明牌我猜确实应该比暗牌简单多了，但目前还没看到有人解决了打明牌的问题呀；我觉这个应该不是把简单问题搞复杂，而是把复杂问题搞简单了

我觉MDP可以描绘对所有option的组成，以及value function(reward)的建立；MDP要求每个state都是independent的，这也符合每一手牌的随机性

举个例子，我想说的是，比如这手river我2x pot Allin了对手，有6个价值组合4个空气组合Allin，40%，是1st state；在下一手同样的river我只能1x pot对手，有6个价值组合和3个空气组合，33%，是2rd state；直到一个收敛的稳定infinite state。

作者: Jimihandrix 时间: 2017-5-12 23:36
本帖最后由 Jimihandrix 于 2017-5-12 23:37 编辑

keybattle 发表于 2017-5-12 22:33
这些东西，对打牌来说，都是然并卵

turn based stochastic game is based on perfect information, while ...

是的

作者: benny_xmy 时间: 2017-5-13 00:14

Jimihandrix 发表于 2017-5-12 23:36
是的

兄弟，不瞒你说，这个想法还是受你在回复时候的启发：

不完全信息的博弈游戏，只有将全部游戏做为一个整体分析，才能得到一个相对准确的结果。
所谓将德州做为一个整体分析，直观的说就是将所有街所有策略的所有结果做成一个矩阵，比较所有结果找出最优解。
楼主的方法基于孤立地分析每条街，然后比较四条街之和的最优解，个人认为这种方法得不到的准确的结果。

而我觉MDP确实是可以描绘出“所有街所有策略的所有结果”

作者: doglas 时间: 2017-5-14 01:16
膜拜，小学文化飘过，

作者: Jimihandrix 时间: 2017-5-14 04:05

benny_xmy 发表于 2017-5-13 00:14
兄弟，不瞒你说，这个想法还是受你在回复时候的启发：
而我觉MDP确实是可以描绘出“所有街所有策略的所有 ...

计算能力跟不上。

作者: benny_xmy 时间: 2017-5-14 06:41

Jimihandrix 发表于 2017-5-14 04:05
计算能力跟不上。

有兴趣的话看一下MDP吧，我猜能行

作者: haoqianruhaose 时间: 2017-5-16 16:39

benny_xmy 发表于 2017-5-14 06:41
有兴趣的话看一下MDP吧，我猜能行

楼主真的学霸

作者: 1025 时间: 2017-5-17 12:23
德扑的前沿

欢迎光临智游城 (http://zhiyoucheng.co/)