智游城

标题: 有人有兴趣聊聊AlphaGo、机器学习、以及它对扑克的影响吗? [打印本页]

作者: RichZhu    时间: 2016-1-31 04:09
标题: 有人有兴趣聊聊AlphaGo、机器学习、以及它对扑克的影响吗?
我先认错,我一直觉得计算机在围棋上战胜人类还有很长的路要走,至少需要十年或更长,现在一下子就到眼前了。

三月份AlphaGo迎战李世石,虽然当前世界排名第一的柯洁说AlphaGo只有5%的希望,多数人好像并没有这么乐观。即便真的是5%,也是了不起的进步,想想看,有多少人对李世石有5%的机会?虽然比赛规则还没有透露,应该至少是5番棋吧?

对论坛的多数朋友来说,可能更关心的是扑克会受什么样的影响吧?最近一周有两个比较大的软件相关话题,一个是TCOOP终桌出现bot,另一个是snowie跟HM合作在HM上放了Snowie App,可能会加速对扑克生态的破坏。

太大一个话题,有没有愁得睡不着觉或兴奋地自己打自己的?随便聊。


作者: RichZhu    时间: 2016-1-31 04:15
不过必须向谷歌致敬!

说来也巧,我在微博上很少站队,两三个星期前破天荒地批评百度表扬谷歌,没想到谷歌一下子就出了这个大招,太震撼了。

我是真的没有内部消息,提及谷歌机器学习核心技术纯属巧合
--------------
http://weibo.com/acesfull/profil ... rsonnumber&is_all=1
国外的一些公司,初期做事不讲究,做大就从良了;而国内的一些公司,做的越大越作恶,因为越大越有作恶的本钱。百度和谷歌起步差不了几年,前些天谷歌公开机器学习核心技术,以促进整个行业人工智能研究与发展,而百度却干起了帮助骗子卖假药的生意。都是互联网老大,做事的差距怎么这么大?
---------------

作者: yoking    时间: 2016-1-31 06:00
比赛筹码短,更容易养机器人。总之网络扑克这块是相当不乐观了。

谷歌开放核心技术后,国内循例会大批申报号称自主知识产权的开发项目,GFW屏蔽能力也会有很大提升。


作者: glamglow    时间: 2016-1-31 07:58
现在网络打牌已经够难的了,还让人活吗?唉。
作者: RichZhu    时间: 2016-2-1 02:32
yoking 发表于 2016-1-31 06:00
比赛筹码短,更容易养机器人。总之网络扑克这块是相当不乐观了。

谷歌开放核心技术后,国内循例会大批申报 ...

我倒是觉得,AI的进步会促使牌室对机器人态度的转变。之前很多牌室对机器人的态度是比较暧昧的,毕竟机器人也要供水,也会带来直观上的人气。

随着bot技术的提高,bot的盈利能力逐渐超过一些半职业牌手,并成上升趋势,牌室是不能容忍牌桌上的钱大量流失的,毕竟人类牌手成为大赢家还有市场宣传价值,而bot赚的钱都是悄无声息地没了。

更重要的一点,是对牌室品牌的影响。当人们觉得网络牌室随处可遇机器人的时候,他们对网络扑克的热情就会降低。本来网络扑克就变得越来越无聊,整体打法逐渐向GTO收敛,逐渐机器人化,如果再觉得对手确实可能是机器人,就真的没兴趣玩了。下载一个免费软件或者一次性购买一个AI扑克,随时可玩,不需要网络,更不用被抽水。

到了这种地步,网络牌室就不得不对机器人认真对待了,因为机器人已经成为网络牌室最可怕的敌人。

同样的道理,连HM/PT这样的统计工具,也逐渐不受牌室欢迎。牌室需要尽可能维持一个“人性化”的环境。


作者: ticoarm    时间: 2016-2-1 04:27
最近这几天也在关注这个事情, 对于机器学习, 我上研究生的时候也上过这门课, 感兴趣的朋友可以去网上看scikit-learn这个python包(这个项目也是google弄的), 随着给机器的训练数据的增大和对于计算机结果的修正, 机器会变得越来越强大, 其实不管是博弈类游戏也好, 面部识别或者自动驾驶汽车, 看似不相关的东西, 机器在学习的时候的本质都是这个.

我自己觉得人们对于解决博弈类游戏的方法有两种, 一种是纯数学意义上的解, 另一种就是通过大数据, 数据挖掘和机器学习来让机器像人一样学习, 只不过比人学习更快, 我们所有记录下来的棋局都可以成为机器学习的"养料", 虽然这种方法与数学意义上的解相比, 没那么优雅, 但就是可以通过不间断的学习, 快速的成为最厉害的人, 就是这么粗暴, 想想都可怕, 所以人输给机器也是注定的事情, 只不过这不是通过数学上的击败(围棋体量大, 现在也算不出), 而是因为机器是个拥有多个大脑, 可以不停学习的学霸.

回到扑克, 我觉得首先扑克和围棋相比, 可能就差在扑克是不完全信息游戏吧, 再一点, 如果说扑克机器人采用的是上一段中所说的第二种机器学习的方法的话, 那么就是说机器放弃完全的GTO策略(假设GTO被发现并使用), 机器应用非GTO策略的话, 那人类如果改变了策略的话, 机器如何能够及时发现呢, 我觉得想让德州扑克机器人能与世界一流扑克选手较量的话, 可能这两点是对于机器来说的难点吧, 前一阵那个德州机器人也确实完败给了人类.

所以这些新闻给我的感觉就是机器学习对于完全信息博弈游戏产生了天翻地覆的影响, 对不完全信息博弈游戏产生了不算天翻地覆, 但是也足够大的影响, 我想5年之内, 无限德州机器人不会击败一流扑克选手.

想说的就这么多吧, 我自己打牌特别差, 现在也还在学, 以上只是我自己的一些想法, 说的也可能有些跑题, 还有网络扑克室我去的不多, 我也没什么关注, 我住在湾区, 希望以后能在bay101 casino打出自己的一些成绩, 听说那里是老大@RichZhu 职业生涯走向辉煌的地方, 我也要加油!
作者: glamglow    时间: 2016-2-1 08:47
RichZhu 发表于 2016-2-1 02:32
我倒是觉得,AI的进步会促使牌室对机器人态度的转变。之前很多牌室对机器人的态度是比较暧昧的,毕竟机器 ...

看到这段我就放心了。

作者: kinder    时间: 2016-2-1 09:01
百度确实流氓。
作者: lililili11    时间: 2016-2-1 13:05
扑克室不会允许私人用,但是他们自己可能投放机器人,如果机器人能打赢reg的话。这要看他们在"用户体验"和"更大程度地圈钱"中做的权衡了。又一台"珍妮纺纱机"。
作者: notch    时间: 2016-2-1 15:14
lililili11 发表于 2016-2-1 13:05
扑克室不会允许私人用,但是他们自己可能投放机器人,如果机器人能打赢reg的话。这要看他们在"用户体验"和" ...

机器人破坏的是网络扑克的环境,这个是挖根的行为。
如果扑克室这么干又被揭发(或怀疑)的话,那是自掘坟墓了。
有点类似怀疑扑克室操纵那些深筹牌局BB的话题。
所以我觉得扑克室应该不会这么干。

作者: 谦虚的豆豆    时间: 2016-2-1 23:44
本帖最后由 谦虚的豆豆 于 2016-2-1 23:48 编辑

机器人真强大
作者: lililili11    时间: 2016-2-2 06:17
notch 发表于 2016-2-1 15:14
机器人破坏的是网络扑克的环境,这个是挖根的行为。
如果扑克室这么干又被揭发(或怀疑)的话,那是自掘 ...

我觉得你说的有道理。事情应该不会变得那么糟糕。机器人的出现对于玩家想要靠扑克赚钱的热情,打击太大了。所以扑克室也不乐意看到可以打败玩家的机器人的出现。还是维持一个"每个人都可以靠扑克发财"的集体幻觉,对扑克室最有利。无法击败的机器人的出现,会惊醒所有人。扑克的这种能赚钱的诱惑力可能比本身的内在乐趣更强,每个人都倾向于认为其他人是鱼,所以才会投入到扑克中,类似博傻游戏。如果大家都理智的话,即使没有机器人,扑克恐怕也只能剩下类似围棋和象棋的热度了。
作者: notch    时间: 2016-2-2 11:40
ticoarm 发表于 2016-2-1 04:27
最近这几天也在关注这个事情, 对于机器学习, 我上研究生的时候也上过这门课, 感兴趣的朋友可以去网上看scik ...

扑克的确是不完全信息游戏,但这点对人和AI都是一样的
而AI的强大在于大数据的处理,它能记住和分析和对手的所有历史牌局。
如果AI能够从中精准的提炼出每一个人的习惯,那将会是战无不胜的

人类牌手能做的就是用尽可能的平衡防御,但这点受限于人类的各种局限,不可能是完美的防御。
所以我对扑克沦陷持悲观态度

作者: RichZhu    时间: 2016-2-3 07:34
ticoarm 发表于 2016-2-1 04:27
最近这几天也在关注这个事情, 对于机器学习, 我上研究生的时候也上过这门课, 感兴趣的朋友可以去网上看scik ...

原来是来自湾区的朋友,祝早日灭掉bay101的那些妖精,哈。

我认同你的说法,就是扑克机器放弃完全的GTO策略。我一直认为,完全的GTO策略大概会是各种智能扑克软件里面最没前途的一种。

但我不同意你说的,5年之内,无限德州机器人不会击败一流扑克选手。我在微博上说,如果google来做扑克机器人,半年就足以打败人类。
(新浪微博抽风,居然删除了我的那两个关于alphago的微博,越来越不明白国内这些大网站的任性做法了。)

我认为alphago这次引入的“策略网络”和“价值网络”对有效降低机器的蛮力计算,在扑克机器上应用比在围棋机器上的效果会更为显著,这对深筹码无限德州的帮助实在是太大了。

对于人类改变策略来说,我想是不需要太担心的。虽然扑克AI直接走GTO算法行不通,机器的高效自学会让决策非常接近GTO。这应该算是一个比较有趣的地方吧,我们按GTO的算法求解,得不出GTO的答案;让机器自学,完全没有跟机器设定任何GTO关联,最后却能得到非常接近以至于实战上感觉不到差别的GTO应用。

自然在这样的基础上,AI可以有进一步的模式识别来最大化利用具体人类牌手的倾向和漏洞。即便不走到这一步,单单是非常接近GTO,也足以战胜人类牌手了。

一家之言,欢迎拍砖,俺扛得住

作者: RichZhu    时间: 2016-2-3 07:48
lililili11 发表于 2016-2-2 06:17
我觉得你说的有道理。事情应该不会变得那么糟糕。机器人的出现对于玩家想要靠扑克赚钱的热情,打击太大了 ...

即便牌室不考虑机器人对业界的长期伤害,也要考虑作弊的风险与成本。

当初UB/AP出现超级用户,对这些牌室伤害很大,但牌室还是可以以不知道,属于员工个人行为为由,勉强过关。如果是牌室机器人被发现,法律这一关就过不去了。为了维持这个秘密,牌室需要的成本太高了。

另外很多牌室都属于一个更大的游戏公司,牌室收入常常占母公司很小的比例,而且成下滑趋势,母公司也不会允许自己的牌室为了蝇头小利牵连整个公司。

连PS/FTP的母公司都在把重心往那些更赚钱的项目上移,BJ/DFS/...,就不用说其他家了。

作者: 泥中土    时间: 2016-2-3 09:31
提示: 作者被禁止或删除 内容自动屏蔽
作者: RichZhu    时间: 2016-2-4 01:27
泥中土 发表于 2016-2-3 09:31
原来rich老大上一次发贴批评的是靠蛮力的完全gto而非其它粗糙模拟的近似gto呀。 ...

这两种GTO的实现都不适合人类牌手。另外把第二种说成粗糙模拟并不妥,它只是机器自学在一定条件下的收敛结果,构成的一个平衡或者自洽的体系,是可以做到“足够”逼近正解的。

我上次发帖也不是单指蛮力gto的不可实现,更多的是对中文扑克界在GTO理解和应用方面普遍存在的混乱和误导谈一下我的看法,希望至少对部分玩家多少有些帮助,少走些弯路。这个话题太长,有兴趣的朋友可以看http://www.zhiyoucheng.co/thread-23321-1-1.html

从人类的角度来讲,扑克真的是一个很朴实的东西。不管AI进化到什么程度,人类最有效最实用的学习途径还是要从基础知识、基本概念开始,而整个过程最重要的部分一定是让自己学会用脑,而不是带着幻觉钻牛角尖。


作者: RichZhu    时间: 2016-2-4 01:46
notch 发表于 2016-2-2 11:40
扑克的确是不完全信息游戏,但这点对人和AI都是一样的
而AI的强大在于大数据的处理,它能记住和分析和对 ...

扑克沦陷给AI没关系哈,反正扑克是人跟人的对局。

国际象棋沦陷快20年了,人类仍然兴致勃勃地玩,高手仍然是智力比较好的那个群体。我觉得扑克机器战胜人类对扑克整体水平的影响要远小于国象和围棋的影响。

作者: ticoarm    时间: 2016-2-5 16:05
RichZhu 发表于 2016-2-3 07:34
原来是来自湾区的朋友,祝早日灭掉bay101的那些妖精,哈。

我认同你的说法,就是扑克机器放弃完全的GTO ...

先感谢一下老大的祝福, 我一定好好学牌, 我想我一定会在bay101打出成绩.
对于何时机器人能够击败一流选手, 我重新认真思考了一下, 觉得这个问题量化处理的话, 其实就是CPU时间和算法问题.

我知道老大对于围棋有研究, 对于AlphaGo所表现出来的能力与解决围棋游戏所需要的CPU时间和算法之间的关系一定有更深刻的理解, 从解决围棋问题来看, 上述的CPU时间和算法这两个要求, Google公司一定是足够的, 所以我现在觉得自己之前说的5年内机器人无法击败人类有些欠妥, 其实我之前得出这个结论也是由于我对于GTO的误解, 但这里就不详细说了.

总之, 很喜欢也很感谢这样的讨论, 希望以后继续, 共同进步, 也给大家拜个早年.

作者: amandag    时间: 2016-2-5 21:49
个人有编程的能力,最近在思考一些牌例的时候想用编程来模拟和对手交手的各种action,结果发现自己很多牌原来想的并不清楚。比如100bb有效筹码,我们mp所有open的range被后位call(我们可以根据对手的入池率来估算对手的calling range),我们在什么样的flop会cbet,如果对手call,所有可能的range是什么,turn上我们继续bet对手raise的range可能是什么?我们需要马上弃牌吗?具体点,mp 99 open 之后能cbet的flop有多少个,那些flop适合check call,什么样的情况在turn上必须放弃。我们现在总是用经验去解决问题,但互联网大数据的时代,数据分析肯定更有价值.
作者: amandag    时间: 2016-2-5 21:52
如果上面的问题解决了,下面就是如果指定入池率的选手open,我们在什么样的flop call之后turn上raise对手fold的概率大于
作者: amandag    时间: 2016-2-5 21:56
call和reraise的概率,我相信数据分析+现场状况肯定比仅仅是凭经验做判断强
作者: noworry    时间: 2016-2-6 00:50
RichZhu 发表于 2016-2-4 01:46
扑克沦陷给AI没关系哈,反正扑克是人跟人的对局。

国际象棋沦陷快20年了,人类仍然兴致勃勃地玩,高手仍 ...

不太理解老大讲的这句话 -- “我觉得扑克机器战胜人类对扑克整体水平的影响要远小于国象和围棋的影响。”

另外机器牌手战胜人类,大家都跟机器人学习,这个影响会非常大吧?

作者: royalflush    时间: 2016-2-6 14:56
本帖最后由 royalflush 于 2016-2-6 15:10 编辑
虽然扑克AI直接走GTO算法行不通,机器的高效自学会让决策非常接近GTO。这应该算是一个比较有趣的地方吧,我们按GTO的算法求解,得不出GTO的答案;让机器自学,完全没有跟机器设定任何GTO关联,最后却能得到非常接近以至于实战上感觉不到差别的GTO应用。

完全赞同上面这一段!
另外我对这一场比赛的看法是如果AlphaGo输是不要紧的,它将会有更多的数据输入,然后可以24/7进行自学修改调整,再来下一场比赛。




作者: RichZhu    时间: 2016-2-7 06:28
ticoarm 发表于 2016-2-5 16:05
先感谢一下老大的祝福, 我一定好好学牌, 我想我一定会在bay101打出成绩.
对于何时机器人能够击败一流选 ...

新春快乐!

确实,这次AlphaGo横空出世,震惊了几乎所有关注围棋AI的人。机器围棋这么多年一直进展缓慢而且有很强的“可预测性”,然后,out of nowhere, AlphaGo就出来了,不但一下子成为最牛的围棋AI,而且在让4子或更多的情况下,把其它所有顶尖的围棋机器打得完全没有招架之力,这个跳跃实在太大了。

更牛的是,所有这一切都是在硬件几乎没有变化的情况下做到的,完全是算法上的突破,这也是为什么AlphaGo被认为是人工智能的一个里程碑。确实,人类之前都过多把注意力放在计算能力的提高上了,而靠计算能力的提高对围棋这样复杂的游戏,水平提升是非常缓慢的。 就是这个AlphaGo本身,使用分布式的AlphaGo(1202个CPU,176GPU)跟单机式的AlphaGo(48CPU,8GPU)对下,胜率也就是78%,可见计算能力要提高很多,机器水平才会提高一丁点,这也是为什么几乎所有专业人士认为计算机战胜职业棋手要等到下一代计算机的出现。

回到扑克机器,比较专业的研究也就是近几年的事情,落后围棋机器的研究实在太多了。即便这样,很多商业研究的软件也已经到了在网络中低级别盈利的程度。而这些软件,基本上都有明显的漏洞,非常不完善。

就说去年人机大战的那个Claudico程序吧,人类牌手进池的时候都会有个小的raise,因为他们发现程序在应对随机的小加注方面漏洞明显,另外程序还会出现在一个很小底池下超级大注的违反基本常识的打法。显然这些程序在基本算法方面还有很大的漏洞,而AlphaGo这样的算法是不会有这累问题的,这是为什么我觉得google要是研究扑克机器,半年就足以打败人类。

但是,“打败人类”这个说法要特别小心。在围棋上,没什么好说的,就是人跟程序下,赢了就是赢了,输了就是输了。在扑克上,我们大概只能指的是人跟机器的heads up比赛,任何超出这个范围的定义,要复杂和有争议得多了。再说下去太长了,先到这里,后面回复另外一个帖子的时候可能会展说。


作者: 小胖    时间: 2016-2-8 08:01
lililili11 发表于 2016-2-1 13:05
扑克室不会允许私人用,但是他们自己可能投放机器人,如果机器人能打赢reg的话。这要看他们在"用户体验"和" ...

这.....听着有些可怕。

作者: RichZhu    时间: 2016-2-9 02:38
noworry 发表于 2016-2-6 00:50
不太理解老大讲的这句话 -- “我觉得扑克机器战胜人类对扑克整体水平的影响要远小于国象和围棋的影响。” ...

大家都跟机器人学习,影响肯定是会有的,但究竟影响多大,恐怕不会像很多人认为的那么大。

我们看一下国际象棋,过去这些年,随便找个击败人类最优秀牌手的程序不是难事,但有多少人成为国际象棋大师?人类跟计算机学也不是一件容易的事情,这个我在前面那篇关于GTO的帖子中说过。

就是人跟人学,都不是很容易的事情。我在那篇关于AK争论的帖子中说过:“如果Phil Ivey出书,出视频,毫无保留给出他所有知道的,难道扑克届就会瞬间出现成千上万的Ivey?”

与围棋象棋相比,扑克更多的是一个策略性游戏。简单学习机器在这里fold,那里raise或者面对这个对手这里下注多少,面对另外一个对手同样条件又该下注多少,是没有多少效果的。度过了最初的ABC阶段,你必须理解一套具体打法的背后思路,才会真的对你有帮助。相比之下,围棋有很大比例的技巧训练,比如大量的定式和局部死活,这些部分的人机训练,效率很高。

另外一点,就是当围棋机器战胜人类的时候,这个机器已经非常接近这个游戏的“正解”了。职业围棋手,对对方的错误是非常敏感的,而自身水平发挥也波动很小,加上围棋是一个完全信息的游戏,围棋程序必须要很接近正解才可能击败人类。相比之下,扑克牌手很难快速抓到机器的弱点,除非是算法本身有明显漏洞,而扑克牌手的水平发挥的波动和错误是大量的,常常是明显的。所以当扑克机器击败人类的时候,可以想象它离“正解”比围棋远,比国际象棋更远,所以它本身打法的参考价值就要打折扣。

最为重要的还是围棋这些游戏规则导致的人机学习过程的相对“单一性”。围棋的目标是非常单纯的,就是最终比对手围的地多,而国际象棋的终极目标就是消灭对方的王。请注意,围棋比终局的时候谁围的地多,并不需要考虑赢家比输家多围多少,这是为什么AlphaGo在领先的情况下可能下得非常猥琐,因为只要算清楚一条路确定能赢,就不必考虑其它计算,从而进行安全运作。如果像有些赌棋那样计算具体输赢的目数,就会复杂得多了。

相比之下,扑克就没有这样简单的目标了。除非一些特定形式的比赛,你很少会只考虑输赢的几率而不考虑输赢的大小。而这个输赢大小的考虑,会让人机学习一下子变得极为复杂,或者说学习效率变得很低。

我在“漫谈现场与网络扑克的差异”里面关于打鱼说过这样一段话:打鱼不但是扑克游戏的原动力,也是扑克理论与实践的本质与核心!扑克游戏不是在追求假设对手在打法正确下如何应对,而是在寻找如何在对手出现错误的时候最大利益化。扑克难的地方不在于对正确打法的正确应对,难的是在不断变化中捕捉到对手偏离正确打法,并给出相应的最佳应对。求解并及时应用对手偏离正确打法时的最佳应对要远比对手正确打法下的正确应对复杂,一个是一维静态的,一个是多维动态的。

5年前写这一段,是为了给“打鱼”正名。当时有一些所谓的高手习惯于高傲地说:你那一套也就只能打鱼。想必过来的人还记得这些吧,就如同这两年高手一开口,必然GTO一样。

巧的是,扑克的人机学习,比较具有围棋人机学习特点的部分,恰恰就是GTO相关部分,也就是我前面指的一维静态,尽管这一部分也只能学习一些特定条件下的处理。

简单说,人的大脑就不像学围棋和国象那样适合学习扑克的机器打法。国际象棋AI的影响尚且如此,能指望扑克AI对扑克技战术影响到什么程度?人类学习扑克的学习曲线在最初部分上升很快,然后就是漫长的缓慢提高过程。前面那部分的训练用不着特别强大的扑克机器,而后面的那部分,再强大的扑克机器也帮助有限,主要还是靠牌手自己对扑克的思考,理解和执行。

不要叹息。这实际上是一件值得庆幸的事,否则扑克很快就会消亡了。

作者: RichZhu    时间: 2016-2-9 02:44
amandag 发表于 2016-2-5 21:49
个人有编程的能力,最近在思考一些牌例的时候想用编程来模拟和对手交手的各种action,结果发现自己很多牌原 ...

这个思路很多人尝试过但成效不大。主要的问题是,如果数据不做大量假设和简化,求解的计算量太大以至于不可行;如果做了这些简化,结果的指导意义就会大打折扣,对实战未必有帮助。


作者: hutgies    时间: 2016-2-9 14:04
就是人跟人学,都不是很容易的事情。我在那篇关于AK争论的帖子中说过:“如果Phil Ivey出书,出视频,毫无保留给出他所有知道的,难道扑克届就会瞬间出现成千上万的Ivey?”

与围棋象棋相比,扑克更多的是一个策略性游戏。简单学习机器在这里fold,那里raise或者面对这个对手这里下注多少,面对另外一个对手同样条件又该下注多少,是没有多少效果的。度过了最初的ABC阶段,你必须理解一套具体打法的背后思路,才会真的对你有帮助。相比之下,围棋有很大比例的技巧训练,比如大量的定式和局部死活,这些部分的人机训练,效率很高。


说得好。
作者: RichZhu    时间: 2016-2-16 03:40
AlphaGo跟李世石的人机大战确定于3月9日、10日、12日、13日和15日在首尔举行,奖金为100万美元。国外的朋友可以在YouTube观看直播。
作者: sexrange    时间: 2016-2-17 11:48
首先,据说ai在ps上测试过,无法再NL100以上级别稳定盈利,当然赢是肯定的,只是平衡不了反水。但是PLO是基本沦陷了。plo400轻松盈利。
作者: sexrange    时间: 2016-2-17 11:53
我觉得对德州扑克ai的研究投入一定不小,另ai的自学习能力在德州扑克中遇到的瓶颈与围棋的有比较大的区别。ai是的自学习能力和大数据结合,表现在通过历史经验的成败比例和一定程度的对对手的解读。当然最大的优势是稳定,永不上头。这个恐怖啊!
作者: RichZhu    时间: 2016-2-18 05:33
跟围棋ai相比,扑克ai的研究只能算是连一挺歪把子机枪都没有的区小队。google跟facebook的ai竞赛,岂是这些扛着三八大盖数着还剩几颗子弹的民兵所能比?
作者: sexrange    时间: 2016-2-18 16:43
RichZhu 发表于 2016-2-18 05:33
跟围棋ai相比,扑克ai的研究只能算是连一挺歪把子机枪都没有的区小队。google跟facebook的ai竞赛,岂是这些 ...

听过google团队的核心人员表示,之前参与过的项目包括poker和星际争霸。从理论上来说这两个项目属于失败,但是对于围棋项目来说也有不少的帮助。所谓的自学习能力一定能从不同的项目中得到共通的人类智慧的特点。围棋和星际最相似的是复杂局面的形势判断,和多个局部对整体全局的影响,从而找出局面的要点。扑克中的难度应该也在判断方面吧,从围棋网站的介绍来看,阿尔发狗根据图库中搜索中寻找不同的可能落子点,然后通过推演来排除(也就是模仿人类思维)如果这一特点也运用在扑克AI上,估计也将是质的飞跃。
很有幸这三个项目我都略有涉猎,自我感觉这三个项目可以代表人类智慧的最高水平。

作者: sexrange    时间: 2016-2-19 17:01
在DeepQ中,他们将深度神经网络与所有动物都有的通过大脑多巴胺驱动奖励机制的‘强化学习’结合了起来。而在AlphaGo中,他们更进一步又增加了另一种更深度水平的强化学习以处理长期计划。接下来,他们将整合例如记忆功能等等——直到理论上达成每一个智能的里程牌。Hassabis说:‘我们在存在多少这些能力的路线图上有一个想法。将所有这些不同领域结合起来是其中关键,因为我们对那些可以在一个领域内学习又能将知识应用到新领域的算法很感兴趣。’

  这听起来有一点他的个性。乍一看他的简历,可以发现他颇为业余的好奇心包含了从棋盘游戏到视频游戏到计算机编程到认知神经科学等一切,更别提人工智能了。事实上,他今日成就的取得是聚焦的结果:将自己在同代人少见的强大智力与他一生专研过的学科等各方面有意识地合成在一起。(简单点出他人生的亮点:8岁写出自己的电脑游戏;13岁收获国际象棋大师地位;17岁创造了第一款包含人工智能的视频游戏《主题公园》;20岁以两科优等成绩获得剑桥大学计算机科学学位;不久之后就成立了开创性的视频游戏公司Elixir;之后他在海马体和情景记忆上的开创性学术研究成为了他的‘最后一块拼图’;2011年成立DeepMind。)

  他承认:‘我非常容易感到无聊,而世界又如此有趣,有太多炫酷的事情可做。’(他还保持着五次获得智力奥林匹克运动会(Mind Sports Olympiad)精英赛Pentamind冠军的世界纪录,在该比赛中,挑战者需要在多个项目中互相挑战。)‘如果我是一个体育运动员,我就会一直想成为一个十项全能选手。’

  不过体育的荣耀再也没有希望了。Hassabis是一位忠实的利物浦球迷,喜欢观看各种体育赛事,四岁那年他开始下国际象棋,不到一年就开始了全国比赛,不久之后又开始角逐于国际赛场。现在可以很明显地推测出,他的一生都将与心智有关。

  1976年,他出生于伦敦北部,他有一位希腊-塞浦路斯混血的父亲和一位新加坡-中国混血的母亲,他是三个兄弟姐妹中最大的一个。他的父母都是教师,曾经还拥有过一家玩具店。他的妹妹是一位作曲家和钢琴家;他的弟弟研究创意写作。他的家庭并没有太多的科技色彩。‘显然我是家里另类的害群之马,’他开着玩笑,回忆起当他还是一个小男孩时将自己的下棋奖金花在了一台ZX Spectrum 48K计算机上,然后又买了Commodore Amiga,他立即拆开了它并搞清楚了怎么编程。‘我父母有点技术恐惧。他们真的不喜欢计算机。他们是那种随性的人。我的妹妹和弟弟也都走了艺术路线。他们没人真正深入学习过数学或科学。’他耸耸肩表示抱歉,‘所以,是的,这很怪异,我也不知道这一切都由何而来。’

  他的公司在被谷歌收购时有50多人,现在的员工人数快到接近200,他们来自45个国家,占据了一整栋位于国王十字路的六层建筑。尽管有让他将公司搬往别处(可以推测肯定包括硅谷的山景城)的压力,但Hassabis决心他的公司应该保持在离他的根很近的地方。

  ‘我是在北伦敦出生长大,’他提醒我,‘我当然爱这座城市。这就是我要坚持留在这里的原因:我觉得没有任何理由说伦敦不能拥有一个世界级的人工智能研究所。而我也对我们现处的位置感到自豪。’这栋建筑所有房间都是以知识巨人:特斯拉、拉马努金、柏拉图、费曼、亚里士多德、玛丽·雪莱(他是她的粉丝?‘当然,’他再次向我确认,‘我读过好几遍《弗兰肯斯坦》。把这些东西铭记心中很重要。’)。

  建筑的第一层是一间咖啡厅,装配着裸露的砖墙和装有客用椰子水的冰箱,还能见到在世界上大部分雄心勃勃的科技公司里都能看到的桌上足球机和沙包。楼上则对原来的建筑进行过装修,是一个现代的开放式结构,楼上办公室带有一个阳台,在上面能够欣赏到伦敦屋顶的壮丽景色。

  DeepMinder会在星期五晚上聚会畅饮。一位员工热情洋溢地将这个活动描述为‘用HIGH来结束一周’的方式。社交是生活中不可或缺的一部分:我被告知DeepMind有俱乐部、足球队、棋类游戏俱乐部。(‘这一个相当有竞争力。’)一张可更换照片的挂图表明这里每一个人每一天都是办公桌轮用的。这是极其开放式的。我经过走道时看到这里的工程师——男性居多——打破了人们认为的这一类人在角落里书呆子式工作的刻板印象:这些家伙看起来健康、快乐又很酷。不得不说这里有一种智力的魅力在空气中回荡。这不奇怪。这个星球上最聪明的人正排着队想来这里工作;而到目前为止,这里的员工留存率是惊人的100%,尽管谷歌的最大竞争对手们对人工智能的关注正在加速,更不要说同样求贤如渴的世界各地的一流大学了。

  ‘我们实在是很幸运,’Hassabis说,他将他的公司比作阿波罗计划与曼哈顿计划,因为该公司的雄心壮志以及其所招募的人员的水平都在以前所未有的速度攀升。‘每年我们能从每个国家获得最好的科学家。例如,我们将拥有赢得波兰物理奥林匹克竞赛的人,获得今年法国年度最佳数学博士的人。我们得到的想法比我们获得的研究人员还多,但与此同时,还有更多优秀人才前来,我们已应接不暇。所以我们正处在一个非常幸运的位置。唯一的限制是在不破坏这种文化氛围的基础上我们能吸纳多少人。’

  这种公司文化要比豆沙袋(用来踢的那种)、免费午餐、天台上的啤酒等表面上的公司活动要更加深入。Hassabis坚信,谷歌的收购完全没有让其偏离自己的研究路径,他说他花在DeepMind公司运作效率方面的时间一点也不比花在算法上的时间少,他认为他的公司‘完美结合了最好的学术和最令人激动的创业,因此,公司充满着惊人的能量,催生了无数创造力与进步。’他屡次提到‘创造力’,虽然他接受都是正规的科学训练,但他是‘天生就富有创造力和敏锐直觉’的天才。他斩钉截铁地说:‘从某种意义上来说,我不是一个标准的科学家。’DeepMind组织架构中至关重要的是被他称之为‘粘合思维(glue minds)’的东西:充分掌握各个科学领域知识的学者们能‘以别出心裁的方式快速找出有前途的跨学科交叉点。’应用正确的基准,这些粘合者能以小组的形式每几周就碰一次面,快速、灵活的将各种资源和工程师匹配到需要的地方。‘因此,你将拥有一个令人难以置信的天才研究者,而且3-4名其他领域的研究者可以直接接过同一任务,基于自己的专业进行补充,这与学术界十分不同,’他描述道,‘这样所带来的结果就是能很快地产生一些惊人的结果。’仅仅启动了18个月的AlphaGo项目就是这一理念的完美例证。

  每天晚上,Hassabis都会乘坐北线巴士准时回家,与家人共进晚餐。他们居住在伦敦北部的海格特,距离他长大的地方不远。他的妻子是一名意大利分子生物学家,研究阿尔茨海默症。他们有两个儿子,一个7岁,一个9岁。Hassabis会和他们一起看书玩游戏,或者辅导他们的家庭作业。(‘他们都很优秀,但他们在科学和创新方面更像是我的对立面。’)

  像每个父亲一样,他会哄他们睡觉。然后在11点左右,大多数人都上床睡觉时,Hassabis会开始他称之为的‘第二天’。每天和美国团队的电话会一般会持续到凌晨1点,之后就进入他一直持续到凌晨3、4点的‘纯粹思考时间’:他会考虑公司的研究工作和接下来的挑战,或者写一份算法设计文档。

  他承认,实际上没有太多人工智能编程工作。‘因为我现在的数学太生疏了。更多的是直觉式的思考。或者是关于公司战略的思考:如何将其规模化,如何管理,等等。或者是想一些当天在文章和新闻中看到的东西,思考我们的研究如何和那些东西结合起来。’

  这让我想到了AlphaGo,,它就在令人很难想象的拥有庞大计算能力的谷歌云端不停的练习、练习、再练习,每一秒、每一天都在进步,因为它学习的唯一方法就是永不停歇。

  ‘它会休息吗?’我问到。

  ‘不,它不会休息。即便在圣诞节期间也没有。’

  我有些犹豫:‘它真的永远不需要休息吗?’

  ‘可能它就喜欢这样(永不停歇)’,他回复道,眼睛闪闪发亮。
作者: sexrange    时间: 2016-2-19 17:02
我觉得,阿狗要搞定德州扑克是一件轻松愉快的事情。
作者: monox0    时间: 2016-2-19 21:59
对诸位大神的评论表示认同--  机器超过人只是时间的问题,如果不是已经。
而且这个时间是很短的。  

我学过一些R, 会简单的建模包括各种神经网络,random forest 还有什么回归, 只能说理解这个原理,绝非高手,但我觉得这将是非常快速的事情。

问题是,扑克室越来越迫切的需要加强这方面的监管, 他们需要足够强大的anti bot 监控团队和技术。

这就是一场猫捉老鼠的游戏,道理和黑客与反病毒是类似的:

bot不仅掌握了unbeatable 的快速算法,而且需要模拟人的行为(比如一些随机的鼠标路径)等来骗过检测。

这可能比起得到那些扑克最优解的算法来说,太容易不过。

接下来扑克室方一个可能的方案会是: 加上视频控制,即你打牌的时候需要视频联网。
这同样会带来问题, 这样只能限制你需要和你的bot同时物理存在, 一样难以限制利用屏幕捕捉技术来进行最优算法的bot 对你进行人为的提示。比如你可以想想这样一个bot是一个手机的app,利用蓝牙监控你的屏幕,然后对你的行动进行提示的模式。

归根到底,网络扑克室对玩家的行为监控不可能细致到和现场反作弊一样强大,否则,那将是整个实体扑克动荡的开始和结束。

所以,无论扑克室采取激进或者保守的对策,他们面临的最大的问题是:
大数据对扑克环境的冲击是必然的,但他们用什么去保卫自己的蛋糕?
作者: RichZhu    时间: 2016-2-20 06:43
sexrange 发表于 2016-2-18 16:43
听过google团队的核心人员表示,之前参与过的项目包括poker和星际争霸。从理论上来说这两个项目属于失败 ...

没有看到这一段,有链接吗?作为AI研究者,接触各类游戏项目是正常的,不过扑克项目对围棋项目的帮助有多少,是个有趣的话题。

传统算法中,机器围棋和机器扑克走的是完全不同的路。围棋是典型的完美信息博弈,采用各种形式的树状搜索;而扑克则是不完全信息博弈的代表,博弈论是它的基石。

人工智能专家一直偏爱围棋AI,研究的力度和投入的资源远非扑克能比。最早的围棋程序出现在上世纪60年代,到了80年代末就已经有不少人关注了。我记得90年前后,好像是应氏围棋基金还是哪个组织就50万美元悬赏计算机程序:击败一个11岁的小孩就可以。91年出现网络围棋,机器围棋也进入一个发展阶段。说来也巧,AlphaGo使用的数据来自KGS,而KGS的前身就是第一家网络围棋IGS。

相比之下,扑克机器的研究时间和规模就差得多了,都是本世纪的事。有代表性的成果也就是阿尔伯塔大学的Polaris和卡内基梅隆大学的Claudico,再加上一个商业性质的snowie。这个跟谷歌公开AlphaGo的前一天,facebook老板扎克伯格在脸书上大谈他自己的AI团队及围棋程序Darkforest形成鲜明的对比。

不过在alphago的混合算法获得突破性成果之后,机器围棋和机器扑克可能殊途同归,想想也是自然的进程。

作者: RichZhu    时间: 2016-2-20 06:58
monox0 发表于 2016-2-19 21:59
对诸位大神的评论表示认同--  机器超过人只是时间的问题,如果不是已经。
而且这个时间是很短的。  

最终的结果,只能依靠法律。

就像你无法用任何技术手段阻止偷窃不发生一样,惩罚性法规和可执行性,才是把偷窃降低到社会可容忍限度内的基本办法。

技术的进步产生了网络扑克,反过来,对网络扑克的根本威胁也来自于技术的进步。靠技术的进步来阻止技术带来的破坏是不现实的/违反逻辑的。


作者: sexrange    时间: 2016-2-21 20:10
RichZhu 发表于 2016-2-20 06:43
没有看到这一段,有链接吗?作为AI研究者,接触各类游戏项目是正常的,不过扑克项目对围棋项目的帮助有多 ...

这是翻译的内容,在围棋TV的论坛。是英国杂志采访的部分内容。说白了,阿狗的学习方法是无限模仿人类的学习方法,只是他是不会疲倦的。但在创造性方面还是不可知,另学习中也会有错误,但在扑克中会通过自身的获胜概率来排除。而且他可以自己和自己来进行经验积累。
作者: swatow    时间: 2016-2-22 10:08
那桥牌呢?桥牌的赛制多样,还有各种叫牌体系,AI应该就比较困难了吧,即便AI可能坐庄会比较厉害。
作者: RichZhu    时间: 2016-2-23 04:53
swatow 发表于 2016-2-22 10:08
那桥牌呢?桥牌的赛制多样,还有各种叫牌体系,AI应该就比较困难了吧,即便AI可能坐庄会比较厉害。 ...

桥牌实际上是相对容易的。

尽管现在仍不能宣称机器桥牌击败人类,但十年前桥牌程序就已经到了大师级别。之所以桥牌没有更多的提高从而宣布战胜人类,主要原因应该不是技术上的,而是普遍缺少的学术和商业兴趣,没有像国际象棋或者围棋那样吸引主力部队参战。

按说桥牌本身是带有随机性的不完全信息游戏,跟围棋国象等棋类是完全不同的两类,但实际处理过程中,典型的桥牌程序采用了“双明手”的算法解决核心的搜索部分。就是不但坐庄的一方有一个明手,防守一方也有一个明手,这样就是四家全明牌了。自然在这种情况下,计算大大简化,因为双方都有一个明确的路径达到己方获取最多墩数。

另一方面,我们知道桥牌在叫牌的时候是有很多明确规定的。我记得刚来美国的时候去当地一家俱乐部,打了第一手牌,对方就叫了裁判。我是明手,摊牌的时候,对方质疑我为什么会应叫1d,我回答说,同伴1c是逼叫性开叫,我的1d只是示弱,跟牌型牌点无关。由于事先已经告知对方我们使用精确叫牌体系,觉得这是很基本的内容,根本不用提示对方,但对方不懂这个体系,我们没有提示错误就在我们,因为缺省叫牌体系是自然叫牌法。从程序的角度来说,叫牌体系规定的严格其实是有利于机器的,它可以很有效地收集信息,也可以比人类跟有效地找到对方违规叫牌。

这样,桥牌机器在各种已知信息下寻找最佳打法其实就是根据各种可能的“双明手”样本计算优化策略。当然赛制本身是一个考虑,但目前基本上都是定约桥牌,只是考虑一下队式赛和双人赛等不同算分方式进行相应的调整,这类调整都是完全独立的,对机器不是问题。

说到这里就简单了,桥牌程序没什么特别的人工智能出彩的地方,这大概是为什么它缺少学术兴趣吧?而商业兴趣,可以想象它没法跟德州扑克相比,桥牌这个行业,没什么可以赚钱的地方。

不过桥牌的这种算法是不能应用在无限德州扑克上面的。最大的问题是无限德州扑克不但需要打牌策略,还需要下注策略,这使得扑克机器的样本空间爆炸性地增长,从而使这个算法变得不现实。

需要提醒一下,大家之所以对alphago评价很高,就是它非常有效地降低了算法对机器系统资源的消耗。

最后说一句关联的话,所有国内流行的非wsop项目的扑克游戏,都属于短期内可以做出战胜人类的程序,只是看有没有人愿意做。这些包括斗地主,双扣,大菠萝等等任何你可以想到的扑克游戏。这些游戏易解的原因就是它们因为没有下注策略的要求导致计算量远远小于无限德州扑克。





作者: glamglow    时间: 2016-3-7 17:07
所有国内流行的非wsop项目的扑克游戏,都属于短期内可以做出战胜人类的程序,只是看有没有人愿意做。这些包括斗地主,双扣,大菠萝等等任何你可以想到的扑克游戏。这些游戏易解的原因就是它们因为没有下注策略的要求导致计算量远远小于无限德州扑克。


还能不能愉快地一起玩耍了?
作者: 扑克是这样吗    时间: 2016-3-7 17:35
在开始打牌之前,大概几个月前吧,一边看书,
一边看这些新闻 , 机器学习啊 , Cepheus项目啊 , 之类的
每看一次就悲伤一次, 要是我都还没学成 , 线上扑克就死了 , 那我不是亏大了 ,
付出的学习时间成本就收不回了 ,  还是快点开始打吧 , 趁还能玩...
希望能通过扑克赚取第一桶金 ,  然后管它死活...
作者: bomb    时间: 2016-3-9 10:16
友情提示:人机大战还有不到两小时就开始了。。。
作者: 泥中土    时间: 2016-3-9 15:40
提示: 作者被禁止或删除 内容自动屏蔽
作者: yangky    时间: 2016-3-9 15:40
第一局小李已挂
作者: sexrange    时间: 2016-3-9 17:12
我震惊了,世界也
作者: monox0    时间: 2016-3-9 21:21
虽然不愿意接受,但完全情理之中啊 希望后面的战斗中可以挽回颜面。
作者: 不茶不酒    时间: 2016-3-9 21:24
不会下棋,感觉问题不在输赢,电脑能跟最强的棋手作对手了,这个。。。。
作者: 泥中土    时间: 2016-3-10 17:06
提示: 作者被禁止或删除 内容自动屏蔽
作者: haoqianruhaose    时间: 2016-3-10 17:44
其实人工智能还是可以操纵股票市场,从股市里赚钱,天经地义。
作者: Jimihandrix    时间: 2016-3-10 19:21
haoqianruhaose 发表于 2016-3-10 17:44
其实人工智能还是可以操纵股票市场,从股市里赚钱,天经地义。

在美国,量化交易早已经统治市场了

作者: starbit    时间: 2016-3-11 08:16
想到一个可能
李世石会不会在这场对决中被毁掉
从此一蹶不振。。跌落下来?

心境不一样了
作者: gaosi    时间: 2016-3-11 20:39
我个人觉得现在机器人唯一能领先人类的就是大型MTT比赛ICM的精准计算 但是MTT的波动就把它盖住了
在cash里边已经有了GTO这个东西 大不了大家最后一路打GTO 长期不输不赢而已
除非你能教机器人读人、抓马脚什么的 那有点太过度了
作者: 四条三最大    时间: 2016-3-12 13:10
李世石有没有后悔接战?可能被打击到了。
作者: RichZhu    时间: 2016-3-22 16:31
这次人机大战这么热闹,都惊动了两会,咱们这个主题却冷清了。

这个怪我,头几天没网络,只能手机观看,在微信和QQ上聊聊。后来有了网络,却一直太忙,没时间发帖。现在能发帖了,这个比赛的热乎劲也过去了。

好在对智游城的朋友来说,这个主题并不过时,人机大战的结果会让更多的牌手思考扑克理论和应用的问题。

可是真的要写什么,却发现网络上的相关信息经过一个短暂的爆发,没留下很多可写的了。截取智游城模范居民群的部分聊天做个交代,这个主题也不算烂尾楼了。

至少,在Alphago可能的表现、比赛过程中疯传的打劫问题和秘密协议等热点上,智游城的微群讨论是领先主流媒体和职业棋手的,值得整理出来留在论坛上。当然,处于各种原因,只能整理其中的一部分。

作者: RichZhu    时间: 2016-3-22 16:56
Rich 20:15
比赛开始了

智游门徒 royalflush 20:44
[ThumbsUp] Rich 来现场报道和分析

Rich 21:05
alpgago 的进步让绝大多数关注者感到意外

Rich 21:06
当然不包括顺子和智游城很多有理工科背景的玩家

soho 21:08
到底是程序员编译的程序在对战还是程序自己拥有了AI在对战

Rich 21:10
AG有很强大的自学能力

soho 21:11
这个自学能力是程序员赋予他的,还是他自己进化的

Kunlun 21:11
第一盘是不是基本决定了最终结果?

Rich 21:12
神经网络

Rich 21:13
第一盘基本就知道AG过去五个月的提高程度

Rich 21:16
这盘棋到目前为止李世石一直不占上风,不是好事,如果中盘不占优,就很难赢了

soho 21:16
好高端,把这个机器设计成类似人脑那样,然后不停模拟大量棋局与自己对奕,来提高水平

Kunlun 21:18
中国也搞了个跟科杰下

汤振 21:21
官子计算量应该相对少,机器占优

Mike 23:39
AlphaGo真的赢了

Mike 23:41
让四子吧?

智游门徒 royalflush 23:54
明天还有机会扳平

智游门徒 royalflush 23:54
不要输0-5就好

————— 2016-03-09 —————

Mike 00:04
大概看了一下棋谱,这李世石太不把AlphaGo当人了吧

Bart 00:11
不当人不对吗[Shocked]

Mike 00:14
感觉他要是当成正常人下正常棋赢的面更大,他好像有点针对机器,就像我们在牌桌上过分针对鱼而背离了自己习惯的打法似的

萤火虫虫 00:18
我是文科背景,更不觉得奇怪,文科生一般具有超乎理工生的想象力,另一方面,文科生习惯马后炮。

Rich 00:21
我没有马后炮,昨天还跟人说AG这几个月的进步会让大多数人意外

Rich 00:24
其实这盘棋的质量很高,李世石输不是因为发挥失常

萤火虫虫 00:32
感觉李世石跟机器好像不止差一点

萤火虫虫 01:42
还有四局:周四、六、日、二

soho 01:42
网上有开盘吗,赔率多少

萤火虫虫 01:43
不知道[Chuckle],肯定有

soho 01:44
上次小李子小金人开1/20,买20赔21

萤火虫虫 01:44
[Grin]

智游门徒 royalflush 03:03
只能说 alphago 非常强大 lee sedol 只要不输 0-5 就ok了

萤火虫虫 03:10
从新闻角度,后面不重要了,一上来就输一场,好戏剧,而且李之前还放话说机器不行,他真的不知道机别三日,当刮目相看吗,他真的一点没做功课吗?我看未必,可能配合作秀呢?从此角度,后面让应该会赢。[Chuckle]

萤火虫虫 03:10


萤火虫虫 03:16
回到德扑:

智游门徒 royalflush 03:17
应该没做戏

萤火虫虫 03:19
他对机器人的了解差距不应该那么大

智游门徒 royalflush 03:19
如果你去 alphago page 看那些 paper, 一个paper 用几个月初步了解 那里有超过10个paper

智游门徒 royalflush 03:20
Alphago 的公开局 只有 5-0 赢 fan hui

智游门徒 royalflush 03:21
只能说 lee sedol 遇上他最强的对手了

zhigang 04:51
李世石靠不住,中盘后优势却在收官时连连失误挥霍,要是柯洁上就没有问题[Grin]

zhigang 04:56
柯洁对李世石8:2遥遥领先

萤火虫虫 05:32
[App message]

Rich 10:56
还是没受过理工训练。他对李世石有优势并不等于是alphago更厉害的对手,后半盘好的棋手对alphago来说更容易

作者: RichZhu    时间: 2016-3-22 17:43
阳 20:04
柯洁说这话根本没逻辑。目前电脑的弱点都没得到确认

阳 20:05
李世石能赢一盘的话他这再说这话还有点可信。还得看怎么赢的。

Mike 20:06
看了一些棋手的分析,基本上李世石的发挥有问题比如说轻敌这一点是共识了。我觉得最后他会取胜的,除非他真的下注买自己输了[Grin]

Mike 20:13
昨天刚结束我也认为是他太不把电脑当人了,如果他把电脑当柯洁赢面会非常大

萤火虫虫 20:20
我一个同学说他下得还是有点随意,我是不懂

Rich 20:30
说李世石轻敌的大概都不了解李世石,不了解韩国棋手

Rich 20:31
韩国人下棋哪怕是修车开餐馆都比咱们中国人敬业得太多

阳 20:32
轻敌不至于,我觉得倒是可能有点紧张,发挥的确不是最好

阳 20:32
但是可能发挥怎样都无所谓的

Kunlun 20:34
我昨天感觉
作者: RichZhu    时间: 2016-3-23 02:26
Rich 20:45
昨天最搞笑的是古力说李世石领先后松懈。没有几个人像古力那样了解自己的老对手了,所以他的话自然有人信。这大概反应职业棋手整体的心理失衡,并不是客观的评语

阳 20:46
柯洁在白棋点了后,摆了10多分钟,结论还是黑棋胜定

Kunlun 20:46
嗯 我觉得李喆的文章比较客观 文字也很好 有条有理

Rich 20:55
哈,今天嘉宾里面有几位大家的朋友

豆豉鲮鱼 20:56
都看围棋TV呀[Chuckle]

赌棍YY 20:57
电脑加油,我压了1500:)

阳 20:57
这盘棋要是昨天下的话估计电脑已经被嘲笑死了

智游门徒 royalflush 20:57
我还是希望人赢啊 虽然不像之前那么乐观

阳 21:12
不过有没有一种可能性。google今天反而故意放水

阳 21:12
减少几组CPU[Chuckle]

Mike 21:13
不是说那种普通意义上的轻敌而不认真,而是骨子里没把对手当正常对手看。

俊雄 22:14
李是不是有让子啊?

qian tao 22:17
我怎么感觉上面那一片全是黑子的

蕃薯 22:17
现在是AG让GPU

正午 23:09
又要输?

zhigang 23:10
一边看棋,一边打牌,一把AA赢了七千多的一锅[Joyful]。人类输就输吧[Grin]

George 23:18
全民关注啊

Kunlun 23:48

作者: RichZhu    时间: 2016-3-23 02:37
Rich 00:32
我估计那些职业棋手最郁闷的是,不知道什么地方阿狗开始领先的。这盘棋前面一直在说阿狗这地方亏了,那地方亏了,没有赚的地方,然后就判断阿狗领先了

qian tao 00:33
李世石怒砸阿尔法狗,结果发现阿尔法狗机箱里藏着柯洁。。。

Rich 00:52
我最佩服的是新浪解说,严重怀疑李世石跟谷歌有秘密协议,不得打劫,而且严正指出阿狗中腹提劫绝对先手却一直错过,完全不会打劫

Rich 00:54
新浪小编肯定以为谷歌跟百度做事一个风格

Kunlun 00:55
新浪很多脑残编辑。其它新闻也是

萤火虫虫 00:56
内行也看外行热闹[Chuckle]

Rich 00:59
新浪编辑后半盘的评论核心已经不是棋了,而是阿狗不会打劫,还说孔杰等职业棋手也在聊这个话题

Kunlun 01:00
嗯 看到了。还说阿狗不会打劫已经可以确定。人类不能打劫相当于自缚一臂

Rich 01:02
其实很好解释,阿狗领先后寻找简单着法而不是最佳着法,它只关心安全运作,没事打什么劫?

阳 01:03
估计它的评估系统里面有复杂度的分数

阳 01:04
不打劫 下面10步内的所有path看 平均胜率是越来越高 趋近于100%

阳 01:05
而打劫可能这一步胜率99%但十步后平均还是99%

阳 01:05
复杂度太高

Rich 01:06
昨天说李世石优势后放松输棋的今天会说什么?左下之后所有职业选手都说小李大优,柯洁说他下肯定赢。后来怎么输的,好像没谁说怎么就逆转了。

Rich 01:07
打劫肯定增加搜索的宽度和深度

萤火虫虫 01:07
编辑犯的是常识性错误还是专业性错误?是一般专业性还是非常专业性错误。如果前者,属于忽悠,如果后者,属于不懂装懂。[Chuckle]

萤火虫虫 01:07
我想编辑不可能太专业

Rich 01:09
编辑犯的是最简单的常识错误,就是谷歌不可能通过改变游戏规则来取胜,这是很无耻的行为,也就只有百度这样的公司才会触及这个起码底线,对吧?

萤火虫虫 01:09


Rich 01:11
关键是那些职业棋手也跟着起哄,比输给机器本身还丢人

Rich 01:17
其实第一盘李世石角部开过劫,阿狗自己没打劫。不跟你打劫让着你还赢你,这还不牛?

萤火虫虫 01:19
只能说,阿狗啊,他们真不懂你

Rich 01:21
这盘棋对李世石的心理打击肯定很大,弄不好他的职业生涯会缩短很多

萤火虫虫 01:26
我是不懂,但感觉这里面跟德扑的一些strategy 也挺像的

萤火虫虫 01:31
我喜欢看军事的东西,觉得跟德扑有时能扯上。象围棋这种中国的东西,黑白二子,一阴一阳,变化无穷,是不跟中国道家如鬼谷子之类扯上关系
作者: RichZhu    时间: 2016-3-23 02:46
Rich 01:35
棋牌多少是相通的

Rich 01:37
不过这次职业棋手也都承认阿狗的大局观和对棋的理解都不逊于人类顶尖棋手

Rich 01:38
估计柯洁也不用整天暴走,疾呼李世石运气好,白捡100万美元了

周力 01:40
哈哈

周力 02:08
一开始我以为樊麾把机器骗了,原来机器把打家都骗不

Rich 07:52
[柯洁古力谈第二局观感 是否有不打劫协议扑朔迷离: http://mp.weixin.qq.com/s?__biz= ... 5LCY7c9rGjdjoGI2#rd]

Rich 07:52
[李世石:没有机会领先 不清楚为什么要问有无协议: http://mp.weixin.qq.com/s?__biz= ... CiCDUoCCho9juZqN#rd]

Rich 07:57
这么多顶级棋手怀疑并敢公开说出来,真的是太丢人了,更可怕的是这个居然有市场。

周力 08:50
[Voice]

Rich 08:57
肯定没有啊。谷歌不可能做这种事,属于欺诈行为。这种质疑也就大陆棋手想得出来,生活在一个没有诚信和起码契约精神的社会才会有这种变态的思维,而且是一种很自然的流露。

豆豉鲮鱼 08:57
同意

豆豉鲮鱼 08:58
自然流露太悲哀

Rich 09:03
在欧美你这样质疑,人家会觉得你在开玩笑,在日韩会觉得好笑,在国内这就是智慧了。像柯洁老聂这些言论,人类跟机器这次对决,中国棋界的表现绝对差评。

汤振 14:43
阴谋论在哪都很有市场,不独在中国。

Rich 15:12
也看是关于什么吧?这种怀疑谷歌暗箱操作修改规则来赢得一场比赛,不但把谷歌想得太低,也是对参赛选手的侮辱。这不就是合伙作弊,各取所需吗?


作者: RichZhu    时间: 2016-3-23 02:51
我发现节选也是一个体力活,尤其是论坛程序不认得一些图标,会把筛选出的一大段发成一小段,就到这吧。
作者: RichZhu    时间: 2016-3-23 03:04
gaosi 发表于 2016-3-11 20:39
我个人觉得现在机器人唯一能领先人类的就是大型MTT比赛ICM的精准计算 但是MTT的波动就把它盖住了
在cash里 ...

大型mtt比赛icm精准计算并不需要AI,只是一个计算量很大的简单计算。(怎么听起来有点别扭?)

另外,大型mtt比赛icm精准计算也没有多少实用价值,因为icm本身就是一个粗糙的模型,过度量化是没有意义的。

作者: gaosi    时间: 2016-3-24 22:03
RichZhu 发表于 2016-3-23 03:04
大型mtt比赛icm精准计算并不需要AI,只是一个计算量很大的简单计算。(怎么听起来有点别扭?)[/backcolo ...

感谢大神回复
我想表达的就是机器最早最原始的功能
快速精准但是“笨”

其实很有意思的就是人类从未因为机器算数被人快 机器重复劳动错误率比人小而惊恐过
事实上这就是人类发明机器的本意

个人感觉机器在ICM精细化问题上价值不大的主要原因还是德州的牌型还是太少了一些
比如我们机器会算出来根据ICM 某一手牌allin在ICM支持需要的牌力是52.90%(举例)
人类会说 Q7o就fold  Q8o就call
也许量化出来 Q7o是49% Q8o是54% 不存在49%-54%之间的牌型 所以人类做决策并不难 机器没有优势
当然 从这个计算带来的$ev偏差 在MTT的超大波动面前九牛一毛

唉 说到最后我都不知道要说什么了


作者: RichZhu    时间: 2016-3-25 02:24
gaosi 发表于 2016-3-24 22:03
感谢大神回复
我想表达的就是机器最早最原始的功能
快速精准但是“笨”

精准计算是不能弥补模型本身缺陷的。

举个例子,wsop主赛接近钱圈,前注和盲注为1k/4k/8k,还剩700人,695的钱圈,你有6k,这时候你拿到AK,怎么办?

人类牌手的第一反应就是:你在什么位置?下一句话就是:通常还需要几手进钱圈?然后可能还会问:你后面的牌手松还是紧?

凭经验,差不多需要4,5手牌的样子进钱圈,这样如果你是在btn的位置就应该扔掉了,不难看出,这里allin,chip ev是正的,但money ev是负的。如果你在utg的位置就该allin了,因为你在下面两手中的一手不得不allin,而你的牌很可能不及AK,何况你赢了的筹码也是越靠后面allin越少,这里AK allin应该是cEV和mEV都是正的。

使用icm怎样帮助你做决策?你首先要计算你这6k筹码的mEV吧?可是我们都知道同样的6k筹码,此时在枪口和在按钮的价值是有明显区别的,但在icm中却是同样的价值,这肯定是误差了,后面计算的再精准也就没有多大意义了。


作者: gaosi    时间: 2016-3-26 22:32
RichZhu 发表于 2016-3-25 02:24
精准计算是不能弥补模型本身缺陷的。

举个例子,wsop主赛接近钱圈,前注和盲注为1k/4k/8k,还剩700人,6 ...

感谢回复

忘记了哪个教材里看的了
该文章的作者承认在1BB以下的时候ICM有极大计算误差
此外在筹码量1BB以上但是比较小的时候 敏感位置(尤其是UTG) ICM的计算也会发生和真正+$ev相悖的结论

不过这么说才是阿法狗的意义

虽然我对计算机了解的不多 真的很少很少

但是计算机的一切都源自于背后的人类给他做的数学建模

计算机的优势是快速计算以及重复工作无误差(后边这个用在工业上)

劣势是人类的主观能力为0

所以人类的工作就是帮计算机做好最完美的建模 提前处理掉计算机在work过程中一切会遇到的 需要人主观能力解决的障碍

或者回避他 或者想办法用数学的办法转化他(比较典型的就是识图功能)

人类从未因计算机下中国象棋比人强而恐慌 但是车=9分 马=4.5分这种东西 人类不提前设计好 机器懂个P

围棋难度在于计算量过大 超越目前计算机计算能力 导致“只能用人类主观方式”下棋

而deepmind 就是把这种主观 转化成了客观的计算

最大的贡献 还是前期算法设计上




作者: gaosi    时间: 2016-3-26 22:41
RichZhu 发表于 2016-3-25 02:24
精准计算是不能弥补模型本身缺陷的。

举个例子,wsop主赛接近钱圈,前注和盲注为1k/4k/8k,还剩700人,6 ...

ICM目前的模型只能计算静态的部分
包括手牌开始ICM价值以及你这手牌打完的(比如你和某人allin了之后)ICM价值

其实只要有条件 愿意做研究 包括枪口位置的动态ICM还是可以做出来的

也就是说 这手牌我allin ICM会如何 如果我fold了 下一手牌我是大盲 先要被迫除掉我多少筹码 下一手牌的牌力是50%……

这样一直推算下去 只要建模工作做得好 公式都给计算机罗列出来 算这些计算机就是一秒钟的事

只是可能还是我一开始说的 真的会让你fold和push两难的牌其实并不多

再说真的在这种时候抓到这样两难的牌 fold和allin的ev也差不了多少——和MTT的超高波动比


作者: royalflush    时间: 2016-3-26 23:43
ICM与 AlphaGo、机器学习完全是两回事,根本没有关系到
ICM本身只是一个数学模式,这个模式是没有位置和盲注的因素的,所以有一定的局限和限制。

《扑士》第55期 (1月18日2016年)http://pushi8.com/jan2016 里边有简单的ICM介绍文章
作者: flyinglion    时间: 2016-3-31 18:10
古力:“也许吹牛,如果职业电竞选手和我互换各练十年,围棋我只能呵呵,电玩我一定会给他们压力!”

翻译:“玩围棋的最牛B,所以我牛B,玩其他的都是傻B。”

点评:该牛吹得和和要当共产主义接班人是一个级别的。

影响:艾娃除不能在中国当职业球员外,还不能当职业棋手了(目前仅限围棋)~
作者: Howard    时间: 2016-3-31 21:52
RichZhu 发表于 2016-3-24 12:24
精准计算是不能弥补模型本身缺陷的。

举个例子,wsop主赛接近钱圈,前注和盲注为1k/4k/8k,还剩700人,6 ...

这个例子很精准,icm不考虑位置这一点,确实对筹码特别浅的时候的指导意义变得很小。感觉只对下一手牌不面临被迫全进的情况,icm比较准确。

有个疑问 “如果你在utg的位置就该allin了,因为你在下面两手中的一手不得不allin” 这里主角筹码还不到1BB,难道不是下面一手在大盲就要被迫全进了吗,怎么还两手中的一手?是不是有什么地方我漏看了

作者: RichZhu    时间: 2016-4-1 00:42
gaosi 发表于 2016-3-26 22:32
感谢回复

忘记了哪个教材里看的了

ICM确实会在有些情况下给出明显的错误结论,比如前面那个wsop钱圈的问题,你可能还会计算出按钮的open shove的range比UTG要宽,我们不需要计算都知道这种情况下是错误的。

虽然大家都承认ICM在一些极端情况下是错的,但很少人联想到ICM在几乎所有情况下都是有误差的,只是过于明显的时候我们看到了,承认了,然后就过去了。

只是,我们既然知道这个模型是很粗糙的,就没有必要把精力用在细化这个模型的结果上面,这是我一直尽力解释的。

中文德扑界最近两三年玄学盛行,明明很简单的地方非要弄得很复杂,这对很多新人来说,不但事倍功半,也影响到他们打牌的乐趣和信心,这一点对整个行业来说,当然不是好事。

作者: RichZhu    时间: 2016-4-1 01:02
Howard 发表于 2016-3-31 21:52
这个例子很精准,icm不考虑位置这一点,确实对筹码特别浅的时候的指导意义变得很小。感觉只对下一手牌不 ...

我靠,这都被你抓住了?

其实我最初写的是12k,这样会涉及到考虑UTG/BB/SB三手牌,所以我才假设“差不多需要4,5手牌的样子进钱圈”。然后我就发现这样会产生很多其它问题,比如你在按钮时大小盲的筹码量,比如进钱圈手数的概率分布等等,就临时做了简化,但脑子有点溜号,不但留下了多余的条件,还留下了多余的字,“两手中”是要去掉的,“赢了的筹码也是越靠后面allin越少”也不是一个值得一提的考虑了,这里UTG/BB的差别比BB/SB的差别小太多了。



作者: zhaoyue0o0o    时间: 2016-4-1 02:18
本帖最后由 zhaoyue0o0o 于 2016-4-1 02:20 编辑
RichZhu 发表于 2016-4-1 01:02
我靠,这都被你抓住了?

其实我最初写的是12k,这样会涉及到考虑UTG/BB/SB三手牌,所以我才假设“差不多 ...

,恩作为一个 研究 ICM 三年以上 短筹码 有 300W 手牌 经验的牌手来说, 大部分 情况 下, ICM 这里的建议可能是 KK+ /AA+


ICM 有问题 的地方 在于 未来模拟。  但是 大部分 人 的研究水平还研究不到 未来趋势 这个地方。也就是对于世界上百分之95以上的人。

如果你能懂 ICM 的 全压 弃牌 来说。你基本可以打败 世界上 99的 玩家。
其实  世界 顶尖的那一批 REG 早就有一批 根据 ICM 极其精确的扑克 机器人。 扑克 在很多领域 机器人碾碎人类基本上是一个公开的秘密了。 只不过 真正 懂的人,并不愿意将自己赚钱的本事说出去。


作者: zhaoyue0o0o    时间: 2016-4-1 02:24
RichZhu 发表于 2016-4-1 00:42
ICM确实会在有些情况下给出明显的错误结论,比如前面那个wsop钱圈的问题,你可能还会计算出按钮的open sh ...

老师 说 位置枪口 和 BTN 两个 情况 是 考虑 未来趋势。
但是 ICM 只考虑 现在。 不考虑 未来。
关于 未来趋势的 有很多讨论。
但是老实说 我们 没有办法知道未来的情况。 对于未来模拟 是 ICM 没有办法讨论的。
但是 并不是 ICM  本身模型的错误。
而即使ICM 模型是错误的。 这里的 EV 相差也非常非常小。 至少 我认为 你遵照 ICM 指导 得出的经验 做出的决定,也绝对可以 轻松打败世界上百分之99的人。  

作者: zhaoyue0o0o    时间: 2016-4-1 02:34
RichZhu 发表于 2016-4-1 01:02
我靠,这都被你抓住了?

其实我最初写的是12k,这样会涉及到考虑UTG/BB/SB三手牌,所以我才假设“差不多 ...

其实 这个例子 稍微复杂一点, 稍微简化 一点 在 PS 100块。 或者 75块 以上的 卫星赛 或者 超快速 锦标赛 这里 会出现 大量类似的情况。
我看过 大量的 赢钱的 玩家。 在 这里的打法 会有一些不一样, 因为 他们 对未来 趋势的 看法 不一样。导致不一样。
(比如 3BB的时候 ) 我们 是否要使用一个 比 纳什均衡 宽的 RANGE, 因为 后面 我们将到大盲 会被溺死。
蛮多顶尖REG 会在这里使用一个比纳什均衡的 宽的RANGE。
但是 问题 在于(你使用了一个错误的范围) 也就是当前手牌对于 完美来说你是犯错误。
  另一批顶尖 的REG 站在 这里使用 标准 纳什均衡 范围。
因为 后面 我们 即使在大盲 位置,依然可以用完美的范围 去玩这手牌。

(可明显的是) 理解 到这一层 的 REG, 这些细节上的差别 不妨碍他们都是顶尖 的大赢家。

  JORJ95 蛮多地方 的PUSH 范围并不是 GTO的。
但这不代表 ICM 错误。
   ICM 本身依然是对的。
问题是 大多数 弱玩家 会使用 一个 更紧/更松的范围。
导致 根据游戏动态 调整的最优剥削范围 是更+EV的。
但是 即使你 GTO, 根据 ICM 做出决定 这绝对不影响你长远来看 是一个赢钱的玩家。


作者: RichZhu    时间: 2016-4-1 04:39
zhaoyue0o0o 发表于 2016-4-1 02:24
老师 说 位置枪口 和 BTN 两个 情况 是 考虑 未来趋势。
但是 ICM 只考虑 现在。 不考虑 未来。
关于  ...

你的帖子跳跃性太大,我试着就你这段话问几个问题吧:

1)如果枪口和btn两个情况是考虑未来趋势,那么UTG+1和BTN-1(也就是co)是不是考虑未来趋势?为什么是或者不是?

2)你这里说ICM只考虑现在,不考虑未来,而前面一个回帖说ICM有问题的地方在于未来模拟。ICM到底是考虑未来但有问题,还是根本不考虑未来?

3)“至少 我认为 你遵照 ICM 指导 得出的经验 做出的决定,也绝对可以 轻松打败世界上百分之99的人。”这句话适用的条件是什么?

作者: RichZhu    时间: 2016-4-1 04:56
补充一个点:你反复提到“未来趋势”,我不确定这个究竟指的是什么,只是大概猜测这个说法的含义。你如果你做些解释,或者给个相应的英文,会避免可能的误解,更方便讨论。
作者: zhaoyue0o0o    时间: 2016-4-1 09:45
本帖最后由 zhaoyue0o0o 于 2016-4-1 10:05 编辑
RichZhu 发表于 2016-4-1 04:39
你的帖子跳跃性太大,我试着就你这段话问几个问题吧:

1)如果枪口和btn两个情况是考虑未来趋势,那么UT ...

RICH zhu  老师。
试着回答你几个 问题。
1. 未来趋势, 我英文不太好。 大意是 缩写是 FGS (我不知道英文的大致 单词, 未来游戏  形式?)
2. ICM 是不考虑 未来的。
比如 你在枪口位置 4个·BB拿到 一手边缘牌。 比如 ICM 说 可以推的范围 是 A8S+ 而你恰巧 拿到 A7S。
ICM 说 如果 是 负 EV 的 他会 告诉你 这里应该 弃牌。 但是 他没考虑 到 如果你 盖牌后。 后面 大部分时候 情况 下 会出现一个 更 负 EV 的情景。
因为 下一手牌会 轮到 你的大盲。 你大部分情况 下会 溺死。(被盲注 淹死,并且全压 没有弃牌率) 这是一个 感知 负 EV的情况。 理论上 来说 任何 位置 都可以考虑 未来 趋势。 举例而言。 假设一个 SNG 9人桌。 7个 人 离座退出。
这时候 小盲 PUSH你, 你在大盲 根据 ICM 得出的 RANGE 最边缘的牌 去跟注。 这是对的。 ( 但是在这里 很明显 你弃牌,因为你在未来更容易 去偷到盲注)。  所以 ICM 只是 理论上的 GTO, 但是因为 对手不是完美的。(比如这里 人家不在) 所以我们可以用 更剥削的打法会更+EV。
3.  这句话  有两个 条件 可以判断。 1. 一个 大家眼里很强的 职业 玩家,如果没有学过ICM。 他 大筹码 打的再好,也赢不了, PS 普通的 6人门票赛。
那里的 常规职业玩家,大部分时候 ICM 几乎没有泄露的地方。
2.超快速 SNG 的 常规 REG 普遍 在 后期 短码领域强于 普通 REG。
3.至少 我认为 你遵照 ICM 指导 得出的经验 做出的决定,也绝对可以 轻松打败世界上百分之99的人。”这句话适用的条件是什么? 这句话 我仔细想想适用于  在 任何 时候 的MTT 比赛后期。 盲注 在 12BB 以下。
你遵照 ICM 得出的 结论, 轻松打败 世界上百分之99的玩家。
因为 大部分 人 在全压 弃牌阶段 距离 最优 差很远很远。
比如  大部分人  不知道  离钱圈 很远
我们还有 10个BB 无 ANTE
这里 枪口 的全压 范围,
枪口+1的全压范围。
如果有 ANTE , 并且是大盲的 十分之一。
我们 范围 的改变。
这些 对于 ICM 计算器来说 这是数学的 问题。



作者: Howard    时间: 2016-4-1 21:49
RichZhu 发表于 2016-3-31 11:02
我靠,这都被你抓住了?

其实我最初写的是12k,这样会涉及到考虑UTG/BB/SB三手牌,所以我才假设“差不多 ...

哈哈,读着就不太通顺,估计是哪儿弄汊劈了。我已经经常干这样的事儿,写完了改个地方,结果只顾其一,不及其余

作者: Howard    时间: 2016-4-1 21:55
zhaoyue0o0o 发表于 2016-3-31 19:45
RICH zhu  老师。
试着回答你几个 问题。
1. 未来趋势, 我英文不太好。 大意是 缩写是 FGS (我不知道 ...

这个想法我看挺不错,“把未来趋势考虑在内的ICM”,要实现出来应该不是太难的事儿,一旦完成的话前途无量

作者: RichZhu    时间: 2016-4-2 01:35
zhaoyue0o0o 发表于 2016-4-1 09:45
RICH zhu  老师。
试着回答你几个 问题。
1. 未来趋势, 我英文不太好。 大意是 缩写是 FGS (我不知道 ...

先说几句题外话吧,因为这个回复比较长,而论坛上的沟通有时会产生一些误解。

虽然我们只限于论坛上有限的几次讨论,论坛之外我还是听人提过一些你的情况,所以当你说你“ 研究 ICM 三年以上 短筹码 有 300W 手牌 经验”,我是相信的。我知道它的分量,也能理解其中的酸甜苦辣。说实话,华人牌手中像你这样能踏下心长时间专研,而且确实在一些特定类型的游戏中相对稳定地取得成绩的并不多。

另一方面,我很少打比赛,至于你擅长的单桌比赛,我停顿下来想了一下,好像从有网络扑克开始到现在,我都没打过。如果打过,应该是智游城免费赛,但我确实不记得发生过。所以,我对短码相关的一些理论和应用,比如你提到的FGS,虽然知道,但并没有真正花过时间。

这样的讨论有一个好处,我们冲突的地方,如果你对了,我学到新的东西;如果我对了,也可能帮到你了解从圈外往里面看所看到的局限性,对你扩展自己的游戏范围也许会有帮助。当然,还有一个我之前在其它话题中也提到过的,就是在智游城的技术讨论中,我是非常认真的,这是我办这个论坛的底线,所以任何讨论,不管如何针锋相对,都局限于技术层面。

下面是我对你这个帖子学术上的回答:

1)FGS是英文Future Game Simulations的缩写。至于具体翻译成中文还真有些头痛,直译差不多是“未来游戏模拟”,可是觉得跟模型本身的意思还是有差别的。“筹码量预估”,“筹码前瞻调整”?还真想不出来一个满意的翻译。不过我看到你写的“未来趋势”时,是猜到了这里。

大多数看这个主题的朋友可能没听说过这个模型,不用沮丧,因为大多数人确实不需要这个。

这个模型本身应该有些年头了,但在软件上的实现大概也就是两年前的事。它的出现是为了弥补ICM模型内在的缺陷,也就是我前面提到的wsop例子里关于ICM不考虑盲注和位置所带了的问题。这个问题对我们多数牌手在多数情况下都不是问题,可能有人会觉得讨论这一点是吹毛求疵,甚至是闲得慌了穷显摆。但对于单桌6max的玩家来说,却是一个反复遇到的情况,尤其到后面3,4个人筹码都在10BB以内,icm经常会给出明显错误的结果。

于是一些软件比如ICMIZER就加入一个FGS模型。这个模型前面部分的计算跟ICM是一样的,只是在最后一步计算EV结果的时候,把每个玩家的位置前移一位,比如你原本是UTG,现在你的位置就变成BB,依此类推。在这个新的位置,考虑到盲注的情况下进行纳什平衡范围计算,根据计算出来的范围,我们假设全桌都是按纳什平衡策略来玩,这样得出来的EV就是你的FGS EV。显然“Future”这个词汇的使用是因为你在移动按钮后计算移动前的筹码EV,也就是你UTG的FGS EV要在BB的位置上计算。

这个模型在某种程度上解决了ICM在盲注和位置上的问题,但还是有些问题没有解决。

比如说,还剩三个人,两人钱圈。按钮剩两个BB过牌,SB是大筹码 allin,你作为中间筹码是可以根据自己和SB的筹码量按ICM算出相应跟注范围的。你发现自己手里的牌刚刚勉强够跟注的,正要allin,你发现还剩10秒就升盲了。你静静地坐了10秒钟,弃牌,下一手按钮那个小筹码因为升盲等效自动allin,你就赚EV了。这类问题 FGS同样有,并没有解决。

更大的问题是在FGS计算中,假设桌上所有玩家都是按纳什均衡来打,这个在实战中是不可能的,所以模型误差不可避免,有时候还很大。

模型之外还有一个可怕的问题,就是附加计算量太大。如果真的是计算我前面提到的wsop主赛的例子,按全场实际人数和筹码分布计算,这个UTG的push range,大概在4个月后November 9打完了,你的计算还没完呢,假设你使用的是你能买到的最快的计算机。

所以,这个FGS基本上是限于6人以下,筹码都在10BB以下,尤其是短码在5BB以下的情况计算,这也是为什么,只有单桌比赛牌手,尤其是经常遇到短手浅码情况,而且是长期大流量玩家才会考虑。即便这样,也需要根据自己的经验进行人工调整。

(有些长了,回帖有字数限制,我也有事,回头再写后面的)


作者: zhaoyue0o0o    时间: 2016-4-2 13:21
RichZhu 发表于 2016-4-2 01:35
先说几句题外话吧,因为这个回复比较长,而论坛上的沟通有时会产生一些误解。

虽然我们只限于论坛上有限 ...

  大部分的时候,我的语言表达能力会强于 文字 太多。
因为想说的东西很多,
简单 整理 一下 我的观点哦。 老师说的 挺多内容 其实 牵扯到 的是 一个顶尖的人类, 因为对游戏动态的理解。  所以 他可以做出比 ICM 指导下 更优秀的打法。 我叫他为 (未来游戏趋势)。1. 我提出 两个 论点

我想证明的是两个 观点。

但是 我想提出的 观点是1:
  你按照ICM 指导上的 建议。打败 99的 人 是没有任何问题的。 已经足够打败 99的 人了。  
RICH 老师应该 属于 TOP 百分之1那种。(因为 大部分 人 根本不知道 未来游戏趋势)。
并且大部分人 跟本不知道 这里的 全压 范围 是什么。 他们的理解程度 应该达不到。( CHIP EV是+的。 MONEY EV 是负的) (艹 AK不推 玩JB,是普通扑克选手的想法。 )也是百分之90的人的想法。
  那么 如果你能理解 ICM 的指导建议。就已经足够打败 目前 2016年 这群 玩牌的 玩家了。
即使 你对 动态 的了解 足够多。  你获得的优势 也 比起 按照 ICM 指导下建议的完美玩家 多不了多少。

毕竟   打牌的能达到 RICH 老师 水平 的 100个里面应该没有一个吧。
     毕竟 我们打牌是有一个 学习 过程的。
我认为 先学习 ICM 并且知道 各个情况下 接近最优的范围。  这是第一步。
第二步,学习 未来趋势,并且灵活应用。
我自己并不是很有天赋 的人, 但自问 做到了 这两点,这已经足够 让我靠打扑克 能赚 200USD/1H 以上了。

   结论。
1. ICM 并不是错的, 对于 大部分玩家来说 ,学习 ICM 依然 是 入门。这个是 最基础 最基础的 地方。  他只是有他的局限性。对于 大多数人来说 他的局限性 很小很小。
假设 短筹码 领域的 满分 是 100分。
你学习 ICM 只能到 80分, 剩下的 20分 需要看天赋,和你后面的准备, 但是 如果你没 到这个80分, 讨论  他是错的是没有意义的。
并且当今的机器人 可以很轻易的 将这80分 做到满分, 这已经能打败 ONLINE 几乎所有的非职业 玩家的玩家群了。

2. 在你达到 80分 之后 你在学习 后面的东西。 这是一条路。   我将我最好的青春 给了 扑克 走过了 这条路,   希望给后来者一些思考吧。






作者: 吹牛无罪    时间: 2016-4-2 13:26
这已经足够 让我靠打扑克 能赚 200USD/1H 以上了。

不可能。

作者: 闷闷    时间: 2016-4-2 14:48
吹牛无罪 发表于 2016-4-2 13:26
不可能。

好像不止
作者: RichZhu    时间: 2016-4-2 17:52
zhaoyue0o0o 发表于 2016-4-2 13:21
大部分的时候,我的语言表达能力会强于 文字 太多。
因为想说的东西很多,
简单 整理 一下 我的观点哦 ...

本来我也准备回复你提到的
“至少 我认为 你遵照 ICM 指导 得出的经验 做出的决定,也绝对可以 轻松打败世界上百分之99的人。 ”
正好,就这个帖子一并回复了。

直接点说,我觉得你过高估计ICM的作用了。

先说让一些论坛成员感到意外的200USD/1H吧。 不算返水/奖励/教学等等,单是打牌,这个数字也是可能达到的。但你是在PS 普通的 6人门票赛这类游戏形式上得到的吗?大概不是吧?所以这个200USD/1H最重要的因素不是你ICM如何好,而是你游戏选择的好。比赛型选手对game selection远不如现金型选手敏感,因为他们不可以随便换桌,也不可以随时进入或退出一个牌局。即便这样,游戏选择对比赛型选手仍然是非常重要的一个考量,他们至少要考虑买入的大小,比赛的结构,奖金的分布,参赛者整体水平等等。

有些时候,这种游戏选择在不被牌手感知的情况下悄悄地放大了。比如说一个技术含量很低、抽水很高、波动很大的游戏,大多数职业半职业牌手看一下就走了,因为他们凭经验判断这个局是不可战胜的或者不值得承受这么大风险的。应该说,他们的判断原则上是对的,但如果大家都这么想,就会导致这个游戏玩家水平出现非典型分布:少量职业牌手和大多数不知道自己在干什么的纯业余玩家,处于中间和中上水平的玩家很少,而且因为这类玩家达不到站稳这个牌局的临界点会不断被淘汰。这样,这个看起来无法战胜的游戏因为牌手的Gap太大变成可战胜的了。表面上看你赢钱是因为你会icm而其他玩家不会,实际上更多的是因为你找到这样一个game,icm起的作用不大甚至根本不需要icm。

回到99%这个问题上,虽然你说“也绝对可以 轻松打败世界上百分之99的人”,实际上你指的是那些特定条件的比赛。我不是在咬文嚼字,而是这一点很容易让其他人尤其是新手误解。一个新手看到学好icm就可以成为前1%的牌手,结果发现他学了之后发现家庭局都用不上,还不如赔率这样的概念有用,因为这是现金局。

话说,这世界上前1%的牌手,大多对icm都不会花很多力气,因为好的牌手普遍集中在现金局,这一点应该是没有异议的吧?

这里没有贬低你努力的意思,只是icm的应用过了无脑使用icmizer这类软件之后的进一步提高,实在是非常繁琐辛苦的事,虽然有一些长期培养下的经验直觉判断,仍然有很多是带有很强的牌局/牌手特征的针对性调整。一个牌局上应用的得心应手并不等于另一个牌局会同样成功,超过软件应用范围的东西普适性不高。我相信有些时候你会发现无论icm还是fgs的结果你都不信任而选择自己根据经验和逻辑得出的判断,这大概属于你提到的“灵活应用”吧?这一部分实际上更接近于扑克基础理论和基本常识的训练而不是icm模型的高级应用。

所以我的结论也很简单明了,也是我一直的观点:icm这类模型,是应该知道的,这是比赛型牌手甚至所有认真牌手需要知道的基础知识,但除非专攻比赛的职业选手,一般不适合花过多的时间在这个地方。多数情况下,把时间和精力用在一些更基础的地方反而是更值得的。


作者: lililili11    时间: 2016-4-2 18:25
本帖最后由 lililili11 于 2016-4-2 18:38 编辑

我觉得82能打到200usd/h,更多是因为高智商,高情商和高挫商吧,而不是icm.
手滑,不小心点到Rich回帖的反对选项了。其实我是想点支持的。我的认知基本和Rich的回帖一致。

作者: lililili11    时间: 2016-4-2 19:29
82的口头禅:如何如何就能战胜多少多少对手了。

其实,换一个角度看,真正战胜对手的不一定是“如何如何”,而是一些本能的,没有刻意去做的行为。

因为这些行为是那么理所当然,所以也就不被个体觉知。

个体能觉知的,就只有自己刻意去做的一些举动,所以就会认为,只要如何如何就能战胜多少多少对手。

所以,其实是“战胜对手”这种事情对有些人来说太简单。
作者: zhaoyue0o0o    时间: 2016-4-2 22:58
本帖最后由 zhaoyue0o0o 于 2016-4-2 23:02 编辑
RichZhu 发表于 2016-4-2 17:52
本来我也准备回复你提到的
“至少 我认为 你遵照 ICM 指导 得出的经验 做出的决定,也绝对可以 轻松打败 ...

因为 观点 完全一致,所以 我站在你这一边。蛮佩服 RICH 老师的文字功底的, 原谅我,一个蛮会说的人其实蛮多时候会觉得写字是一件很痛苦的事情。  。 之所以争论, 是我坚持 认为 ICM 很重要。 谢谢老师 对我努力的肯定, 就像我曾经的学生lili说过, 我能有今天这一点小小的成就, 不是 我只擅长 ICM 这个领域,而是 在所有的短筹码领域, 我想中国 除了 ZZWWZZWWZZ 应该没有人花的时间比我多了。
但是 对于扑克来说, 很明显的 选择比努力更重要。
我一直认为 我的 SNG 水平 大于 MTT 水平 大于现金 水平。
但是 很悲哀的事情是, 我打 SNG/MTT 连 100USD一小时都做不到。
就像挺多人 找我做培训的,我也很乐意分享,但是老实说。我也觉得 花挺多的钱 学仅限于 ICM 的东西很不值得。
而当我玩一些现金局的时候, 我打的不是足够的好,但是利润 已经让我觉得很快乐。 而且并没有到上限。
那些说 200USD/H 很困难的人,
大概没听过一个故事,
从前有一个人住在馒头山上, 每天吃馒头吃馒头,
他交了一个女朋友,也带女朋友 吃馒头吃馒头,
他不知道 麦当劳,肯德基是什么样子。
永远居住在 馒头山上。
我甚至有一些朋友 在 ONLINE 能达到 1000usd/HOUR。 当你 知道, 你身边的人 可以月入 7位数的时候,
你会觉得 自己的成绩 真的没什么大不了的。
  选择 比努力 更重要,  曾经 我两三年前的时候, 见到比我强的人,就去打单挑, 毫无疑问 输光,从头再来,  而现在,大部分的时候,我挂单挑,只有鱼会和我玩,碰到一些打的还不错的REG, 我就微微一笑站起来, 散散步,看看书, 陪陪我喜欢的女孩,吃吃美食, 我依然可以赚到 足够生活的钱。  

大多数人 玩扑克的时候 根本不知道 自己想要的是什么。
甚至连选一个 合适的 GAME 都不知道。
很少有人 坚持,在一个领域 研究 很久。
我只是在 所有的 40个大盲以下的游戏研究了四年,这四年里,我最好的大学青春年华 都给了扑克,我想RICH 老师也应该 看过我早期的帖子,
我大一的时候,每天晚上通宵, 到早上七点, 从 5刀的 MTT 打起, 每次破产 重建资金,不知道 什么叫 社团活动,也很少上课。
    不知道有多少人 嘲笑我, 我去海南第一次 打 CPC 的时候, 老师以为 我被拉去传销, 一直坚持下来。
      今年是我打扑克的第五年,   我想啊,如果一个人,连续四年 平均每天花六小时以上, 做同一件事情, 他在这个领域 有一些小小的成就,应该是 一件理所应当的事情。   
      就像在 我在教学生的时候,也会去问他们,你的蓝图是什么?
你想要赚钱,还是 打到 ONLINE 最高额, 还是成为明星。
  太多人 觉得 扑克 好赚钱 来学扑克, 却从来没有 为一个结果而定制目标。
      ICM 没有那么重要, 那是 对于 大多数 初学者  想要赚钱的来说,
时间成本等价的情况下, 不如去学习现金。 毕竟中国的扑克环境 现金还是和捡钱差不多。
但是如果你的蓝图是 成为最好的 MTT 玩家, ICM 是你学习之路必不可少,并且一定要走过的一条路。








作者: 泥中土    时间: 2016-4-3 10:30
提示: 作者被禁止或删除 内容自动屏蔽
作者: 吹牛无罪    时间: 2016-4-3 12:14
本帖最后由 吹牛无罪 于 2016-4-3 14:01 编辑
zhaoyue0o0o 发表于 2016-4-2 22:58
因为 观点 完全一致,所以 我站在你这一边。蛮佩服 RICH 老师的文字功底的, 原谅我,一个蛮会说的人其实 ...

拿馒头和汉堡类比,相当厚道。完全没有网络上常见的戾气。赞。

我认为,不存在任何一个理论,不管谁,学了就能200usd/h.  
能保证20usd/h 的理论都没有。

能赢钱都是因为您自己牛叉。



作者: RichZhu    时间: 2016-4-4 05:31
zhaoyue0o0o 发表于 2016-4-2 22:58
因为 观点 完全一致,所以 我站在你这一边。蛮佩服 RICH 老师的文字功底的, 原谅我,一个蛮会说的人其实 ...

你在这里发的帖子我基本都看过,印象最深的是这篇 http://www.zhiyoucheng.co/thread-13593-1-1.html,回头再看也算是一个励志贴了。

技术上看,当时你对SNG及整个浅筹码的理解已经很不错,可以说已经度过学习曲线的陡峭上升期了。最近这两三年肯定是有提高的,但是在曲线的饱和部分前行,付出的努力不少,提升速度却肯定是越来越慢,进步更大的地方应该是简单技术之外的东西。比如你说,两三年前见到比你强的人就去打单挑, 而现在,大部分的时候只有鱼会和我玩,碰到一些打的还不错的REG, 就微微一笑站起来,做些别的事情。这就是心态和理性上的进步,你不需要证明什么,也知道时间和精力都是有价值的。我想这是你能做出更适合自己选择的主要原因,为你高兴。

不过看到你提及“有一些朋友 在 ONLINE 能达到 1000usd/HOUR”的时候,我想多说几句,这其实更多的是给新人和不那么新但想走职业路的朋友们说的。

相比我们在这个话题中谈到的“努力与选择”,还有一个比这些更重要的,就是环境。努力和选择都是我们自己可以控制的,但环境却是我们很难控制或选择的,而环境对扑克这个职业的影响,可以毫不夸张的说,比99%的职业都要大。

我们先看看去年网络扑克全球统计的前十位赢家:
  • Isildur1 (PS + FTP) – $2.2 million
  • Sauce1234 (PS + FTP) – $1.14 million
  • bbvisbadforme (FTP) – $965,000
  • Jeans89 (PS) – $853,000
  • luvtheWNBA (FTP) – $341,500
  • punting-peddler (FTP) – $286,800
  • Cobus83 (PS) – $278,900
  • jama-dharma (PS) – $256,700
  • Empire2000 (PS) – $203,200
  • mrw8419 (PS) – $199,000
这里排第一的Isildur1的成绩是要加点盐来看的,因为他输赢2百万都属正常,并不是稳定赢家,前年他全年亏损170万美元,之前的年份也是过山车。

所以,你的这些朋友,如果一个年度工作日的平均数是$1000/h,假设他每天打八小时,一年打300天,那全年下来也是240万美元,超出这个全球排名第一的了。即便你的$200/h的盈利,如果全年下来平均每天打5个小时,那也是一年36.5万美元,超出了排在第五位的Haxton了。当然,这个统计主要是PS和FTP高额,肯定会有遗漏,但打牌长期平均下来一小时赚两百美元的也真不多见。

当然,大陆有大陆的特殊情况,一小时200刀甚至1000刀是可能的,只是不能把这个当成常态。现场现金局个别情况下是可能的,如果你有大土豪的私局,土豪输钱不那么在乎而好牌手又很难进来跟你抢食,这样的盈率是可能维持比较长时间的。网络上通常的门槛是BR,但好牌手只要足够勤奋,时间长了,BR总会上来的,这样的好牌局很难长久维持。

很少很少一部分玩家,因为各种因素的综合考虑,选择扑克作为职业也许是对的,这少数玩家中可能包括你自己。但作为一个一般性原则,扑克是不适合做职业的,尤其是那些还没毕业的学生。

2013年以前,智游城是唯一的中文网站可以看到大家给想走职业的玩家泼凉水,其他家你能看到的都是在鼓励玩家走这条路。有些牌手兴致勃勃到智游城发帖说想要转职业,被大家泼了凉水之后就去别的网站了。论坛有朋友跟我说,可以说话含蓄一些,何况总是会有少数可以走出来的。我只是看到那些离开的有些遗憾,但却从未在职业扑克的看法和表达上有过改变。

所以,祝贺你的成功。同时提醒大家,你的情况不可复制,不完全是因为你的智力、毅力和人生态度,更重要的是客观环境的不可复制。


作者: gaosi    时间: 2016-4-6 14:29
RichZhu 发表于 2016-4-4 05:31
你在这里发的帖子我基本都看过,印象最深的是这篇 http://www.zhiyoucheng.co/thread-13593-1-1.html,回 ...

感谢两位大神的探讨 作为一个新鱼来说 你俩聊的更多我就会更开心 因为我会学的更多 说真的 在你们的高度面前我这个太渺小了
很抱歉的是我今天才有时间看完你们前后的讨论并作出回复

RichZhu提出的WSOP这个题目 我的想法zhaoyue大神已经表达的出来了(FGS模型)
WSOP模型下我的考虑和FGS模型一样
在这一手牌我fold掉的前提下 下一手牌等于我默认支付一个BB和一个ante给底池,这里又分出我在BB位allin(包括被强制allin)和fold掉时的cEV,然后分别量化

出ICM的差异,用概率算出ICM的期望,和本手牌(在UTG)AK的胜率对应的ICM期望对比,在一定程度下貌似还是可以量化的……
我想表达的是,ICM没有考虑到的问题,能否通过数学的量化把它设计到ICM体系当中,当然一方面比赛动态不可预知,就按照WSOP的模型,也许ICM算出来你的AK应该allin,但是隔壁的N(N>5)个桌子都发生了AA碰KK导致一手牌淘汰了5个人,当然这手AK是秒仍,虽然下一手会被强制allin。
总之即将发生的事,无法预知的就不强求,有迹可寻的可以适当量化。
因为经验对于新手是一个太无法抓到的东西,而扑克的波动性让新手的“经验”有时候变成了陷阱。所以当我逐渐摸索到ICM的量化的计算过程时,我就跟掉进海里的人抓到救生衣一样开心和踏实……




作者: gaosi    时间: 2016-4-6 14:34
zhaoyue0o0o 发表于 2016-4-2 13:21
大部分的时候,我的语言表达能力会强于 文字 太多。
因为想说的东西很多,
简单 整理 一下 我的观点哦 ...

也感谢您的回复
我个人的一些探讨放在了上一层

个人不太喜欢您使用“战胜99%”玩家之类的话语
因为这种表述对于客观探讨问题无益

我是一条新鱼加入论坛时间不长

看大家聊天知道您是短桌SNG大神 希望有机会您多跟您请教
我未来一段时间准备打一些短桌SNG 目前正在理论筹备中

我个人比较赞成FSG中的观点就是把本手牌的ICM和下一手结合来看从而得到最终的决策,这也是之前我所考虑的
但是同样的问题 在短桌中会不停的支付大盲小盲 如何合理的规划ICM的波动呢?

这方面专程请教您 感谢




作者: gaosi    时间: 2016-4-6 14:41
另外看到了一个RichZhu之前的关于ICM的讨论
http://www.zhiyoucheng.co/forum. ... 0&fromuid=30017
这里边提到了小筹码为了价值更保守的倾向

我想请教这么一个问题,就是在MTT比赛中,深筹码对中等筹码做挤压或者剥削而中等筹码不敢(不愿)反抗 这个MTT比赛中比较主流的情形 它背后的数学支持是ICM吗?还是别的什么?
或者说 在MTT中后期 筹码深度不支持翻牌后的阶段 目前职业选手们决策的依据是什么?经验的背后有可以量化的内容吗?希望能学习到 感谢
作者: RichZhu    时间: 2016-4-6 17:08
gaosi 发表于 2016-4-6 14:29
感谢两位大神的探讨 作为一个新鱼来说 你俩聊的更多我就会更开心 因为我会学的更多 说真的 在你们的高度面 ...

是不是我写得有些含蓄,你没看懂?

我的那个wsop问题,FGS是解决不了的。FGS在提出解决ICM问题的方法同时自己本身带来了问题,姑且不说这纳什均衡计算量让这种情况下的计算变得不现实,就是模型本身假设下一手牌其它人都按纳什均衡来打牌就跟实战差得太远了。

这里带来另外一个问题,就是如何评估纳什均衡的实战价值问题,这又是一个大话题。

但在wsop这个例子上,谁按纳什均衡打牌谁找死。你不妨看一下我关于GTO这篇文章,试着理解一下吧:
http://www.zhiyoucheng.co/thread-23321-1-4.html

wsop接近钱圈的时候,会出现大多数人偏离GTO,但按GTO打牌的不但可能沾不到便宜,反而会吃亏的“怪异”情形。

我不了解你个人的情况,但感觉你对icm及相关模型期望太高了,太钻牛角尖反而影响自己打牌技战术的正常提高。



作者: gaosi    时间: 2016-4-6 22:06
RichZhu 发表于 2016-4-6 17:08
是不是我写得有些含蓄,你没看懂?

我的那个wsop问题,FGS是解决不了的。FGS在提出解决ICM问题的方法同 ...

感谢回复 刚刚看了扑士里边ICM的文章 才知道背后这么多算法
包括您提到的GTO的具体内容 都是我之前没有考虑到的 毕竟新手
由于已经超过我的认知能力 我打算初步放弃WSOP这个情形下的探讨
我倒是没有对ICM估计过高

我现在想关注2个内容
1、ICM在人数较多时候(9人以上 至少坐2个桌子 就跟网上计算器支持15人或者理论上推广到更多)的适用性,当然依然不考虑盲注、位置、选手水平的前提下 他的实用性意义
原因是我最近总结一些文字 用ICM理论探讨我自己感兴趣的一些问题
2 您和zhaoyue大神聊天中提出的超短桌(3人)时通过ICM决策 原本的ICM策略会带来哪些误差(要考虑盲注,暂时不考虑位置和水平)
原因是我最近准备介入6人SNG游戏

我有些自大了……一瞬间扛起了太重的东西 或者说一瞬间面对了一个太大的问题 目前撞墙 慢慢的从最实际的需求出发一点点来吧

最后还是感谢大神各方面的指导……
最后留一个开放性的问题 同结构的SNG比赛(或者MTT进入了FT)
NLH和PLO在ICM层面会发生差异吗?
我很好奇NLH在SNG里或者MTT后期里深筹码用AX对中等筹码做挤压 PLO里同样的情形会是什么样的呢


作者: RichZhu    时间: 2016-4-7 01:18
gaosi 发表于 2016-4-6 22:06
感谢回复 刚刚看了扑士里边ICM的文章 才知道背后这么多算法
包括您提到的GTO的具体内容 都是我之前没有考 ...

不知道该怎么说服你,你有些着魔了。

我说你对icm及相关模型期望太高,你很确切地否认,我就不知道该怎么说了。

你的这些问题,如果能理解我这个主题和前面链接给出的内容,应该能自行回答,但显然你急于得到直接的、可以立刻用得上的答案。

几年前我上网络公开课的时候说过,如果我教小学生乘法,我会非常认真解释基本概念,甚至3x7和7x3的细微差别也会让每个学生明白,然后是背个九九表,剩下的就是手算、心算、做应用题。我不会把重点放在如何使用计算器,更不会弄出花里胡哨的一大堆表格让大家演练速算。跳过手算心算而直接使用计算器、整天比较哪个计算器更美观实用更高大上到了初中大概只能去文科班了。

我前面的帖子说,跟欧美牌手相比,国人牌手多了一些浪漫和疯狂,少了一些理性与思考,他们最大的愿望就是找到一条成为绝顶高手的捷径。这样,就没有什么比葵花宝典更有吸引力的了。

不幸的是,大多数人在找捷径的时候,其实是在绕圈跑。


作者: gaosi    时间: 2016-4-7 11:25
RichZhu 发表于 2016-4-7 01:18
不知道该怎么说服你,你有些着魔了。

我说你对icm及相关模型期望太高,你很确切地否认,我就不知道该怎 ...

没事的
新手的弯路是必然的结果
只是我个人看问题的角度经常和大众不同
但是只要终点是唯一和明确的
最后总会来到这个终点的
弯路带来的经历(经验)是每个人自己的财富
同样感慨于近期圈内的浮躁
这个地方的平和是很难得的

感谢
希望有机会可以从您那里学到更多的东西

以及下一次Alpha挑战星际2的时候 大家再开一个帖子 好好聊聊~~


作者: flyinglion    时间: 2016-4-7 21:35
gaosi 发表于 2016-4-7 11:25
没事的
新手的弯路是必然的结果
只是我个人看问题的角度经常和大众不同

嘿,我的个人经历可能对你有些帮助。

两年多前我做过实验,6人超快速SNG,1刀还是2刀忘记了,同时开6桌,我按照HM里那个SNG软件建议的ICM打,想测试一下能不能快速刷钱,结果是不到一个月的时间损失了200多刀——个人扑克历史上的最大"下风期"×N!

10包纸尿裤啊!早知道我就不做这鬼实验了……

当然,手数有限,时间有限,虽然想尽量按着ICM打(其实就是想不花脑筋的机器人打法)但还是出现了不少偏离软件建议的ICM范围的情况,但还是有一个直观感受——这玩意想赚钱没那么容易,能赚钱波动也会是非常大的。波动带来的伤害大于刷钱的诱惑~

超短桌ICM软件的建议,很多时候都是any two cards,要是我自己玩,估计不少时候会觉得那很傻B,当然也可能是我傻B。不过同时开6桌以上,又是超快速,又是低级别,根本没法子观察对手嘛,于是我就硬着头皮上了!啊~那真是一些非常艰难的决定啊……后来让我坚持实验下去的动力就是——我到底是不是傻B呢?

可惜,输到200多刀的时候,对失去金钱的心痛超过了对该答案的好奇……


虽然200多刀不算多,但这种莫名其妙的方式是我最难忍受的!学费交了,可啥都没捞着,想捞着就得继续交学费,而且还不知道得交到啥时候……


所以,从那以后开始,我就不玩牌了……


要是不知道什么原因,一定会以为,这事对我的打击非常非常大!





欢迎光临 智游城 (http://zhiyoucheng.co/) Powered by Discuz! X3.2