智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: 1989wd3
打印 上一主题 下一主题

打牌四年 纪念自己的总盈利达到100W 发帖纪录下自己的历程

[复制链接]
11#
 楼主| 1989wd3 发表于 2022-5-20 16:26:50 | 只看该作者
被踢出后的一段时间,加上工作开始忙了起来,也有了小baby,沉寂了大概半年时间,当然没有完全停止,朋友之间的线下,线上偶尔在玩,但没有之前打的那么勤奋了。找了线上公开局也打了一些,包括pkw,dpq,pkt等等,打了可能不不到5W手牌,没有盈利,刚刚能cover抽水的样子。但因为一些法律上的风险,以及我个人不是多开的选手,上班一天回家累了实在是不想开电脑了,只拿手机玩玩,我还是不太喜欢打公开局,加上收益微薄,后来就彻底停了。
12#
 楼主| 1989wd3 发表于 2022-5-20 16:33:17 | 只看该作者
10W-30W手牌: 这个阶段应该是我进步最快的时期。主要进步的方向来自对于POKER AI的研究。因为我本身就是AI行业的从业者,对这方面算是比较敏感,会关注一些业界的消息。从最原始基于CFR算法的Solver开始,目前依然可以说是在POKER AI领域落地最成功的应用之一,在这个阶段也开始频繁的帮助LZ进行复盘和总结。
13#
taiji18 发表于 2022-5-20 18:20:17 | 只看该作者
问个问题,以你的经验,solver的建议有多少比例可以拿来直接用,多少不能直接用,只能用来理解原理,调整使用?另外,你所学有多少是记忆答案,有多少是理解原理衍生应用,(跟上问同一性质)。或者其他方面的学习和应用。
14#
 楼主| 1989wd3 发表于 2022-5-20 19:56:56 | 只看该作者
taiji18 发表于 2022-5-20 18:20
问个问题,以你的经验,solver的建议有多少比例可以拿来直接用,多少不能直接用,只能用来理解原理,调整使 ...

首先要明确一点 solver给的结果也不一定是准确的 这里我说的准确 是说给出纳什均衡的解 因为solver毕竟要先输入range range估计不准都是白搭
但solver已经是非常接近纳什均衡解了 这是有数学保证的 完全可以相信
所谓纳什均衡  就是对方无论采用什么策略都无法提高对你的胜率  翻译成人话就是 无论对面是老板鱼还是LinusLove 我只要按照solver打 他对我的胜率最高不会超过50%(单挑情形) 既solver是先让自己立于不败之地  这个是可以保证的
但是solver不是盈利最大化的打法  玩剪刀石头布虽然你以1/3的概率出三种里的任何一种 你可以确保不会输 但如果你碰到一个很笨的对手 只会出石头  难道你还要随机出剪刀石头布吗 你当然要每把出布  这方面的研究也有 用强化学习的方法做 但还处于起步阶段 因为这要求越过纳什均衡点 相当于让机器有人类一般发现对手leak的眼睛
再回到实际牌局,如果是玩gg poker 6 max  NL100 一桌子都是22/15的选手 那当然要坚持solver的打法 但如果你是面对一个娱乐牌局或者新手局 或者你面对的是一个老板鱼 入池率高达80%  这时候solver光输入range后计算都要好久 因为range太宽了 而这时候其实我相信稍微有点经验的reg都知道如何剥削对手吧
15#
 楼主| 1989wd3 发表于 2022-5-20 19:59:00 | 只看该作者
hust_1986 发表于 2022-5-20 16:21
mark一下,楼主很强啊
ps:知乎上那个火烧云我看过他一些文章,多数应该是转载的,原创的水平很低且有很多 ...

我只看过他那一篇总结性质的文章 对新手还是挺友好的 无论如何算是完成了自己对德州扑克的启蒙 哈哈
16#
 楼主| 1989wd3 发表于 2022-5-20 20:34:55 | 只看该作者
  继续说这个阶段的经历吧
  有了solver的帮助,可以说是完成了一次蜕变,再回过头看自己之前很多自以为打的很好的牌谱其实都有很多不合理的地方。solver背后的数学基础可以说非常扎实,虽然现在很多solver为了提高速度对牌面做了很多压缩造成精度上的损失,但基本一个习惯用solver的选手对上完全不用的人相当于一个用自动火器对原始弓箭的差距。
  在这期间找到了一个线上5/10(5)的私局,这里平均水平比我之前打过的局明显好了一些,数据基本都是30/20, 25/18, 16/10这种类型的居多,纯老板玩家很少,偶尔来。在这个局打了三个多月,盈利13W多,后来因不明原因这个局头又给我踢了,自我怀疑是因为我从来不买保险导致的。
  被踢出后我的盈利这时候来到了30W,理论上来说已经可以打10/20甚至20/40的局了,但级别上来以后各种妖魔鬼怪也多了起来,包括这个5/10(5)的局有一个月我已经明显感受到了有伙牌,有一些很奇怪的空气牌在连续打我,事后我用APP的功能看了牌之后,都是其他人有blocker的,问了其他人也有类似的情况发生,后来从朋友口中得知确实有伙牌团伙被局头踢掉了。所以也让我对继续提级别心生顾忌,不是特别靠谱的局就算了。这也导致我有一段时间甚至只能找到2/4的局打,水平都比较低,零敲碎打赢了5W左右。
  在这之后, 有一天我突然觉得会不会是我的对手们水平都是在太低了,又让我想起之前打公开局也就勉强持平抽水,那现在提高后的自己再去打会是什么情形呢?所以我自己做了个计划,分别打国内平台和国外平台的公开局,准备40个买入,打10W-20W手牌,看看盈利如何。当然还是因为经常看城里有人被封号啊各种原因啊拿不回来钱什么的,加上手续费啊安全问题啊什么的,我决定还是打低级别,这样40个买入的钱就不会很多,真没了就没了无所谓。
  我首先打了WPK的zoom 1/2/4,打了约20万手牌,这个过程比较揪心。至于为什么打zoom是因为我想节约时间,我不是多开玩家,想要打满我的计划的话只有zoom可行。我清晰的记得第一天晚上盈利就超过了1W,百手盈利好像是180多个bb,我当时想这不会是杀猪盘吧,各种中牌对方不信。果然第二天就全部撤回。后面这个过程反反复复一直在重复,在我到5W手的时候这个过程已经上下了五六次了,当时我看着自己的水后0bb/hh真的有点想笑,感情全在给平台打工。好在我有一个预先设好的计划,无论如何我都要达到20W手,最终盈利是水后6bb/hh,总盈利3W多,虽然跟我在同期进行的私局盈利差远了,但成就感还是挺高的,起码证明我学过的这些东西确实是有效的。


  
17#
lirunqi 发表于 2022-5-20 20:47:22 来自手机 | 只看该作者
目前pio都是基于纳什均衡有限解做出来的离线模型,这部分主要的计算逻辑是ev最大化的贪心算法,俗称gto。高阶的,累死上面说的强化学习,但也不全是强化学习,毕竟扑克由于无限注额,所以没法穷举每一种可能,只能在一定范围内做到,并且facbook ai团队已有落地产品,是实时计算模型欧。目前两个问题,第一,适合强化学习的场景需要大量手数,但是能做到大量手数的局基本上是线上,线上就像个黑盒,不确定性太多。第二个问题就是技术类产品最终的走向一定是ev平衡,很难做到ev最大化。
18#
 楼主| 1989wd3 发表于 2022-5-20 20:56:46 | 只看该作者
lirunqi 发表于 2022-5-20 20:47
目前pio都是基于纳什均衡有限解做出来的离线模型,这部分主要的计算逻辑是ev最大化的贪心算法,俗称gto。高 ...

现阶段最强的AI应该是CFR的魔改版pluribus,大幅优化了运行效率,号称已经可以运行在手机上了,当然作者声称在多人底池不能保证收敛到纳什均衡
至于RL的方法 现在照CFR都还差的远,不管是后来出的deepstack 还是 poker cnn等 成绩都很差
我之前想过封装solver做一个自动打牌的bot,但业余实在是没有精力了,工作量还挺大的
19#
西门吹雨 发表于 2022-5-20 22:27:34 来自手机 | 只看该作者
楼主 ,我想问下 扑克王抽水大概 白手多少bb? 另外打过扑克时间吗,我感觉扑克时间全是伙牌加ai团队 感觉无法战胜
20#
 楼主| 1989wd3 发表于 2022-5-20 23:52:59 来自手机 | 只看该作者
西门吹雨 发表于 2022-5-20 22:27
楼主 ,我想问下 扑克王抽水大概 白手多少bb? 另外打过扑克时间吗,我感觉扑克时间全是伙牌加ai团队 感觉 ...

基本各个平台都差不多 相当于9bb/hh PKT去年打过很短的一段时间 我算上俱乐部反水 是盈利的
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-11-24 09:15 , Processed in 0.049817 second(s), 7 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部