智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

楼主: Howard
打印 上一主题 下一主题

就“风险”系列文章对dfu2012兄的回复

[复制链接]
41#
dfu2012 发表于 2012-5-1 19:03:54 | 只看该作者
monox 发表于 2012-5-1 16:44
注意,对于为什么幂律规律更符合扑克这一点,我还是不是很命白,如果单单从收入来说,这和风险的讨论似乎没 ...

太客气了,我也没有很清晰的理解,当初引这个话题,啰嗦这么多,也是想搞明白怎么回事。

但数学功底和对德州扑克的认识都不够,所以想抛砖引玉。

帖子里从数学来说不严谨的地方很多。

我的理解比较粗糙,风险和收益是孪生兄弟,一手牌的风险=随机牌运气牌的风险+犯错牌的风险,具体来说,风险的大小,风险发生的几率,

其实收益也可以这么表述,一手牌的收益=随机牌运气牌的收益+避免犯错或者引诱对手犯错带来的额外收益。

这么表述从数学上看确实不大严谨,没仔细考虑。

我也是从直觉上感觉牌手的每个SESSION(每手牌)的盈利分布可能是符合幂律分布的,最好的做法就是直接用计算机统计下,看下不同的收入分布是更符合幂律还是更符合正态分布。

这比我在这里瞎扯好多了。

42#
maomaobiao 发表于 2012-5-1 19:49:36 | 只看该作者
dfu2012 发表于 2012-5-1 18:14
我似乎觉察到了你的一些变化,但这个变化你自己可能也没有意识到。

好吧,也许是我没有意识到。不过我说的一点,你可能也没意识到。

“尺度和概率应用范围的关系”

其中提到的三个尺度,不一样,但是观测的数据,却是一样的。

你不能因为近距离观察某一个点的随机性,无规律性,就否认这个点在一个集合里的确定性和可知性。

你也不能因为一个集合的固有的特性走向宿命论,因为其中个体的随机和巧合才是过程的美妙,生命的华丽。

也正是由此,像刀友 不让孙 那样的人才会说,要一辈子当赌徒,因为他是在品味过程的美好;

也正是由此,有不少长期盈利的grinder选择离开,因为有些东西一旦“确定”,就没有意思了,再好的东西变成每天重复的工作,都会无聊。
43#
maomaobiao 发表于 2012-5-1 19:53:51 | 只看该作者
dfu2012 发表于 2012-5-1 17:52
帖子打开的非常慢,

一般都是自己思考自己理解,不大做搬运工,好容易搬了块分形的砖,没想到被砸的这么 ...

我愿意相信分形有科学的道理和理性的应用。

只不过,我所看到的大多数人关于分形的解释与应用,包括你在内在此的引用,都无法让我信服。

所以,我的cynical就习惯性发作了。
44#
maomaobiao 发表于 2012-5-1 20:03:53 | 只看该作者
maomaobiao 发表于 2012-5-1 21:53
我愿意相信分形有科学的道理和理性的应用。

只不过,我所看到的大多数人关于分形的解释与应用,包括你在 ...

I'm open minded, and I am confident to say I am picking ideas fast. Here is some reading from wiki

----------------------------------------------
Validating power laws

Although power-law relations are attractive for many theoretical reasons, demonstrating that data do indeed follow a power-law relation requires more than simply fitting a particular model to the data. In general, many alternative functional forms can appear to follow a power-law form for some extent (see the Laherrere and Sornette reference below). Also, researchers usually have to face the problem of deciding whether or not a real-world probability distribution follows a power law. As a solution to this problem, Diaz[8] proposed a graphical methodology based on random samples that allow visually discerning between different types of tail behavior. This methodology uses bundles of residual quantile functions, also called percentile residual life functions, which characterize many different types of distribution tails, including both heavy and non-heavy tails.

A method for validation of power-law relations is by testing many orthogonal predictions of a particular generative mechanism against data. Simply fitting a power-law relation to a particular kind of data is not considered a rational approach. As such, the validation of power-law claims remains a very active field of research in many areas of modern science.

-----------------------------------------------

不明白英语的童鞋,上面的大意就是:如果不是为了科研的目的的话,现阶段研究幂律就是在浪费时间,有空干点啥都行。
45#
maomaobiao 发表于 2012-5-1 20:25:26 | 只看该作者
本帖最后由 maomaobiao 于 2012-5-1 22:27 编辑
dfu2012 发表于 2012-5-1 18:14
我似乎觉察到了你的一些变化,但这个变化你自己可能也没有意识到。


“这个你帮了老霍的倒忙,老霍提到过一个SEESION,输多少个西格玛的概率,这恰恰是我想反对的”

这里我不认为我帮了倒忙。

某一手的随机性,和某一个session的不稳定性,其“风险”和西格玛是不可同日而语的。一个session的西格玛,也是有意义的。

懒得翻老霍的原文了。然则,概率、统计,这二者其实有细微的区别。预测一个session输多少西格玛的概率,是建立在对过去大量的数据的统计的基础之上的,依我对老霍的了解,他肯定会有“比方说你xxxx手牌的输赢数据是xxxx”这样的条件。

你要反对,也要言之有物。一句不在西格玛,在人,着实有搂风的感觉,跟了几帖这么多楼,仍然感觉如此。

我能理解你对扑克的思考,思考是好的,固然,我无法接受一些你的结论。这样吧。
46#
maomaobiao 发表于 2012-5-1 20:47:40 | 只看该作者
本帖最后由 maomaobiao 于 2012-5-1 22:48 编辑
maomaobiao 发表于 2012-5-1 22:03
I'm open minded, and I am confident to say I am picking ideas fast. Here is some reading from wiki ...


仅从我获取的有限的信息来看,幂律,也是一种规律和模型,从数据与模型的关系的角度看,幂律和正态分布模型并没有本质的不同。

所以,你用数据与模型的关系,以及哪个模型更接近数据的真实情况,这两个论据,否认“风险”概率的可知性,是不合时宜的,算是一个逻辑硬伤。

抑或,你本来就想说风险应该用幂律来度量?那我更进一步,用幂律这个模型来度量的表征是什么呢?

这和我们刚开始争论的,“风险”在人心,可不可以度量,才是最大的分歧。

绕了一圈,兜回来,幂律和正态分布的分歧也就不那么重要了。

因为,我相信,当今研究幂律的科研工作者都是本着应用这个模型,对数据给出更好的解释,乃至预测的目的。只不过,现阶段能用的,最佳的模型,还是让我们着眼正态分布和西格玛吧。
47#
maomaobiao 发表于 2012-5-1 20:56:12 | 只看该作者
maomaobiao 发表于 2012-5-1 22:47
仅从我获取的有限的信息来看,幂律,也是一种规律和模型,从数据与模型的关系的角度看,幂律和正态分布模 ...

补上数据和观测尺度的关系,以及观测尺度对于概率应用范围的影响。注意图中坐标轴的变化,三个图用的是同一组数据,Excel自带的随机生成函数,姑且认为是“随机数”。

对于这样的数据,你认为它是一个点,一团杂乱无章的点,还是一个有规律的pattern,完全取决于你的高度。

希望对大家理解我的话有一个直观的帮助和感性的认识。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
48#
 楼主| Howard 发表于 2012-5-1 22:17:51 | 只看该作者
我得妈妈呀,一觉起来,十几楼盖到了快50楼。maomaobiao兄谢谢你的帖子,你说的仍然基本是我要表达的意思。

我想说的是,德芙兄不必担心你我之间是为了争辩而争辩,咱说的都是就事论事,客观事实,不是争任何主观的东西。更不是前段时间有的争辩贴,到最后都演变成双方都急吼吼的要证明“我牛逼,你傻逼”。我感觉你我之间的这个系列,顶多会稀里糊涂不了了之,不会变成二逼之争的那个样子。这里我必须得夸赞一下德芙的辩品。

这些帖子中,我还是捡着我能看懂(至少自认为看懂)的您的片段来说事。这次我看到您反复强调的一个观点:

牌手的每个SESSION(每手牌)的盈利分布可能是符合幂律分布的,。。。而不是正态分布
(注意上文并不是完全直接引用,经我的改写简化,如曲解了您的意思,请指出)

幂这个字,不跟“杨”连在一起,还真引不起我的兴趣。。。。  好吧,假定我们研究每手牌的盈利分布。(其实fullring的每圈牌的盈利分布更合适,因为不同位置的盈利分布显然是不同的)幂律不就指数分布吗?指数分布接近零时无穷大,接近正无穷时则无穷小。而每圈牌的盈利,大部分是很小的输赢,比如丢了个盲注;只有少数,才是清了别人翻倍或者3倍;或者被别人清,一下变0。这样中间大,两头小的形状,更像正态分布的钟型图,而不是一头大一头小单调递减的指数分布。

当然,这个分布跟正态分布的差异也很大。那么它到底是什么分布呢?数学上恐怕没有一个专有名词来描述它。不过,无法描述、我们知之甚少的分布并不代表着我们无法研究它。事实上,正态分布正是研究它的利器。且听我慢慢将来。

我们想一想,我们最关心的扑克的风险到底是什么?一手牌(一圈牌)的输赢吗?不是,是连续的这些手(圈)牌的盈利之和。所谓下风期,上风期,不就是连输、连赢吗?我们就是要找出这些小概率的连赢、连输事件的发生频率,以及到底能连赢、连输多少钱(更关心连输,因为涉及破产)。

那么,既然一圈牌的盈利是一个我们没有充分了解的奇怪分布(非幂律、非正太、非均匀、非一切数学书中的专有名词),很多圈牌之和,它们的分布,岂不是更神秘,更多变量,我们更无法研究了吗?

解决问题的关键就在所谓“中心极限定理”。定理内容是:“独立同分布、且数学期望和方差有限的随机变量序列的标准化和以标准正态分布为极限”。

翻译成人类的语言,是说:大量随机变量之和近似服从正态分布,甭管你这些变量本身是什么分布的。幂律也好,均匀也好,还是自己就已经正态了也好,他们加起来,就是正态分布。实验次数越多,近似程度越高。

中心极限定理的发现,最初是因为人们研究二项分布。所谓二项分布,就是抛硬币。硬币未必是公正的,正面向上的次数为p,抛的次数为n。则参数为n, p的二项分布以np为均值、np(1-p)为方差的正态分布为极限。n越大,越近似正态分布。n超过20,其分布已经很像正态了,超过几千几万,那简直就是像得不得了。

换句话说,你抛1000次,如果硬币均匀,那正面出现的次数是以500次为中心,西格玛为16左右的一个钟形曲线。其完美程度,会让你觉得,这本身就是标准正态分布。

再后来,人们发现,不光是二项分布,任何的分布,只要是试验次数多了,它们的和都接近于正态分布。

比如,60岁以上的人,每年内平均死亡概率大概是3%。人寿保险公司给1百万个这样的人上了保险,它要关心的是:明年死亡的人总数是多少?因为1百万足够大,所以这个死亡总数,也是个完美正态分布,高度可预测。西格玛又粉墨登场。你说,61岁死亡可能1%, 78岁却高达10%,90岁高达20%,你那个平均3%都没考虑到人年龄的不同,更何况人还有抽烟喝酒得癌症的,还有天天泡妞跑马拉松的,最大的风险来自于个人习惯,用西格玛是错误的。。。。。。 这都没事儿,只要我有100万人就行,它就中心极限了,就正太了。

举个扑克的例子,某人一小时的扑克成绩,是这样的一个分布:20%的情况赢100,30%的情况在(-50,50)之间均匀分布,50%的情况输(-1000,-800)之间的指数分布。这是个奇形怪状的,不可用数学语言来描述的怪异分布。但即使这样的分布,也没关系,只要每个小时的分布都是这个样子,此人打1000个小时后的分布,就非常接近于正态分布,且均值、方差均可得知:1000u, sqrt(1000)*sigma

中心极限定理是已经证明的数学定理。(顺便说一下,数学定理是可证明的;物理定理只能区分为两类:已经找到反证和尚未找到反证的,不能证明。)证明过程虽然不长,但要用到比较高的数学技巧,我就不贴公式了。链接:http://en.wikipedia.org/wiki/Central_limit_theorem

中心极限定理的完美之处就在于,你不必再拘泥小随机变量的分布的形状,只要这些小变量都是同分布的,甚至近似同分布的,则他们的和就是正态,概莫能外。

如果打扑克,考虑对手的不同,心态的变化,致使每手牌、每个小时、每天等不能再看成完美的同分布随机变量。但正态分布和中心极限定理仍然有巨大的实用度:我过去一年,大概是赢2/3的session,平均每session盈利400,session标准差900;那么明天对同样的一波对手,在同样的赌场,我差不多的心态,我仍然可以做出如下预期:我有2/3的可能是赢家,盈利是以400为中心,大概有68%的可能是(400-900,400+900),有95%的可能是(400-1800,400+1800)
49#
 楼主| Howard 发表于 2012-5-1 22:28:29 | 只看该作者
maomaobiao 发表于 2012-5-1 20:47
仅从我获取的有限的信息来看,幂律,也是一种规律和模型,从数据与模型的关系的角度看,幂律和正态分布模 ...

对呀,我说了半天,没有你一句话扎在尾椎骨那么深刻。

既然德芙兄说,风险不可度量,那还幂律干嘛?你把幂律搞出来,且不说我根本不同意它符合什么杨幂绿,你的目的不还是为了度量风险?

到底现在是 杨幂 vs 正太,还是 可度量 vs 不可度量?
50#
dengxianqi 发表于 2012-5-2 00:52:10 | 只看该作者
dfu2012 发表于 2012-5-1 14:10
离散型随机变量模型的应用范围,经济学争论一直很多,这个论题争论下来,将会非常浩大。

我确实没这个能 ...

“至少从现象看,德州扑克的盈利结果更像是指数分布。”

我自己记录了自己125个session的输赢结果,刚才做了个简单图形,
按照500元作为区间,统计每个区间出现的个数,得到附件的图。
这个结果,貌似更像是正态分布。

注:所有数据来源,来自我在北京、上海、广州,澳门的34个不同的场子,
盲注大小涵盖1-2, 2-5, 5-10,10-25, 25-25,25-50,时间跨度将近11个月,
面对的对手千差万别。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2025-1-17 21:56 , Processed in 0.079875 second(s), 8 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部