|
我得妈妈呀,一觉起来,十几楼盖到了快50楼。maomaobiao兄谢谢你的帖子,你说的仍然基本是我要表达的意思。
我想说的是,德芙兄不必担心你我之间是为了争辩而争辩,咱说的都是就事论事,客观事实,不是争任何主观的东西。更不是前段时间有的争辩贴,到最后都演变成双方都急吼吼的要证明“我牛逼,你傻逼”。我感觉你我之间的这个系列,顶多会稀里糊涂不了了之,不会变成二逼之争的那个样子。这里我必须得夸赞一下德芙的辩品。
这些帖子中,我还是捡着我能看懂(至少自认为看懂)的您的片段来说事。这次我看到您反复强调的一个观点:
牌手的每个SESSION(每手牌)的盈利分布可能是符合幂律分布的,。。。而不是正态分布 (注意上文并不是完全直接引用,经我的改写简化,如曲解了您的意思,请指出)
幂这个字,不跟“杨”连在一起,还真引不起我的兴趣。。。。 好吧,假定我们研究每手牌的盈利分布。(其实fullring的每圈牌的盈利分布更合适,因为不同位置的盈利分布显然是不同的)幂律不就指数分布吗?指数分布接近零时无穷大,接近正无穷时则无穷小。而每圈牌的盈利,大部分是很小的输赢,比如丢了个盲注;只有少数,才是清了别人翻倍或者3倍;或者被别人清,一下变0。这样中间大,两头小的形状,更像正态分布的钟型图,而不是一头大一头小单调递减的指数分布。
当然,这个分布跟正态分布的差异也很大。那么它到底是什么分布呢?数学上恐怕没有一个专有名词来描述它。不过,无法描述、我们知之甚少的分布并不代表着我们无法研究它。事实上,正态分布正是研究它的利器。且听我慢慢将来。
我们想一想,我们最关心的扑克的风险到底是什么?一手牌(一圈牌)的输赢吗?不是,是连续的这些手(圈)牌的盈利之和。所谓下风期,上风期,不就是连输、连赢吗?我们就是要找出这些小概率的连赢、连输事件的发生频率,以及到底能连赢、连输多少钱(更关心连输,因为涉及破产)。
那么,既然一圈牌的盈利是一个我们没有充分了解的奇怪分布(非幂律、非正太、非均匀、非一切数学书中的专有名词),很多圈牌之和,它们的分布,岂不是更神秘,更多变量,我们更无法研究了吗?
解决问题的关键就在所谓“中心极限定理”。定理内容是:“独立同分布、且数学期望和方差有限的随机变量序列的标准化和以标准正态分布为极限”。
翻译成人类的语言,是说:大量随机变量之和近似服从正态分布,甭管你这些变量本身是什么分布的。幂律也好,均匀也好,还是自己就已经正态了也好,他们加起来,就是正态分布。实验次数越多,近似程度越高。
中心极限定理的发现,最初是因为人们研究二项分布。所谓二项分布,就是抛硬币。硬币未必是公正的,正面向上的次数为p,抛的次数为n。则参数为n, p的二项分布以np为均值、np(1-p)为方差的正态分布为极限。n越大,越近似正态分布。n超过20,其分布已经很像正态了,超过几千几万,那简直就是像得不得了。
换句话说,你抛1000次,如果硬币均匀,那正面出现的次数是以500次为中心,西格玛为16左右的一个钟形曲线。其完美程度,会让你觉得,这本身就是标准正态分布。
再后来,人们发现,不光是二项分布,任何的分布,只要是试验次数多了,它们的和都接近于正态分布。
比如,60岁以上的人,每年内平均死亡概率大概是3%。人寿保险公司给1百万个这样的人上了保险,它要关心的是:明年死亡的人总数是多少?因为1百万足够大,所以这个死亡总数,也是个完美正态分布,高度可预测。西格玛又粉墨登场。你说,61岁死亡可能1%, 78岁却高达10%,90岁高达20%,你那个平均3%都没考虑到人年龄的不同,更何况人还有抽烟喝酒得癌症的,还有天天泡妞跑马拉松的,最大的风险来自于个人习惯,用西格玛是错误的。。。。。。 这都没事儿,只要我有100万人就行,它就中心极限了,就正太了。
举个扑克的例子,某人一小时的扑克成绩,是这样的一个分布:20%的情况赢100,30%的情况在(-50,50)之间均匀分布,50%的情况输(-1000,-800)之间的指数分布。这是个奇形怪状的,不可用数学语言来描述的怪异分布。但即使这样的分布,也没关系,只要每个小时的分布都是这个样子,此人打1000个小时后的分布,就非常接近于正态分布,且均值、方差均可得知:1000u, sqrt(1000)*sigma
中心极限定理是已经证明的数学定理。(顺便说一下,数学定理是可证明的;物理定理只能区分为两类:已经找到反证和尚未找到反证的,不能证明。)证明过程虽然不长,但要用到比较高的数学技巧,我就不贴公式了。链接:http://en.wikipedia.org/wiki/Central_limit_theorem
中心极限定理的完美之处就在于,你不必再拘泥小随机变量的分布的形状,只要这些小变量都是同分布的,甚至近似同分布的,则他们的和就是正态,概莫能外。
如果打扑克,考虑对手的不同,心态的变化,致使每手牌、每个小时、每天等不能再看成完美的同分布随机变量。但正态分布和中心极限定理仍然有巨大的实用度:我过去一年,大概是赢2/3的session,平均每session盈利400,session标准差900;那么明天对同样的一波对手,在同样的赌场,我差不多的心态,我仍然可以做出如下预期:我有2/3的可能是赢家,盈利是以400为中心,大概有68%的可能是(400-900,400+900),有95%的可能是(400-1800,400+1800)
|
|