智游城

标题: 就“风险”系列文章对dfu2012兄的回复 [打印本页]

作者: Howard    时间: 2012-5-1 02:20
标题: 就“风险”系列文章对dfu2012兄的回复
dfu2012兄,才如泉涌,下笔如飞。兼具发散性思维和朦胧派诗人之特长,我端的佩服。

好好看了一下仁兄最近几天的帖子,虽然发散,但好像也总结出来一点,可能是你的主旨,我转述如下

问题4:德州扑克真正的风险在哪里?
德州扑克的真正风险在于你的对手

把对风险的理解构建在历史的统计数据而得出的方差的结果之上,而不是对自己的了解或者对手的了解,这不是最大的风险是什么?

简单说,老霍从历史数据经过统计分析后的方差来了解自己的风险度,而我以为,我对我自己以及我的对手是否了解的透彻才是最大的风险。


我想说明如下:

我提出方差,是为了衡量风险,而不是说“风险来自于方差”。方差只是衡量手段。

您说,“风险来自于对手”。这是显然的,我当然也同意。不光最大的风险来自于对手,最大的利润,一般的风险,一般的利润,全都来自于对手。没有对手,就没有一切。

张国荣摔死了,他的风险,直接来自于40米的高度,间接来自于他的抑郁症和感情波折。但是,米作为长度单位,不能算作他的风险。

鞍山钢厂的工人被烫伤了,他们的风险,直接来自于钢水的1600C高温,间接来自于不安全操作和忽略的规范。但是,归咎于帕斯卡(还是其他人?)发明的温度单位,似乎不合适。

我当然也不是那个认为米和C是风险的人。

但是,仍然可以用米和C做预测。下一个高空坠落者,如果从1米,我估计他没什么事,除了要扭脚;3米,就要有残疾的危险但还要不了命;20米以上,除非奇迹否则性命难保。

方差就是个客观衡量单位。有了历史数据,它就是客观的存在。使用方差测量风险就跟使用米去衡量高度一样,量对了就有意义,量错了当然是有害的。

比如,100米的高空,你用了一把错误的尺子,说只有1米。跳下去,当然杯具。

你举得扑克例子,说我跟墙到了澳门,波动如此之大,远远超出以往的若干西格玛。这是当然的,对手换了,方差能不换吗?属于用了错误的尺子。以此归咎于长度本身,似乎逻辑不通。

如果在澳门,我们跟这个“危险的对手”交战了1年,那么这1年的历史数据,就足够提供风险衡量所需要的精度。只要对手不变,资金不变,大环境也差不多,完全有可能预测,下一个session的输赢有68%在一个西格玛内,95%在两个西格玛内。

所以咱们有点各说各话的意思。风险主要来自于对手,方差是衡量风险的手段。你说前一句,我说后一句。两句都对,但是前面的不否定后面的。

但还是有点区别。

你那一句,风险主要来自于对手,一个牌手即使了解了(也不太可能不了解这大白话),不能给现实提供什么应对手段,因为这难以量化,难以转变成对资金管理,甚至技术层面的有效指导。

方差是衡量风险的手段,却可以量化,算出准备多少资金和破产率的关系。不完全准不要紧,要的是尽量准。

作者: luckystar    时间: 2012-5-1 03:23
Howard终于出手反击了。坐看得福兄弟是否一击即溃,还是重整旗鼓,真锋相对。
我赌Howard胜
作者: dfu2012    时间: 2012-5-1 09:52
本帖最后由 dfu2012 于 2012-5-1 10:51 编辑

风险来自对手,这真不是大白话。
“风险来自于方差”这个点的解释其实是没必要的,我不会学究到这个程度,一切为了实战,方差当然是做风险度量用的,如我帖子的题目所示。

我强调风险来自对手,是提醒关注风险来源的本身比关注历史数据提炼出来的方差要重要的多,并不是说风险来自方差。

因为方差经过了提炼,且不论这种提炼是否合理(提炼的数据本身就不能说是完全的随机变量),然后用方差给未来的风险做度量或者做参考,比如偏离若干个方差的事件是不可能发生的,事实是,如果遇到自己不了解的对手,这种事件发生的概率要远高于高斯曲线所警示我们的,这么看,死也是很容易的。

其实我后面给了具体的例子,你说的老邱,TOM,IVEY,谁的风险度更高的问题?老邱0,IVEY 2%,TOM 12%,三个人的风险度有指数级别的差别,每个人的风险是另外一个人的N倍,这种观点很可能是方差思维的直接体现,谁历史上的波动大,谁的风险最大。而我以为,水平近似的情况下,谁的资金大,谁破产的可能会小些。抛开资金的因素,TOM的资金自然比不上另两位,他们这个级别的较量,生死更多存在于,谁对对手掌握的更好,谁更快的调整和适应。IVEY据说是最难读懂的对手,这样的对手,如果不是他把德州扑克当娱乐玩,他的破产可能是最低的吧。。。

这个问题的思考,看似没有意义,我个人觉得如获至宝。

如果不考虑人的因素,每把牌都有相应的模式,尽量穷尽。  

考虑到具体的人,每把牌都没有唯一解,每把牌价值的榨取或者诈唬的时机都是根据对手做调整,以前我会很喜欢问这类问题:CR应用的优缺点,坚果牌如何榨取更大的价值(比如你刚贴的2把牌的第一把红桃花)。
现在觉得没必要了,基本打法知道了,后面全部根据对手调整。

啰嗦很多,先说这些,不知道跑题没有。

(另外,我个人觉得,拉斯维加斯3里的马自达那手KX的牌的应对,数学上看TURN圈的打法似乎有明显的问题,是个用数学分析的好例子。)

作者: dfu2012    时间: 2012-5-1 10:17
本帖最后由 dfu2012 于 2012-5-1 10:21 编辑

低级别的人打牌,思维惯性很大,基本不会根据对手调整自己的策略。给对手贴上标签后,按固定模式打就好了,我也喜欢做这种事,比如一个人前面诈唬了,好,这人喜欢搞这个,下回来了好牌搞死他。

现在的思维变了,如果一个人尽管被抓,但诈唬的很合逻辑,就一定要小心了,在大池子的时候对这种对手小心点,要么比他更凶,要么避免开战。

比如坚果牌榨取价值,具体到每个牌例讨论这个问题会是个渐悟的过程,直接从本源出发,就可以这么说:坚果牌的打法,取决于对手,哪种打法能让对手最大程度的掉入陷阱,就采用哪种打法。似乎又是没有用的废话,起码算个指导原则吧。

说回你那把对千年岩石的红桃坚果(基本是坚果了),我觉得已经够了,如果对手是松凶派的,CR或者大加注甚至ALLIN(给对方诈唬的味道)也许比直接一个锅附近的下注好,当然前提是你是否诈唬被人抓过(让人知道你有诈唬倾向),如果你一直是紧手打的规矩没被抓过,还是保守点,简单点获得些价值就好了,18%的概率博点价值总比什么都没有好。

还有就是马自达,我的分析是,这个对手有弱点可以利用,这种对手在河牌被人利用的价值比别人更大。





作者: maomaobiao    时间: 2012-5-1 10:40
我喜欢凑热闹,但是这次不看好他俩誰能说服誰。

重要的是,我看明白Howard和dfu互相了解了对方,其实这个风险的问题就没有特别的必要讨论了,否则难免歪楼。

dfu思考的是风险的根源,和我们对扑克、对对手、对自己的认知;Howard则尽量用简约易懂的语言、工具表述这样的风险,度量我们应该参与的游戏范围。其实,并不矛盾。尽管dfu之前的一些观点一度偏离了他所要表述的内容,但是他回到了这个帖子里,明显条理更好了。

从讨论问题的角度,一个相对简化的模型和必要的假设前提是有益的,前提是读者明白这些假设前提的重要。而过度的思考并非无用,虽然有时候也有可能是有害的。这也就是为什么要有科研和文章的发表,交流不能只靠神交,讨论问题不能假设读者都明白我们在说什么。

先歪到这里,老板来回窜。
作者: dfu2012    时间: 2012-5-1 10:42
本帖最后由 dfu2012 于 2012-5-1 10:49 编辑

“方差是衡量风险的手段,却可以量化,算出准备多少资金和破产率的关系。不完全准不要紧,要的是尽量准。”

我不认同的恰恰是这句,方差量化的结果会给人极大的错觉,很多贴都反复论证这点,以方差来指导资金使用原则,会堕入很大的风险陷阱,也会丢失很都获利机会。

之所以说在德州扑克使用方差会有问题,是因为人的行为模式有迹可循,除了少数高人,多数人都有自己特定的行为特征,反映在牌局的结果上,普遍倾向是鱼模式的玩家基本都输,鲨鱼模式的玩家赢很多,岩石模式的赢少,这类数据和一些运气牌的数据混杂在一起,而你不加分离(也没法分离)把这些数据全部混杂在一起做统计分析,然后算出方差,量化自己的风险,我是不能理解这个的。


上面几个回帖包括以前的很多贴说的都是这回事。


可见,模式或者说套路这种东西不是万能的,能够被人利用。德州扑克的风险是,对手可以等待1000手牌,抓住你的弱点,一把清光你,强调多少遍都不过分。而模式或者说套路也是是数据统计的结果,当然比方差要合理的多,方差我基本觉得就是无用的东西,如塔勒布所说,是个智力大骗局。



作者: maomaobiao    时间: 2012-5-1 10:46
我们当然可以,也应该针对每一手牌做出调整,但是数据和阅读恰好是这种调整的基础,风险由此而来,因为每一手牌都是不一样的——手牌,位置,筹码的数量,交锋的历史,等等。

过度的思考,深究每一手牌的风险,在我看来,将把我们引向不可知论——或者让我们玩scare money。自信,不完全来自于完全的了解。

tmd我要文艺范一下:We can love completely without complete understanding.

同样,We can play the Hold'ed without complete understanding.
作者: dfu2012    时间: 2012-5-1 11:07
本帖最后由 dfu2012 于 2012-5-1 11:34 编辑
maomaobiao 发表于 2012-5-1 10:46
我们当然可以,也应该针对每一手牌做出调整,但是数据和阅读恰好是这种调整的基础,风险由此而来,因为每一 ...


每一手牌都做调整很辛苦也很累,似乎没有必要,看POT值不值了,主要是针对对手的风格做调整,对手的风格如果固定并很好掌控的话,打牌是轻松的事,就按基本套路来好了。

位置,筹码的数量,SPR, 等这些东西,都有些基本套路,都可以做数学分析的,我个人以为,能做数学分析的部分,处理起来就很轻松,一般都有最佳解,+EV就执行,-EV的话看IMPLIED。但是掺杂了人的因素尤其是高手(善变的人)的时候,就得抛开套路的固定框架,以人的分析为核心。

其实我和老霍的真正分歧在于:
我的观点:风险是不可度量的。抓住最大的风险来源即可。
老霍的观点:风险可以度量(当然是近似的)。西格玛已经很精确了。


基于上面的观点不同,
我的观点是:西格玛度量的风险有害无益,并举了若干例子。
老霍的观点是:数学上。。。

-------------------------------------------------

我也意识流一把:爱这个东西很多时候就是个错觉,代价很大,但趋之若鹜者众。





作者: maomaobiao    时间: 2012-5-1 11:44
本帖最后由 maomaobiao 于 2012-5-1 13:51 编辑
dfu2012 发表于 2012-5-1 13:07
每一手牌都做调整很辛苦也很累,似乎没有必要,看POT值不值了,主要是针对对手的风格做调整,对手的风格 ...


你这里的解释恰好印证了我说的,过度思考的极端会引向不可知论。

如果风险在人,在人心,那么,理性的我们是无法知道、掌握这些的,至少目前不能。

这让我想起了曾经参与过的一个关于概率应用范围的讨论:

站在一个很宏观的角度,比如说银河系之外看,以一个较大的时间尺度度量,太阳系的命运是注定的。但是,站在某一个人的身边,你却无法预知他下一步的准确行动,用扑克做例子——你不知道他会call/fold还是接了一个电话tank n久,最后make a move all in。

这就好比说,当把一些数据的坐标轴放大很多,我们看到的是一个点;然则在一个很小的坐标系里,这个点其实是一堆杂乱无章的点的集合。

那么,有没有这样一个尺度,我们看到的即不是一个点,也不是随即的点的集合,而是具有某种pattern的点的集合呢?对于扑克的数据而言,答案应该是肯定的。那么,西格玛就是一个工具,有效地描述了这样的pattern的形状,真正的理性认知由此而来。

至于给这样的pattern加以解释,进入到人的内心,至少在目前是一种非理性的认知。如果dfu坚持这个观点的理性,不妨用一些工具描述你所说的来自人的风险。

比格达拉斯说——任何科学的理性的东西,都应该是可以用数学表述的。

来自与人的风险,如果不借助数学工具(比方说西格玛),那么它的表述就是非理性的,停留在无尽的自问自答的层面上的,也就是我说的不可知(你所说的不可度量)的。

如果,风险不可度量——进而推出风险不可知——那我真不知道我们在讨论什么?

--------========----------------

其实,在某一个尺度和时间跨度下看,人的行为恰恰是可以预测的,可知的。比如说:100年后我们都会死,这绝对是一个理性的认知。那么,不那么极端,说50年后这个论坛上现有的80% +/- 10%的人都会死,这绝对也是一个理性的认知。你能说+/-10%是不可度量的吗?
作者: dfu2012    时间: 2012-5-1 12:13
本帖最后由 dfu2012 于 2012-5-1 12:15 编辑

老霍的方差我也看明白了,有前提条件的,特定的人,这个人不怎么变化,你也不怎么变,资金也不怎么变化,相对稳定的参与群体及整体环境。

我是坚决不认同这点的,因为数据源已经设定了前提条件,这本身就已经不具备离散型随机变量的特征,再用随机模型的正态分布是否合适呢?


从数据结果上看,能符合高斯分布吗?我个人觉得不会像,部分SESSION的结果是杂乱无章的,但总体结果将是具有某种特征的即优势一方一面倒的胜率,幂律,即指数分布更可能符合这种结果。

即便结果如高斯分布,这种设置了很多前提条件的方差有足够的真实的数据样本吗?要做出这样针对特定人的方差,不单需要足够的样本数据,还要从海量的数据里挑选,与其这样去度量风险。不如更深一步,利用数据本身的内涵把对手研究透。

其它话题,更多是从风险话题引申出来的,比如以人为本的分析和思维方式。

好多人误会了我的思考,我还真不是对一手牌去思考过度。
对一手牌思考过度有害无益,我觉得,一手牌尽量让对方陷入思考(即被动)比让自己思考好,别把自己搞的很被动,一手牌尽量简洁点好。

但最本源的东西,多思考点对我这种初级的门外汉可能好处更多一些。

作者: Howard    时间: 2012-5-1 12:19
luckystar 发表于 2012-5-1 03:23
Howard终于出手反击了。坐看得福兄弟是否一击即溃,还是重整旗鼓,真锋相对。
我赌Howard胜  ...

幸运星兄,你打牌很牛,但这次下注你恐怕要输惨了。我绝对压德芙兄弟胜出,原因如下:

1. 他打字快。 您还别笑,网络争辩,打字快者十有九胜。说最后如果不在网络,面对面,那我更歇菜。因为我讲话跟刘能一样,结结巴巴的,绝对是完蛋的玩意儿,不能上台面

2. 他气势如虹,开山碎石。我觉得没什么好讲的,甚至分不清到底对方论点何在?

3. 他对扑克的思考,恐怕也比我多。我因为自己觉得有了一个体系,难免有惰性存在,思考少了,激情可能也比他略少。

总之,我要大大地对不住你了,呵呵
作者: Howard    时间: 2012-5-1 12:23
maomaobiao 发表于 2012-5-1 11:44
你这里的解释恰好印证了我说的,过度思考的极端会引向不可知论。

如果风险在人,在人心,那么,理性的我 ...

毛毛表兄,我授权于你老人家吧,我觉得你说的,跟我要表达的是基本一致的。
作者: dfu2012    时间: 2012-5-1 12:40
本帖最后由 dfu2012 于 2012-5-1 21:57 编辑
maomaobiao 发表于 2012-5-1 11:44
你这里的解释恰好印证了我说的,过度思考的极端会引向不可知论。

如果风险在人,在人心,那么,理性的我 ...


1.关于过度思考,前面我已经解释了,对一手牌我不会过度思考,有个大原则和大致的判断就好,
大原则是:能简化尽量简化,让对手思考而不是让自己思考。比如河牌的弱价值下注,如果对方是很麻烦的有能力诈唬的,我多数会放弃弱价值下注,这点在HSP的节目,很多牌手面对IVEY,即便有位置,拿着大牌,也放弃了弱价值,因为IVEY太麻烦了。


2.关于风险度量的意义,你我的结论类似,有个度量尺度的问题,当SEESION不够多的时候没意义,开出1:20甚至1:10(我很想说1:3)的赔率,我和老邱打10把牌,我会对自己下注,我就做岩石玩家,这个时候是随机性的牌运占据主导位置。但SESSION足够多以后,100%是老邱胜,这个不需要用方差。

3,关于风险是否可度量(数学意义上的),我觉得不可以,尤其是采用离散型随机变量做模型的高斯分布,正如你所说的,单个人的行为是不可知的,但人的行为模式是具备共同特征的,比如鱼模式玩家,鲨鱼模式,岩石模式等等。这些行为模式存在,导致输赢的结果很可能呈现出另外一类型的分布: 指数分布,即幂律。部分有特征的数据(部分而且是最有价值的部分)和其他随机数据混杂在一起采用基于随机变量模型的正态分布是否合适呢?

幂律可能是比西格玛更好的描述德州扑克的工具。

即便不可能精确知道风险有多大(单一SESSION去度量风险意义吗?),但如果能掌控对手的思路话,基于运气牌可以被大量的牌局平滑掉,最后的结果将是一边倒的结果,即:谁更能掌控对手,谁就是最终的赢家。

基于基本的资金管理策略,等级高的对等级低的在海量的牌局之后,会是一边倒的胜率,99%。
作者: Howard    时间: 2012-5-1 12:48
本帖最后由 Howard 于 2012-5-1 12:50 编辑

德芙兄的大方向搞不懂,抓几个分论点说说吧

德州扑克的风险是,对手可以等待1000手牌,抓住你的弱点,一把清光你,强调多少遍都不过分。


这种千年岩石型对手,我虽然在现场不喜欢,但也不至于怕他。如果单独要对付他,那太简单了,跟他买入20BB,每次都全进,1000次里面他都弃牌999次,一共输给我150BB,赢一次,我给他20BB。



老霍的方差我也看明白了,有前提条件的,特定的人,这个人不怎么变化,你也不怎么变,资金也不怎么变化,相对稳定的参与群体及整体环境。
我是坚决不认同这点的,因为数据源已经设定了前提条件,这本身就已经不具备离散型随机变量的特征,再用随机模型的正态分布是否合适呢?


设置了前提条件,才能叫做“同分布”的随机变量。即使你掷硬币,不也得设置前提条件吗:1. 无偏硬币 2. 扔的足够高以保证随机性 3. 不能有恒定风向
这样有前提条件的一次掷硬币,才能叫随机变量。


其实我和老霍的真正分歧在于:
我的观点:风险是不可度量的。抓住最大的风险来源即可。
老霍的观点:风险可以度量(当然是近似的)。西格玛已经很精确了。


这。。。。 这。。。。不可度量。。。。。不可度量,你怎么知道什么是“最大的风险来源”?不还是估计出来的吗?



还有以前的一句
西格玛以历史数据对未来进行预测,离均衡点越远,发生的几率越低。由于西格玛认为“极端”事件发生的概率极低,所以这类事件的风险及影响对整体可以忽略不计。
      个人以为,要高度重视这些“极端”事件,从西格玛看,这类事件发生几率低(实际上更可能远远低估这类事件发生的概率),但这类事件对整体的盈利和风险都占据了重要的地位。


方差,以及方差的单位”西格玛“,正是用来衡量这些极端事件发生频率的啊。资金管理的全部意义,不就是尽量避免破产这个极小概率事件吗?怎么能说”西格玛认为极端事件可忽略不计“?   你说,方差不适合衡量极端事件,在我听起来,就好像说”大楼太高,咱别说多少米了,用米已经衡量不了了,咱就说它很高吧“ 一样,我不知怎么回应。

德芙兄与我的观点分歧,我觉得扑克、风险、方差只是表象。毛毛表兄说准了,不可知论和可知论才是核心,这是从哲学层面。从数学层面,对统计学的理解、熟悉和信任是核心。

作者: dfu2012    时间: 2012-5-1 13:06
Howard 发表于 2012-5-1 12:19
幸运星兄,你打牌很牛,但这次下注你恐怕要输惨了。我绝对压德芙兄弟胜出,原因如下:

1. 他打字快。 您 ...

老霍,可能你还真误会了,这贴还真不是为辩论而辩论,东西写的多,主要是水平不济,水平好的几句话就说清楚了。

应该说,主要我前面看帖不认真,没抓到点子,喜欢从自己角度出发。10楼的解释会清楚些。

本帖你举了个例子,提到澳门1年的数据样本,之所以举这个例子,是因为你知道这样的方差需要特定的前提

1)需要特定前提的数据样本,可能已经不合适采用离散型随机模型的正态分布来处理。

2)即便符合正态分布,处理这样的样本,不如直接分析样本本身。

第一点,咱们双方都没法说服。我只能用塔勒布的智力大骗局来应对。

第二点,一个平均化后的统计结果,比如是方差更有意义?还是根据牌局本身来分析对手更有意义?

我需要知道一个SEESION我的风险有多大吗(比如偏离3个西格玛极低的发生概率)?对上一个不合适的对手(包括对手风格变化了),偏离几个西格玛不会是稀缺事件而更可能是常态,这正是我想说的,西格玛给人的错觉极大。

LTCM死在西格玛上,你可能会说,他死在杠杠上,当然,用了杠杠,加剧了风险,但根源在于对西格玛的信心,西格玛并不如想象般可靠,LTCM拥有2个诺贝尔获得者,牛人无数,模型复杂,很不幸,被西格玛表述的“小概率”事件击倒,在俄罗斯事件之前,也有一系列偏离均衡点很远的“小概率”事件发生,因为是小概率,所以不重视。。。







作者: dfu2012    时间: 2012-5-1 13:27
本帖最后由 dfu2012 于 2012-5-1 13:44 编辑
Howard 发表于 2012-5-1 12:48
德芙兄的大方向搞不懂,抓几个分论点说说吧


首先说明下,先一段段来,真不是辩论。

1.德州扑克的风险是,对手可以等待1000手牌,抓住你的弱点,一把清光你,强调多少遍都不过分。

意识流的写法就是快,破绽多,等待1000手牌不是说等好牌,是等你犯错的机会。重点在这里---抓住你的弱点。还真不是说岩石玩家,220把牌有一个AA,其他牌更不用说,AA只在翻牌前才是大牌,用这种牌清光对手,你我都知道可笑。清光对手最大的机会是大牌对大牌的时候,等翻牌前的大牌才打,那是很明显的LEAK,谁会支付这样的玩家。

我的整个观点都是以人为本,和以牌谱套路为出发点的模式不一样,岩石玩家基本就是大牌的套路玩家,不知道兄能理解我的辩解否?

我想说的是,深筹码,面对高手,我可以玩的很保守也可以很凶,做很多陷阱和假象,只要输的不多就行,当我熟悉你的哪怕是一个微小弱点,我用1000把牌等你犯错这个机会,比如在某种情况下,河牌你敢用非坚果牌全下,我就等这个机会,前面所有的输赢都是为了对付最后的这把清光。
作者: dfu2012    时间: 2012-5-1 13:39
本帖最后由 dfu2012 于 2012-5-1 14:40 编辑
Howard 发表于 2012-5-1 12:48
德芙兄的大方向搞不懂,抓几个分论点说说吧


设置了前提条件,才能叫做“同分布”的随机变量。即使你掷硬币,不也得设置前提条件吗:1. 无偏硬币 2. 扔的足够高以保证随机性 3. 不能有恒定风向
这样有前提条件的一次掷硬币,才能叫随机变量。


2.  什么样类型的数据才符合离散随机变量的特征,这点我还真没那个水平说的清楚。我能解释的是,在结果上,不具备某种明显的函数关系就算是离散型的,但,某些人的盈利特别多,某些人的盈利特别少,这个似乎要区别对待。

鱼玩家对鱼玩家,他们的输赢结果,还真可能是你说的随机正态分布。如果是高一级玩家对鱼玩家,数据很可能呈一边倒的趋势,SESSION数量小的时候,还不明显,数据多的时候,就是很明显的指数分布,原因我想高一级玩家的盈利数据并不完全是离散型的(部分数据是运气牌的结果,部分数据是对手犯错以及自己布置陷阱诱使对手犯错的结果)。

其实,德州玩家的收入在不同层次上呈现指数分布,而且在相同的级别上也有这样的自相似性,所谓幂律,正是这个现实的例子,很佩服曼布罗特。



作者: maomaobiao    时间: 2012-5-1 13:57
dfu2012 发表于 2012-5-1 14:13
老霍的方差我也看明白了,有前提条件的,特定的人,这个人不怎么变化,你也不怎么变,资金也不怎么变化,相 ...

我多费点口舌。你看东西虽然多,但是基础丢了

“我是坚决不认同这点的,因为数据源已经设定了前提条件,这本身就已经不具备离散型随机变量的特征,再用随机模型的正态分布是否合适呢?”

我不就你的这句话进行讨论,问你一个(一系列)问题:

那些具备离散型随机变量特征的数据,客观存在吗?如果存在,请举例。

正态分布,本身就是理想化的模型,现实中有什么是正太分布的呢?

你能想象出完美的随机数组是什么样的吗?
作者: dfu2012    时间: 2012-5-1 14:00
Howard 发表于 2012-5-1 12:48
德芙兄的大方向搞不懂,抓几个分论点说说吧


其实我和老霍的真正分歧在于:
我的观点:风险是不可度量的。抓住最大的风险来源即可。
老霍的观点:风险可以度量(当然是近似的)。西格玛已经很精确了。


这。。。。 这。。。。不可度量。。。。。不可度量,你怎么知道什么是“最大的风险来源”?不还是估计出来的吗?

------------------------------------

这个回答还真有点意识流了,风险不可度量,但风险的最大来源是对自己和对手的不了解,或者说风险的最大来源就是自己的错误。
说到底,兄追求确定性,追求可以量化的风险,我觉得知道风险从哪里来就好,关注自己,关注对手。

而更大的风险是没有意识到这点,比如过分对数据的依赖和信任,很重量级的例子就是LTCM,那帮人牛的程度可不一般。

说了个蔡泽和范睢的典故,范宰相做的好好的,秦王很信任他,蔡泽一个落魄到差点上树吊死的社会闲余人员,吃饭不给钱嘴里还说宰相的不干净,给人带到宰相府,然后开始了著名的说词,大意是:老兄荣华富贵一身,如今风口浪尖,身在风险之中却没有意识到风险,老兄的日子不多了,云云。。。
作者: maomaobiao    时间: 2012-5-1 14:01
dfu2012 发表于 2012-5-1 14:40
1.关于过度思考,前面我已经解释了,对一手牌我不会过度思考,有个大原则和大致的判断就好,
大原则是: ...

“但SESSION足够多以后,100%是老邱胜,这个不需要用方差。”

继续挑错,什么是“足够多”?此外,100%+/-0%,这个0%同样叫方差。

大数定理——给以足够多的次数,小概率事件必然发生。

你不觉得,上面的结论和你说100%老邱胜,是矛盾的吗?姑且认为你胜是小概率事件。
作者: maomaobiao    时间: 2012-5-1 14:04
dfu2012 发表于 2012-5-1 16:00
其实我和老霍的真正分歧在于:
我的观点:风险是不可度量的。抓住最大的风险来源即可。
老霍的观点: ...

如果说,“风险来自于自己,来自于对手” 这是一句废话,这么看真不过分。

因为,在这里它不需要证明,也没有任何用处。“抓住了最大的风险来源即可”,抓住了又如何?

调整?怎么调整?——数据。

懒得兜圈子了,累。
作者: dfu2012    时间: 2012-5-1 14:10
maomaobiao 发表于 2012-5-1 13:57
我多费点口舌。你看东西虽然多,但是基础丢了

“我是坚决不认同这点的,因为数据源已经设定了前提条件, ...

离散型随机变量模型的应用范围,经济学争论一直很多,这个论题争论下来,将会非常浩大。

我确实没这个能力。但把这个模型,应用到具备一定特征的结果集里面,我相信是不合适的,至少从现象看,德州扑克的盈利结果更像是指数分布。




作者: 伟大的墙    时间: 2012-5-1 14:12
dfu2012 发表于 2012-5-1 13:27
首先说明下,先一段段来,真不是辩论。

1.德州扑克的风险是,对手可以等待1000手牌,抓住你的弱点,一把 ...

我现在知道德福兄的问题在哪里了?

你可能特别害怕所谓的一把被人晴空。

我刚打牌的时候,也是特别怕一把被清,为什么呢。因为我怕all in
All 就是全部的意思

全部当然包括,1,我帐户里所有的钱2,房子,3,车,4,老婆5,孩子6,情人7小嫔8,等等

克真玩了几次,我才知道,我最多只输桌子上的钱。

这样,敌人等1000把清我一次,其它999把让给问,他肯定吃亏。

因为我无论玩任何game,桌子上的钱肯定不会超过我总财富的千分之一。你费了那么大劲,一把只赢走我那么少。
比如玩1/2,我桌子上很少超过3000,2/5过6000的时候也不多。
你赢走我6000,对我完全不算风险。而且多数时候这6000都是我在你等待观察我的那999把赢来的。所以你说的,其实是假设我一把输了全部身家性命,而不是桌子上那几千筹码。


不知道你在赌场打过牌没有。你的一切观点,特别象通过理论而产生出的理论。
作者: maomaobiao    时间: 2012-5-1 14:16
伟大的墙 发表于 2012-5-1 16:12
我现在知道德福兄的问题在哪里了?

你可能特别害怕所谓的一把被人晴空。

墙,你还是比我坦荡。

我只是在回复中暗示了一下scare money。小人常戚戚,说的就是我啊,这得改着点。
作者: dfu2012    时间: 2012-5-1 14:24
Howard 发表于 2012-5-1 12:48
德芙兄的大方向搞不懂,抓几个分论点说说吧

方差,以及方差的单位”西格玛“,正是用来衡量这些极端事件发生频率的啊。资金管理的全部意义,不就是尽量避免破产这个极小概率事件吗?怎么能说”西格玛认为极端事件可忽略不计“?   你说,方差不适合衡量极端事件,在我听起来,就好像说”大楼太高,咱别说多少米了,用米已经衡量不了了,咱就说它很高吧“ 一样,我不知怎么回应。


4,,用西格玛来度量会有很大的错觉,偏离三个西格玛发生的概率已经是零点几的概率(准确数字不清楚),6个西格玛就是火星撞地球吧。比如你说的一个SESSION,和特定的人玩,波动6个西格玛应该是火星撞地球了,如果对手请教了高手,并针对你的打法调整了自己的策略。偏离6个西格玛的盈利或亏损会很难发生吗?

     从学院派的角度,比如从数理出发,要反驳西格玛度量的观点,我确实心有余而力不足。不过我觉得德州扑克的重点不在数学。好在,这个论题即便是在学术界也是有大量争论的。所以面对数学殿堂的艰深,敢斗胆挑战西格玛的权威。
     
   我只能从逻辑,案例出发,比如LTCM,比如德州扑克的收入群体体现的指数分布形态,这种形态的分布实际对应了个体的输赢数据。


作者: dfu2012    时间: 2012-5-1 14:30
本帖最后由 dfu2012 于 2012-5-1 14:30 编辑
伟大的墙 发表于 2012-5-1 14:12
我现在知道德福兄的问题在哪里了?

你可能特别害怕所谓的一把被人晴空。


老墙,我去过赌场,玩21点,

以毒攻毒的时候去的,输了一些钱。

这帖子太长,你可能看了老霍的解释,以为我是岩石玩家,天大的冤枉啊,我后面有解释。

你那拉斯维加斯3的贴,马自达KX那把牌,TURN的处理不好,从数学上可以分析出来,RIVER的处理我个人觉得也不妥,露了破绽。
作者: 伟大的墙    时间: 2012-5-1 14:42
dfu2012 发表于 2012-5-1 14:30
老墙,我去过赌场,玩21点,

以毒攻毒的时候去的,输了一些钱。

是说K10他不停的靠那把吗?


其实你说的等着清光或被清,其实很少发生

以永利的2/5为例,你最多只能买1500上来

如果赶上某一天我赢到10000,可你只能买1500上来,你无法清光我。


你花了1000把时间,找出了我的破绽,不过赢走了我1500, who cares

某一天你用1500赢到1万了,我不一定有1万啊

当我们两个都有1万这小概率事件终于发生了,玩1000把现场要30小时,我也没体力陪到你把我的弱点琢磨清楚啊
作者: maomaobiao    时间: 2012-5-1 14:43
dfu2012 发表于 2012-5-1 16:24
方差,以及方差的单位”西格玛“,正是用来衡量这些极端事件发生频率的啊。资金管理的全部意义,不就是尽 ...

“比如德州扑克的收入群体体现的指数分布形态,这种形态的分布实际对应了个体的输赢数据。”

这句真心不懂,求解释。
作者: dfu2012    时间: 2012-5-1 14:43
maomaobiao 发表于 2012-5-1 14:16
墙,你还是比我坦荡。

我只是在回复中暗示了一下scare money。小人常戚戚,说的就是我啊,这得改着点。 ...

写了不少帖子,杂乱无章,可能只是对我自己有意义吧,无知者无畏的又一例证。

跟这个贴,毛毛兄多少会有浪费时间的感觉,我也不敢表示歉意什么的,因为这种表述很容易引起麻烦,如果我一直有惶恐的话,就是惶恐我于论坛是否已经有芙蓉哥哥的形象。

学院派可能对牌谱的分析更有兴趣,不如看看这个帖子,数学在这种情况下还有点用处,我也不知道这么分析是否合理,如果结合牌桌上对手的信息能得出更多有价值的吧。

http://www.zhiyoucheng.com/thread-5616-1-1.html
作者: maomaobiao    时间: 2012-5-1 14:45
dfu2012 发表于 2012-5-1 16:43
写了不少帖子,杂乱无章,可能只是对我自己有意义吧,无知者无畏的又一例证。

跟这个贴,毛毛兄多少会有 ...

芙蓉哥哥不至于。

geek vs geek的惺惺相惜倒是有那么一点点。

我针对你的回复,应该都不是getting personal的,不用多想。
作者: dfu2012    时间: 2012-5-1 14:50
maomaobiao 发表于 2012-5-1 14:43
“比如德州扑克的收入群体体现的指数分布形态,这种形态的分布实际对应了个体的输赢数据。”

这句真心不 ...

幂律,很漂亮的一个东西。
十成人里,2成人占据8成人的收入,

在2成人里,又是2成人占据8成人的收入,

自相似性,比如海螺。

德州扑克只是一个例证,演员,作家的收入都可以证明幂律在现实中的存在和意义,我个人觉得,这比方差好多了。

德州扑克的风险虽然大,但等级不同带来的收入指数化分布才是最有魅力的地方。

也只是有个大概的概念,深到里面的也读不懂,认识上大致上能更接近真相即可。
作者: maomaobiao    时间: 2012-5-1 14:51
本帖最后由 maomaobiao 于 2012-5-1 16:53 编辑
dfu2012 发表于 2012-5-1 16:50
幂律,很漂亮的一个东西。
十成人里,2成人占据8成人的收入,


问题是,怎么由这个推出

“这种形态的分布实际对应了个体的输赢数据。” ?

赢家,高级别的grinder,其收入也远远大于低级别的松浪鱼,这符合指数形态。

但是,这两个人的输赢数据,却是完全不一样的。嗯
作者: dfu2012    时间: 2012-5-1 15:02
本帖最后由 dfu2012 于 2012-5-1 15:04 编辑
maomaobiao 发表于 2012-5-1 14:51
问题是,怎么由这个推出

“这种形态的分布实际对应了个体的输赢数据。” ? ...



分形几何学的基本思想是:
客观事物具有自相似的层次结构,局部与整体在形  分形几何图
态、功能、信息、时间、空间等方面具有统计意义上的相似性,成为自相似性。百度来的。

法国数学家,曼德尔勃罗特,很牛的一个数学家,他的思想与钟形曲线这种正统类型的相对立,通俗点说,我的理解,他根本就不鸟方差这些玩意,可想老曼当初有多艰难。。。

没有这种级别的大佬在后面,我敢在老霍这里瞎喊方差的风险。搞半天,实际上我就是个搬运工,只不过搬到最后才有这块,以前也拿过,老霍很友善的礼貌了一把,概念太多。。。
作者: maomaobiao    时间: 2012-5-1 15:13
dfu2012 发表于 2012-5-1 17:02
分形几何学的基本思想是:
客观事物具有自相似的层次结构,局部与整体在形  分形几何图
态、功能、信息 ...

分形是一个我不敢说特别擅长的领域,但是,你给出了那么多分形的思想,却没有解释我的疑惑。

以我有限的审稿经验,见到用分形吹水的稿子,我基本默认毙掉,偶有觉得有意思的也说自己不是这个领域的,要求换审稿人。

回到你的“形态相似”的结论。

如果说收入的分布,和玩家个体money总量的输赢是相似的,那难道不又是一句废话?

有意义的,Howard讨论的是,这个输赢的money的总量是如何得来的?grinder?还是胡抡?

如果是10000手牌赢了几个bb,风险小,方差小,收益不好,要换打法。

如果是100手牌就能输掉全部BR,那不管你的BR是多少,都应该降级。

那么,这个“风险”的讨论,才是有意义的。
作者: maomaobiao    时间: 2012-5-1 15:15
dfu2012 发表于 2012-5-1 17:02
分形几何学的基本思想是:
客观事物具有自相似的层次结构,局部与整体在形  分形几何图
态、功能、信息 ...

算了,我有点咄咄逼人了,你也有些闪烁其辞。

这楼能歪到分形,有些超乎我的想象。就此打住。
作者: maomaobiao    时间: 2012-5-1 15:42
本帖最后由 maomaobiao 于 2012-5-1 17:43 编辑
maomaobiao 发表于 2012-5-1 17:13
分形是一个我不敢说特别擅长的领域,但是,你给出了那么多分形的思想,却没有解释我的疑惑。

以我有限的 ...


再啰嗦一句回家。

这里再次体现了尺度和概率应用范围的关系。

以海量的玩家为尺度来观察,他们的输赢多少——指数形态其实和什么技术、运气都没关系,只和BR、级别相关。

以某一手具体的牌为尺度来观察,又仿佛是完全不可知的随机形态。

但是,在这两个尺度中间,的确存在一个可以度量的概率分布形态,让我们得以判断自己的技术,是否适合当前的级别。

“风险”、西格玛,就是这样一个度量,是可知的。
作者: dfu2012    时间: 2012-5-1 15:52
本帖最后由 dfu2012 于 2012-5-1 15:55 编辑
maomaobiao 发表于 2012-5-1 15:13
分形是一个我不敢说特别擅长的领域,但是,你给出了那么多分形的思想,却没有解释我的疑惑。

以我有限的 ...


帖子打开的非常慢,

一般都是自己思考自己理解,不大做搬运工,好容易搬了块分形的砖,没想到被砸的这么直接,分形几何的地位这么低?搞到和卖狗皮膏药一般?我没说南美蝴蝶引发地震吧。

前面帖子说了我只是知道这个概念,深入的东西我也不懂,没有搞懂的动机,估计也没有搞懂的能力。

但,这一切不妨碍我觉得老曼是个非常优秀的数学家。真不知道分形几何在学院派的围堵下如此恶劣,你想砸了大家吃饭的东西(西格玛,不搞数学应用的有几个鸟这概念的?),大家能鸟你吗,不由得更佩服老曼了。

回到这个主题,作为群体,赢家的收入按等级呈指数类型分布,这个已经是不争的事实,那么作为个体,从每个SEESION或者每手牌的输赢分布看,是更符合正态分布呢?还是符合指数分布的特点?

我的答案是:还是符合指数分布的特点,这点我从很多人的帖子里有认识,主要的盈利来自几个大的SESSION,主要的亏损也来自几个大的。也就是说8成的收入来自2成的SESSION,而2成SEESION里的8成收入又来自2成的牌。

这种有规律的幂律分布正是由玩家水平差异带来的,如果真是一群水平相当的鱼互相玩或者职业玩家在互相玩,那可能真是理想中的丢硬币了。所以要避免和水平类似的玩家玩,仅仅从金钱上看,浪费时间精力,不如去百家乐。






作者: dfu2012    时间: 2012-5-1 16:14
本帖最后由 dfu2012 于 2012-5-1 16:36 编辑
maomaobiao 发表于 2012-5-1 15:42
再啰嗦一句回家。

这里再次体现了尺度和概率应用范围的关系。


我似乎觉察到了你的一些变化,但这个变化你自己可能也没有意识到。


你的话:以某一手具体的牌为尺度来观察,又仿佛是完全不可知的随机形态。

一手牌或者一个SEESION的概率没有太大的意义,我很多帖子对这点说了很多遍。

这个你帮了老霍的倒忙,老霍提到过一个SEESION,输多少个西格玛的概率,这恰恰是我想反对的,去预测一手牌或一个SESSION的概率真没有意义,因为一手牌的输赢有随机的运气牌带来的风险,还有人为的错误带来的风险,人错误的风险可控,运气牌的风险不可控。

你的话:以海量的玩家(最好改成“对局”)为尺度来观察,他们的输赢多少——指数形态其实和什么技术、运气都没关系,只和BR、级别相关。

这里,你承认,玩家的输赢在海量的数据面前,具备了某种指数分布形态,只和BR,级别(水平)有关。
但是,根据大数原则,样本越多,不是越接近正态分布吗?



你的话:但是,在这两个尺度中间,的确存在一个可以度量的概率分布形态,让我们得以判断自己的技术,是否适合当前的级别。
我得承认,GRINDER模式接近这个论断。他们基本无论对手什么样的,都是固定模式应对,结果好坏完全取决于对手水平的随机分布。

可这个论断把德州扑克最有魅力的地方抹杀了,做德州扑克的GRINDER,不如换个行业,成就比这会好很多。


就我个人而言,我的理想是能做个德州扑克的GRDINER已经很满足了,不是每个人都有那么多选择,唉,又意识流了。








作者: monox    时间: 2012-5-1 16:39
通篇文章,老霍的两个观点我都看明白了。

DFU由于文章写得太长,太玄奥,我虽然很认真在看,看懂得地方不是很多,不是每个字是什么意思不明白,每句话也很好理解,不明白的地方可能在于,为什么老霍写了两个帖子就能明白的内容,DFU写了很多很多,还是不明白老霍的意思。


当然比起看热闹,我更喜欢吸收营养,我觉得DFU的知识面还是很广的,比如引入了“幂律”这个概念,我就本着很务实得精神落实了一下,发觉这个原来离我们生活并不远,比如著名的二八理论,比如前几年有名的 长尾战术 ,这些似乎都和幂律规律沾边吧。

后来我更恍然大悟了,上面这个例子不就是幂律最好的证明嘛
作者: monox    时间: 2012-5-1 16:44
注意,对于为什么幂律规律更符合扑克这一点,我还是不是很命白,如果单单从收入来说,这和风险的讨论似乎没有相关性,其他我不关心,就这一点,希望有机会DFU兄可以再指点下。
作者: dfu2012    时间: 2012-5-1 19:03
monox 发表于 2012-5-1 16:44
注意,对于为什么幂律规律更符合扑克这一点,我还是不是很命白,如果单单从收入来说,这和风险的讨论似乎没 ...

太客气了,我也没有很清晰的理解,当初引这个话题,啰嗦这么多,也是想搞明白怎么回事。

但数学功底和对德州扑克的认识都不够,所以想抛砖引玉。

帖子里从数学来说不严谨的地方很多。

我的理解比较粗糙,风险和收益是孪生兄弟,一手牌的风险=随机牌运气牌的风险+犯错牌的风险,具体来说,风险的大小,风险发生的几率,

其实收益也可以这么表述,一手牌的收益=随机牌运气牌的收益+避免犯错或者引诱对手犯错带来的额外收益。

这么表述从数学上看确实不大严谨,没仔细考虑。

我也是从直觉上感觉牌手的每个SESSION(每手牌)的盈利分布可能是符合幂律分布的,最好的做法就是直接用计算机统计下,看下不同的收入分布是更符合幂律还是更符合正态分布。

这比我在这里瞎扯好多了。


作者: maomaobiao    时间: 2012-5-1 19:49
dfu2012 发表于 2012-5-1 18:14
我似乎觉察到了你的一些变化,但这个变化你自己可能也没有意识到。

好吧,也许是我没有意识到。不过我说的一点,你可能也没意识到。

“尺度和概率应用范围的关系”

其中提到的三个尺度,不一样,但是观测的数据,却是一样的。

你不能因为近距离观察某一个点的随机性,无规律性,就否认这个点在一个集合里的确定性和可知性。

你也不能因为一个集合的固有的特性走向宿命论,因为其中个体的随机和巧合才是过程的美妙,生命的华丽。

也正是由此,像刀友 不让孙 那样的人才会说,要一辈子当赌徒,因为他是在品味过程的美好;

也正是由此,有不少长期盈利的grinder选择离开,因为有些东西一旦“确定”,就没有意思了,再好的东西变成每天重复的工作,都会无聊。
作者: maomaobiao    时间: 2012-5-1 19:53
dfu2012 发表于 2012-5-1 17:52
帖子打开的非常慢,

一般都是自己思考自己理解,不大做搬运工,好容易搬了块分形的砖,没想到被砸的这么 ...

我愿意相信分形有科学的道理和理性的应用。

只不过,我所看到的大多数人关于分形的解释与应用,包括你在内在此的引用,都无法让我信服。

所以,我的cynical就习惯性发作了。
作者: maomaobiao    时间: 2012-5-1 20:03
maomaobiao 发表于 2012-5-1 21:53
我愿意相信分形有科学的道理和理性的应用。

只不过,我所看到的大多数人关于分形的解释与应用,包括你在 ...

I'm open minded, and I am confident to say I am picking ideas fast. Here is some reading from wiki

----------------------------------------------
Validating power laws

Although power-law relations are attractive for many theoretical reasons, demonstrating that data do indeed follow a power-law relation requires more than simply fitting a particular model to the data. In general, many alternative functional forms can appear to follow a power-law form for some extent (see the Laherrere and Sornette reference below). Also, researchers usually have to face the problem of deciding whether or not a real-world probability distribution follows a power law. As a solution to this problem, Diaz[8] proposed a graphical methodology based on random samples that allow visually discerning between different types of tail behavior. This methodology uses bundles of residual quantile functions, also called percentile residual life functions, which characterize many different types of distribution tails, including both heavy and non-heavy tails.

A method for validation of power-law relations is by testing many orthogonal predictions of a particular generative mechanism against data. Simply fitting a power-law relation to a particular kind of data is not considered a rational approach. As such, the validation of power-law claims remains a very active field of research in many areas of modern science.

-----------------------------------------------

不明白英语的童鞋,上面的大意就是:如果不是为了科研的目的的话,现阶段研究幂律就是在浪费时间,有空干点啥都行。
作者: maomaobiao    时间: 2012-5-1 20:25
本帖最后由 maomaobiao 于 2012-5-1 22:27 编辑
dfu2012 发表于 2012-5-1 18:14
我似乎觉察到了你的一些变化,但这个变化你自己可能也没有意识到。


“这个你帮了老霍的倒忙,老霍提到过一个SEESION,输多少个西格玛的概率,这恰恰是我想反对的”

这里我不认为我帮了倒忙。

某一手的随机性,和某一个session的不稳定性,其“风险”和西格玛是不可同日而语的。一个session的西格玛,也是有意义的。

懒得翻老霍的原文了。然则,概率、统计,这二者其实有细微的区别。预测一个session输多少西格玛的概率,是建立在对过去大量的数据的统计的基础之上的,依我对老霍的了解,他肯定会有“比方说你xxxx手牌的输赢数据是xxxx”这样的条件。

你要反对,也要言之有物。一句不在西格玛,在人,着实有搂风的感觉,跟了几帖这么多楼,仍然感觉如此。

我能理解你对扑克的思考,思考是好的,固然,我无法接受一些你的结论。这样吧。
作者: maomaobiao    时间: 2012-5-1 20:47
本帖最后由 maomaobiao 于 2012-5-1 22:48 编辑
maomaobiao 发表于 2012-5-1 22:03
I'm open minded, and I am confident to say I am picking ideas fast. Here is some reading from wiki ...


仅从我获取的有限的信息来看,幂律,也是一种规律和模型,从数据与模型的关系的角度看,幂律和正态分布模型并没有本质的不同。

所以,你用数据与模型的关系,以及哪个模型更接近数据的真实情况,这两个论据,否认“风险”概率的可知性,是不合时宜的,算是一个逻辑硬伤。

抑或,你本来就想说风险应该用幂律来度量?那我更进一步,用幂律这个模型来度量的表征是什么呢?

这和我们刚开始争论的,“风险”在人心,可不可以度量,才是最大的分歧。

绕了一圈,兜回来,幂律和正态分布的分歧也就不那么重要了。

因为,我相信,当今研究幂律的科研工作者都是本着应用这个模型,对数据给出更好的解释,乃至预测的目的。只不过,现阶段能用的,最佳的模型,还是让我们着眼正态分布和西格玛吧。
作者: maomaobiao    时间: 2012-5-1 20:56
maomaobiao 发表于 2012-5-1 22:47
仅从我获取的有限的信息来看,幂律,也是一种规律和模型,从数据与模型的关系的角度看,幂律和正态分布模 ...

补上数据和观测尺度的关系,以及观测尺度对于概率应用范围的影响。注意图中坐标轴的变化,三个图用的是同一组数据,Excel自带的随机生成函数,姑且认为是“随机数”。

对于这样的数据,你认为它是一个点,一团杂乱无章的点,还是一个有规律的pattern,完全取决于你的高度。

希望对大家理解我的话有一个直观的帮助和感性的认识。

[attach]1855[/attach]
作者: Howard    时间: 2012-5-1 22:17
我得妈妈呀,一觉起来,十几楼盖到了快50楼。maomaobiao兄谢谢你的帖子,你说的仍然基本是我要表达的意思。

我想说的是,德芙兄不必担心你我之间是为了争辩而争辩,咱说的都是就事论事,客观事实,不是争任何主观的东西。更不是前段时间有的争辩贴,到最后都演变成双方都急吼吼的要证明“我牛逼,你傻逼”。我感觉你我之间的这个系列,顶多会稀里糊涂不了了之,不会变成二逼之争的那个样子。这里我必须得夸赞一下德芙的辩品。

这些帖子中,我还是捡着我能看懂(至少自认为看懂)的您的片段来说事。这次我看到您反复强调的一个观点:

牌手的每个SESSION(每手牌)的盈利分布可能是符合幂律分布的,。。。而不是正态分布
(注意上文并不是完全直接引用,经我的改写简化,如曲解了您的意思,请指出)

幂这个字,不跟“杨”连在一起,还真引不起我的兴趣。。。。  好吧,假定我们研究每手牌的盈利分布。(其实fullring的每圈牌的盈利分布更合适,因为不同位置的盈利分布显然是不同的)幂律不就指数分布吗?指数分布接近零时无穷大,接近正无穷时则无穷小。而每圈牌的盈利,大部分是很小的输赢,比如丢了个盲注;只有少数,才是清了别人翻倍或者3倍;或者被别人清,一下变0。这样中间大,两头小的形状,更像正态分布的钟型图,而不是一头大一头小单调递减的指数分布。

当然,这个分布跟正态分布的差异也很大。那么它到底是什么分布呢?数学上恐怕没有一个专有名词来描述它。不过,无法描述、我们知之甚少的分布并不代表着我们无法研究它。事实上,正态分布正是研究它的利器。且听我慢慢将来。

我们想一想,我们最关心的扑克的风险到底是什么?一手牌(一圈牌)的输赢吗?不是,是连续的这些手(圈)牌的盈利之和。所谓下风期,上风期,不就是连输、连赢吗?我们就是要找出这些小概率的连赢、连输事件的发生频率,以及到底能连赢、连输多少钱(更关心连输,因为涉及破产)。

那么,既然一圈牌的盈利是一个我们没有充分了解的奇怪分布(非幂律、非正太、非均匀、非一切数学书中的专有名词),很多圈牌之和,它们的分布,岂不是更神秘,更多变量,我们更无法研究了吗?

解决问题的关键就在所谓“中心极限定理”。定理内容是:“独立同分布、且数学期望和方差有限的随机变量序列的标准化和以标准正态分布为极限”。

翻译成人类的语言,是说:大量随机变量之和近似服从正态分布,甭管你这些变量本身是什么分布的。幂律也好,均匀也好,还是自己就已经正态了也好,他们加起来,就是正态分布。实验次数越多,近似程度越高。

中心极限定理的发现,最初是因为人们研究二项分布。所谓二项分布,就是抛硬币。硬币未必是公正的,正面向上的次数为p,抛的次数为n。则参数为n, p的二项分布以np为均值、np(1-p)为方差的正态分布为极限。n越大,越近似正态分布。n超过20,其分布已经很像正态了,超过几千几万,那简直就是像得不得了。

换句话说,你抛1000次,如果硬币均匀,那正面出现的次数是以500次为中心,西格玛为16左右的一个钟形曲线。其完美程度,会让你觉得,这本身就是标准正态分布。

再后来,人们发现,不光是二项分布,任何的分布,只要是试验次数多了,它们的和都接近于正态分布。

比如,60岁以上的人,每年内平均死亡概率大概是3%。人寿保险公司给1百万个这样的人上了保险,它要关心的是:明年死亡的人总数是多少?因为1百万足够大,所以这个死亡总数,也是个完美正态分布,高度可预测。西格玛又粉墨登场。你说,61岁死亡可能1%, 78岁却高达10%,90岁高达20%,你那个平均3%都没考虑到人年龄的不同,更何况人还有抽烟喝酒得癌症的,还有天天泡妞跑马拉松的,最大的风险来自于个人习惯,用西格玛是错误的。。。。。。 这都没事儿,只要我有100万人就行,它就中心极限了,就正太了。

举个扑克的例子,某人一小时的扑克成绩,是这样的一个分布:20%的情况赢100,30%的情况在(-50,50)之间均匀分布,50%的情况输(-1000,-800)之间的指数分布。这是个奇形怪状的,不可用数学语言来描述的怪异分布。但即使这样的分布,也没关系,只要每个小时的分布都是这个样子,此人打1000个小时后的分布,就非常接近于正态分布,且均值、方差均可得知:1000u, sqrt(1000)*sigma

中心极限定理是已经证明的数学定理。(顺便说一下,数学定理是可证明的;物理定理只能区分为两类:已经找到反证和尚未找到反证的,不能证明。)证明过程虽然不长,但要用到比较高的数学技巧,我就不贴公式了。链接:http://en.wikipedia.org/wiki/Central_limit_theorem

中心极限定理的完美之处就在于,你不必再拘泥小随机变量的分布的形状,只要这些小变量都是同分布的,甚至近似同分布的,则他们的和就是正态,概莫能外。

如果打扑克,考虑对手的不同,心态的变化,致使每手牌、每个小时、每天等不能再看成完美的同分布随机变量。但正态分布和中心极限定理仍然有巨大的实用度:我过去一年,大概是赢2/3的session,平均每session盈利400,session标准差900;那么明天对同样的一波对手,在同样的赌场,我差不多的心态,我仍然可以做出如下预期:我有2/3的可能是赢家,盈利是以400为中心,大概有68%的可能是(400-900,400+900),有95%的可能是(400-1800,400+1800)

作者: Howard    时间: 2012-5-1 22:28
maomaobiao 发表于 2012-5-1 20:47
仅从我获取的有限的信息来看,幂律,也是一种规律和模型,从数据与模型的关系的角度看,幂律和正态分布模 ...

对呀,我说了半天,没有你一句话扎在尾椎骨那么深刻。

既然德芙兄说,风险不可度量,那还幂律干嘛?你把幂律搞出来,且不说我根本不同意它符合什么杨幂绿,你的目的不还是为了度量风险?

到底现在是 杨幂 vs 正太,还是 可度量 vs 不可度量?
作者: dengxianqi    时间: 2012-5-2 00:52
dfu2012 发表于 2012-5-1 14:10
离散型随机变量模型的应用范围,经济学争论一直很多,这个论题争论下来,将会非常浩大。

我确实没这个能 ...

“至少从现象看,德州扑克的盈利结果更像是指数分布。”

我自己记录了自己125个session的输赢结果,刚才做了个简单图形,
按照500元作为区间,统计每个区间出现的个数,得到附件的图。
这个结果,貌似更像是正态分布。

注:所有数据来源,来自我在北京、上海、广州,澳门的34个不同的场子,
盲注大小涵盖1-2, 2-5, 5-10,10-25, 25-25,25-50,时间跨度将近11个月,
面对的对手千差万别。
作者: dfu2012    时间: 2012-5-2 20:08
本帖最后由 dfu2012 于 2012-5-2 22:55 编辑
dengxianqi 发表于 2012-5-2 00:52
“至少从现象看,德州扑克的盈利结果更像是指数分布。”

我自己记录了自己125个session的输赢结果,刚才 ...


图很早就看到了,这贴写的也吃力,本不想再续,想想再啰嗦几句大白话。

从图看,我觉得不是正态分布的形态。正态分布的精华我想是西格玛的概念,西格玛用来度量风险,离中心偏离的越远,事件发生的几率越低,比如3个西格玛外是(1-99.73%)即千分3。
当然没有真实的正态分布,所以又有了分布中心漂移,不管怎么说,远离中心区域的地方发生几率是非常低的。

我个人认为,如果远离中心区域4个西格玛还有1%的发生几率,那么西格玛对风险的度量就要打个问号,如果远离中心区域6个西格玛还能有1%的发生几率,可以说这个模型是无用的。


注意你图中的远离中心区域的突起,如果样本足够多,会发现很多这样的突起,按西格玛的计算发生几率都会相当低的(很可能比现实有一个甚至几个数量级的差异,这就会低估风险),但却实实在在的发生了,反映在现实里,就是有时候你的下风会输掉40个BUYIN,如果你的西格玛是4个BUYIN的话,那么按正态模型算出来发生的几率是天文数字,但发生了,虽然很少,但还是发生了。

你图中还有很多地方可以值得思考,偏离中心区域左边发生的事件明显多于右边,但右边的事件(注意38那个位置)给你带来12000的收入,这是个低概率事件,但权重不低,而你最大中心值的利润才2万7左右。另外51那个位置还有个2500的收入,权重也不低。

如果把这个方差算出来,然后再算回发生12000收入的事件概率,我相信会远远低于你这图里真实事件本身发生的概率。

这个图有说法的地方还会有,比如样本数量,级别差异等等,但已经很能说明问题。

这个主题讨论了很久,怎么都没个说法,大家各说各的,那么我的主题究竟是什么?

其实从一开始到后来,反复啰嗦的是:西格玛这个东西会带来极大的风险错觉

资金管理等当然要,简单的原则已经管用,用西格玛的害处是低估风险,

什么是西格玛的低估风险? 偏离中心区域5个西格玛,理论上是PPM级别的几率,但是在德州扑克中见不见到?我觉得并不少见,比如连续五十个BUYIN的输赢(假如西格玛是5个BUYIN以下)

DAVID4FUN兄在我那贴关于这个主题回复,我也这里一并说了,LTCM用杠杠是输的原因之一,但不是根本原因,他们用的就是基于西格玛度量的风险模型,比如西格玛告诉他们这个事件发生的机会是亿万分之一,算算期望,OK,投入,他在全球做海量的交易,正是这种由西格玛度量的几乎不可能发生的风险发生了,于是崩溃了,以前也发生过这种小概率,但损失还不伤筋动骨,所以不重视,最后俄罗斯崩溃几十个亿。


低估风险永远比高估风险要危险的多的多,有了西格玛这种复杂的工具,对离散度很高的数据,进行数学加工,便觉得对风险有了更好的认识,可以避免风险。这种风险才是更大的风险。

在很多贴,都反复说这句话:处在巨大的风险之中,还没意识到风险,这才是最大的风险。我这么说更多是从自己的角度出发,未必有什么针对,更可能就是说给自己听的,这话其实有益无害,任何行业任何经历都可以套的上去,说没有用一点用没有,说有用用处很大,关键在时机吧。

一般来说,骄傲的人听不进这句话,没有沉痛经历的也不容易听的进。






补充内容 (2012-5-3 22:20):
惭愧,由历史数据算出来的方差,其正态分布一定能覆盖所有的历史数据。
明显的逻辑错误,唉,没啥说了。
作者: maomaobiao    时间: 2012-5-3 15:08
本帖最后由 maomaobiao 于 2012-5-3 17:13 编辑
dfu2012 发表于 2012-5-2 22:08
图很早就看到了,这贴写的也吃力,本不想再续,想想再啰嗦几句大白话。

从图看,我觉得不是正态分布的形 ...


今天才看到这个回复。应该是精化了。

只是我在想,传达这个概念真的需要这么长的讨论吗?直需一句话:

任何模型都不能完美地表述数据的全貌。

至于使用某个关于风险的模型,是不是本身就带来了“巨大的”风险,我保留。

坐飞机有出意外的风险,但是不能因为风险的后果严重,就说这个风险比开车在高速上行驶出意外的风险要大。

你说的LTCM的例子,姑且不论他们使用的模型是否恰当:但是,不能因为它们损失惨重,就说风险大,说白了就是小概率事件的必然发生,而已。
作者: Howard    时间: 2012-5-3 21:05
赞同楼上maomaobiao的话。简单道理足够了。

德芙兄的51楼回复,重点加粗了一句话“西格玛这个东西会带来极大的风险错觉”。 我还是那句话:西格玛是个度量单位而已,怎么会带来错觉?你只说会带来,但怎么带来?

而且德芙兄用dengxianqi的数据本身,就得出西格玛带来风险错觉的结论,我也看不懂。请问您是怎么根据这个图形算出西格玛,以至于说他偏离中心的程度偏高的?

如果根据这些数据,构造一个正态分布函数的话,那么西格玛的值就是能保证大约“3个西格玛外千分之三”的那个值。这是西格玛的定义。您的话,等于是说:邓的数据中,发生概率千分之三的事件发生了远超千分之三。这岂不荒谬?

就好象在没有通用长度单位时,有人定义了米。米的定义是,北极到赤道的一千万分之一。结果定义完了,有人说,米这个概念不行,容易产生长度错觉,北极到赤道长度远超一千万米。我只能说,请这位提问者看一看手里的是不是米尺?
作者: dfu2012    时间: 2012-5-3 22:41
Howard 发表于 2012-5-3 21:05
赞同楼上maomaobiao的话。简单道理足够了。

德芙兄的51楼回复,重点加粗了一句话“西格玛这个东西会带来极 ...


历史数据计算出来的方差,其正态分布一定会覆盖所有的历史数据。
我犯了很明显的逻辑错误。

也可见,我之前的很多地方必定有类似的逻辑错误,所以不仅仅是思维点不同造成彼此的交流困难,某种程度也是我的无知和逻辑混乱造成这种状况。

本不想回这贴了,想想论坛高人无数,发现这个问题的很可能不只你一个,特回帖,感谢你的指正。


作者: dengxianqi    时间: 2012-5-3 22:54
dfu2012 发表于 2012-5-3 22:41
历史数据计算出来的方差,其正态分布一定会覆盖所有的历史数据。
我犯了很明显的逻辑错误。

我喜欢你的这种讨论态度!哈~

犯错谁都会有啊,不讨论怎么知道自己犯了错?老霍肯定也犯错,下次你来揪出来,哈






欢迎光临 智游城 (http://zhiyoucheng.co/) Powered by Discuz! X3.2