智游城

 找回密码
 注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 4031|回复: 15
打印 上一主题 下一主题

恒星距离引发的疑案

[复制链接]
跳转到指定楼层
#
Howard 发表于 2015-6-5 02:43:07 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
今天中午正在吃午饭,不知为什么,我突然想起恒星距离的话题。仅在银河系,就有一千亿颗以上的恒星,而最近的恒星到我们也有4光年多,算成英里那得数不清多少零了。

由此又想到,在晴朗的夜空随便指一颗恒星,其跟地球的距离大概是高度随机的,因为恒星距离地球横跨若干个数量级,最近的几光年,而银河系有十万光年尺度。就算不理会其河外星系,这随机度也足够了,至少够我下面这个实验:

这实验测定该恒星和地球距离,用英里来表述,则此数字的最高位,感觉应该是个纯随机数,在1-9之间均匀分布。 这结论应该没什么问题,你凭啥说3百亿多英里就多于或者少于6百亿多英里的

或者,再加一个前提,假设宇宙所有恒星均可见,这样就避免了“可视范围太窄”这样的非数学因素捣乱。

这结论出来后,再把这星地距离从英里换算为公里,就很有意思。

英里乘以1.6得到公里数,这大家都知道。

最高为9/8/7和部分6开头的英里数,换算为公里之后,其最高为都变成了1
比如,7亿英里变成11.2亿公里。

如果英里数的最高位(以下简称m)是1-9均匀分布,那么公里数的最高为(以下简称k)就不是均匀分布了,而且差别很大。
k是1的概率,远高于是其他任意一个数字的概率

这显然是荒谬的。因为英里和公里在这里是人工随便选择的,并不具有特殊意义,按照上述逻辑,如果我一上来就用公里测量的话,k就是应该符合1-9均匀分布的哪一个。

问题出在哪里?

后来我找到了本福特定律也叫首位数定律

分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
收藏收藏2
15#
ulala 发表于 2015-6-13 01:13:13 | 只看该作者
Howard 发表于 2015-6-10 01:00
本福特定律不仅可以预测最高为,还可以预测第二位。

上贴的式子提到,一堆符合本福特定律的数字,其最高为 ...

挑个骨头,可以推论第n位数字为某个数的概率随着n的增大会变得越来越符合均匀分布,但是不能说末尾数位某个数字的概率也是符合均匀分布的。末位数所在的位数不是固定的啊。

比如说末尾数为1的概率应该是 Pn(1) * Pd(1, 1) + Pn(2) * Pd(2, 1) + Pn(3, 1) * Pd(3) + Pn(4) * Pd(4, 1)... + Pn(x) * Pd(x, 1),其中Pn(n) 是一个数的位数为n的概率,Pd(m, n)指的是一个数第m位为n的概率,x是所考虑的数的最大位数。


如果所考虑的数的位数非常大,那各个数字在末位的概率可能差别还不是很大,否则的话,其差别可能还是很明显的(未经验证)。


从另一个角度说,Howard提出的对首位数的悖论对末位数也一样成立不是?
14#
ulala 发表于 2015-6-13 00:33:16 | 只看该作者
donot 发表于 2015-6-6 06:04
首位数不是随机分布的,末位数是。如果是十进制,首位数与单位无关。

末位数也不是随机分布的
13#
snowsnow 发表于 2015-6-12 01:50:43 | 只看该作者
本帖最后由 snowsnow 于 2015-6-12 01:52 编辑
snowsnow 发表于 2015-6-12 01:33
从不知道他研究的那个猜想有啥NB的。

数学大师丘成桐: 没谁认为哥德巴赫猜想是皇冠上的明珠。

当然他水平很高,
好比我们就知道常用几千个汉字,
据砖家说汉字有30万个(?),好些只有专家认得,
12#
snowsnow 发表于 2015-6-12 01:33:58 | 只看该作者
本帖最后由 snowsnow 于 2015-6-12 01:37 编辑
wzq 发表于 2015-6-10 14:58
如果陈景润全职打扑克,那会是啥样,还不得搞出个德州布拉夫猜想。

从不知道他研究的那个猜想有啥NB的。

数学大师丘成桐: 没谁认为哥德巴赫猜想是皇冠上的明珠。

11#
wzq 发表于 2015-6-10 14:58:01 | 只看该作者
如果陈景润全职打扑克,那会是啥样,还不得搞出个德州布拉夫猜想。
10#
haoqianruhaose 发表于 2015-6-10 11:46:35 | 只看该作者
跪拜数学大神
9#
 楼主| Howard 发表于 2015-6-10 01:00:50 | 只看该作者
本帖最后由 Howard 于 2015-6-9 21:58 编辑

本福特定律不仅可以预测最高为,还可以预测第二位。

上贴的式子提到,一堆符合本福特定律的数字,其最高为数字为d,则d出现的概率满足:
P(d) = log(d+1) - log (d)
注:log 以10为底

其实,把最高位d换成数字本身n,一样成立。
P(n) = log(n+1) - log (n)

这样,我们就可以计算第二位数字的出现频率。

比如,“2”出现在首位的概率是17.6%,那么2出现在次位的概率是多少?
2出现在次位,首位可以是1到9
所以只需计算前两位是12、22、32.。。。。。92的概率,加起来就行了

log(13)-log(12)  + log(23)-log(22)  + .....  + log(93) - log(92) = 0.109

第二位可以取0,所以有10种可能,如果平均分布是0.1

可见次位的分布就均匀的多了。到了末位,基本就跟7楼说的一样,均匀分布了。
8#
 楼主| Howard 发表于 2015-6-10 00:53:08 | 只看该作者
本福特定律的数学表达是:

一堆符合本福特定律的数字,其最高为数字为d,则d出现的概率满足:
P(d) = log(d+1) - log (d)
注:log 以10为底

这什么意思呢?也就是说,最高位的概率满足对数尺度的均匀分布。或者再说开了,也就是说所有的数据都满足对数尺度的均匀分布。

什么叫对数尺度?可能大家看股市走向是接触最多。下面道琼斯近30年来的图形。第一个是正常尺度,第二个是对数尺度:


在正常尺度下,显示的是绝对数值的变化,所以前期股市的波动都变得无限小,后面的波动现得很大。
而对数尺度下,股市从100点到150点,其变化看起来跟10000点到15000点一样的规模。

对数尺度在数轴上的表示是这样的:


如果把恒地距离、股市指数等数据标注在这个数轴上,应该是大致均匀分布的。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
7#
小胖 发表于 2015-6-6 08:00:53 | 只看该作者
老霍打个酱油都这么高深。
6#
donot 发表于 2015-6-6 06:04:23 | 只看该作者
首位数不是随机分布的,末位数是。如果是十进制,首位数与单位无关。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|Archiver|智游城论坛

GMT+8, 2024-9-20 23:46 , Processed in 0.055347 second(s), 8 queries , Redis On.

Powered by Discuz! X3.2

© 2001-2012 Comsenz Inc.

返回顶部