诗和远方

正态分布和幂律分布

正态分布是一个在数学、物理及工程等领域都非常重要的概率分布。正态曲线呈钟型,两头低,中间高,左右对称因其曲线呈钟形。生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。

很多个因素独立同分布并且可以叠加,那么叠加结果就会接近正态分布。

正态分布的的普遍性可以中心极限定理得到。直白地说,如果一个指标受到若干独立的因素的共同影响,且每个因素不能产生支配性的影响(Lindeberg 条件),那么这个指标就服从中心极限定理,收敛到正态分布,这就是林德伯格-费勒中心极限定理的意思。

举个例子,学生的成绩(指标)受许许多多因素影响诸如状态、能力、心情等等充分多的因素影响,成绩的形成是许多因素影响的加总。这些因素没有一个能够支配性地影响成绩,那么即使这些因素各自都不是正态分布的,它们所形成的成绩也是正态分布的。

分布

统计物理学家习惯于把服从幂律分布的现象称为无标度现象。凡有生命、有进化、有竞争的地方都会出现不同程度的无标度现象。

幂律分布现象:英文单词、个人收入。

幂律就是两个通俗的定律,一个是“长尾”理论,只有少数大的门户网站是很多人关注的,但是还有一个长长的尾巴,就是小网站,小公司。长尾理论就是对幂律通俗化的解释。另外一个通俗解释就是马太效应,穷者越穷富者越富。


自然界最多的不是正态(高斯)分布,而是长尾(幂律等)分布。

正态(高斯)分布更常见于人造体,而非自然界。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Catalog
标签列表
最新
最热
常用网站
站点信息
  • 文章总数:1701
  • 页面总数:1
  • 分类总数:12
  • 标签总数:506
  • 评论总数:0
  • 浏览总数:301329
Archives
Copyright © 2017-2018 www.my889.com Some Rights Reserved.
推荐使用 Chrome 浏览器浏览本站
沪ICP备17052342号
Sitemap XML