这个现象只有两种解释:要么是该婚恋网站的会员身高非常高,高于美国男女身高的平均水平;要么是这些会员在填写自我介绍资料的时候,虚报了自己的身高。
有一种理想化的铜钟形曲线,数学家们给它起名叫“正态分布”,它是统计学中最重要的概念之一。正态分布的美来自它理论上的性质。数学可以证明,只要大量相互独立、大小类似的轻度随机(即方差不能为无穷大)事件相叠加,其结果必然呈正态分布。在自然界和人类的生活中,大量独立随机事件相叠加的情况比比皆是,所以正态分布很常见。
需要强调的是,并不是所有事情都符合上面这几个条件,因此,并不是所有的事情都服从正态分布。这是我本章想要强调的第二个要点。人们曾经认为大部分事物都应该服从正态分布,但事实并非如此。近100年来,尤其是最近几十年以来,科学家和统计学家们发现,很多现象并不服从正态分布,而是另一种分布。奇怪的是,几乎所有的初级统计学教材都对这种分布避而不谈,而是把几乎所有的篇幅都放到了正态分布上。即使偶尔有几本统计学书籍谈到了这种分布,也会把它列为一种“病理标本”,而不肯承认它是自然界和人类社会中常见的现象。我认为这太不可理喻了。下面,我要为这种分布正名,了解了这种分布后你就会发现,现代生活中的很多事情都可以被这种分布解释得很清楚。正态分布又被称为常态分布,但我认为我下面讲到的这种分布才应该称为新的常态分布。
我们来考虑一下美国各个城市的城市规模的分布。城市规模并不是围绕一个比较中庸的值向两侧均匀展开的,城市规模的分布也不呈铜钟形。在美国,绝大部分的城市都非常小,所以它们都挤在下图的左侧区域。