第22章 长尾分布:从减税额到恐怖袭击事件(2)

高尔顿板是用来演示这样一个实验的:在实验开始的时候,几百个小球从上方被倒入高尔顿板中。在下落的过程中,小球随机碰撞缓冲板,有的向左边弹,有的向右边弹。最后,小球全部落入下方的窄槽中。有的窄槽里的球堆得高一些,有的窄槽里的球堆得低一些,窄槽中所堆的球的高低反映出球落入这个槽中的概率有多大。大多数的小球都掉进了中间或者靠近中间位置的窄槽里,左右两侧的窄槽里的球较少,最两侧的窄槽里几乎没有球。每一个小球的落点都是随机的,对于一个单独的小球来说,我们无法预测出它最终到底会落入哪个窄槽里,但是,从整体上来看,所有小球落点的分布却是非常容易预测的—落点的分布呈现出一口铜钟的形状。

为什么个体的随机性累积起来,却变成了整体的规律性呢?很简单,这就是概率的魔力。中间窄槽里球的数量最多,是因为大部分的球一路向左弹的次数和向右弹的次数是差不多的。向左弹和向右弹的次数接近,球就会掉入靠中间位置的窄槽里。要想落入最外侧的槽里,一个球必须一路几乎只朝一个方向弹。显然,这种情况发生的概率非常小,正是因为如此,最外侧的窄槽里的球数量很少。在概率的作用下,球的分布是越往中间越多,越往两侧越少。

每个球最终的落点是由很多微小的概率事件造成的。世界上的很多其他现象也是如此,许多微小的随机事件导致事物最终朝着不同的方向发展。因此,世界上的很多现象,都可以抽象为一个铜钟形状的曲线。保险公司熟知这个曲线,虽然保险公司无法预测每年有哪些投保人会不幸去世,但它们却可以相当精确地预测出一年大约会有多少投保人死亡,需要多少理赔金额。

另一个例子是人的身高。你的身高取决于很多微小的随机因素:基因、生化、营养、环境,诸如此类。虽然无法预测某个特定的人的身高,但是如果统计部门收集所有成年男女的身高数据,就会发现这些身高数据的分布也呈现出铜钟的形状。

在一篇题为“网上相亲的谎言”的博客文章中,热衷于统计和数据分析的某婚恋网站公布了该网站会员自行填写的身高数据。男会员和女会员的身高分布分别呈铜钟状,这与我们的预期相符。但有趣的是,这两个“铜钟”的位置都有些可疑,它们都右移了两英尺左右。


 

读书导航