第19节:没有披露的数据(3)

那么,你如何避免被不科学的结论所愚弄呢?是否每个人都必须成为自己的统计专家,并亲自研究原始数据?情况并非那么糟。在这里,我们介绍一个易于理解的显著性检验方法。简单地说,它是一种反映检验数据以多大的可能性代表实际结论、而不是代表由于机遇产生的其他结论的方法。这便是那些没有透露的数据--假设你是个外行读者,你就不会明白其中的奥秘,但如果你掌握了这个方法,你将理解其中的企图。如果某条信息的来源提供了显著性程度,你将对它有更深的了解。显著性程度通常简单地用概率来表示,就像普查局以19/20的概率保证他们的结果是正确的。大多数情况下,5%的显著性水平已经足够,但是如果有更高的要求,就需要1%的显著性水平,这意味着以99%的概率保证该结果是真实的,任何类似的事情"在实践上几乎是确定"的。

还有另一类没有透露的数据,它的遗漏也同样具有破坏性。这类数据表明了事物的变动范围以及与给定平均数的偏离水平。通常情况下,单凭一个平均数来描述事物过于简单,起不到作用,不管这个平均数是均值还是中位数,也不管平均数的具体类型是否已知。对实际情况一无所知经常比获得错误的信息要好,也比知之甚少要安全。举个例子来说,为了满足统计出来的平均家庭,即3.6人的家庭,建造了过多的房子。3.6人的家庭意味着家中有3或4个人,需要两个卧室的房子。虽然是"平均"规模,但是实际上,这种规模的家庭只是所有家庭的少数。"我们为普通家庭建造平均规格的房屋。" 制造商这么说的同时,却忽略了占很大比例的、有更多人或更少人的家庭。导致的后果是某些地区重复建造两个卧室的房子,而低估了更大或更小规模家庭的需求。这是个由具有误导性的、信息不完全的统计数据而造成巨大浪费的实例。对此,一家大型的公共健康团体指出:"当越过算术平均数,去分析实际的家庭人口范围时,我们发现3人或4人的家庭仅占全部家庭的45%,而35%是1人或者2人,剩下的20%则多于4人。"

读书导航