15.伪造的事实,捏造的数字(15)

润色数据

第三种类型的“成果包装”可以被称为“润色数据”。它是指在得出结论后,先对所有数据进行更改,让它们看起来更加讨人喜欢,再公之于众。这就像小贩们利用小聪明来让自己出售的蔬果看起来更新鲜美味一样,比如把苹果上蜡、抛光可以让它们看起来更新鲜,向西红柿喷气体可以让它们变红,给哈密瓜注射药液可以让它们的不足之处隐藏起来,玩弄数学手段进行“成果包装”的人歪曲数据的本来面貌,暗地里把数据润色得光彩照人。

人们构想了无数种办法来“润色数据”,我们很难把它们全部描述出来,这主要是因为那些挖空心思的“成果包装者”一直在编造新办法。但是,有一些常见的手段还是有必要提一下的。

图表——数据的可视化描述——特别容易受“阿谀奉承”行为的扭曲。进行“成果包装”的人能够随意更换数据的表现形式,胡乱修改图表的样式,以便让数据在最终图表上看上去更加令人印象深刻。

我们不妨分析一下桂格燕麦片的案例。燕麦片本身是一种淡而无味、比较令人没胃口的食品,以至于很难通过广告达到让它一炮而红的效果。由于人们愿意去吃那些据说能让身体更健康的食品,桂格燕麦片广告便以信息轰炸的方式出现,并且不厌其烦地向人们灌输新观念,硬把燕麦片这种易消化的纤维食品说成了天然的“人体内部吸尘器”,宣称它可以把胆固醇从血液中清除出去。厂商用如下示意图来强调这种观点:

这张示意图的主旨很清楚:消费者一旦开始食用桂格燕麦片,几周内就可以让血液里的胆固醇浓度奇迹般地下降。然而,如果你仔细观察,你就会发现这张示意图很可能导致误解。我们通常会假设示意图的底端水平线代表着胆固醇含量为零,即细小的燕麦片纤维狼吞虎咽地吃光了血液里的胆固醇。不过,一旦你仔细查看示意图里的竖轴,就会发现其底端刻度并不是0,而是196,这使得数据看上去更能给人留下深刻印象。你不妨看看下图,它更加客观可靠,可以让你轻松明白这一点。

通过改动图轴刻度之类的办法,桂格燕麦片将燕麦片所能带来的影响成倍放大了。在遭到大量投诉以后,桂格燕麦片收回了这张示意图。在利用示意图操纵数据的许多方法中,这种方法最为常见。

“润色数据”的另一种常见形式就是借助“平均值”之类的术语,让数据显得比真实情况大或者小很多。人们往往把“平均值”当成“典型值”,也就是说,如果某公司员工的平均年薪是10万美元,那么人们会认为每个员工的年薪都在10万美元左右。事实上,真相往往不是这样的。

一大堆数字的平均值——更准确地说是算术平均值——有着极为精确的数学含义:把所有数字加起来,然后再除以这些数字的个数。举例来说,有一家共有10个员工的公司,公司里每个员工的年薪都在10万美元左右,你不妨把它们全加起来(100000美元+101000美元+98500美元+99700美元+103200美元+100300美元+99000美元+96800美元+100000美元+101500美元=1000000美元),然后除以员工人数(1000000美元/10人=100000美元/人),即可得出算术平均值。在这个案例里,10万美元的平均年薪可以作为典型年薪的代表。然而,在另一家拥有10个员工的公司里,首席执行官可能挣到999991美元的年薪,而9个实习生只能挣1美元的年薪。算术平均值仍然等于所有工资的和(999991美元+1美元+1美元+1美元+1美元+1美元+1美元+1美元+1美元+1美元=1000000美元)再除以员工人数(1000000美元/10人=100000美元/人)。此时,“平均”年薪仍然是10万美元。然而,这10万美元无论如何也代表不了典型年薪。如果你随机从公司里抽出一个员工,你极有可能发现他只能挣到1美元的年薪。在这个案例里,把“平均”当成“典型”就会导致误解。在这种案例里,使用中位数的概念来代表典型年薪更为恰当。计算中位数的法则是,将数字从低到高按序排列,然后选择其位置在中间的那个。此时,中位数为1,很明显它比平均值更能表达出典型的含义。如果首席执行官吹嘘公司员工的平均年薪为10万美元,并以此来招募新员工,他就是在“润色数据”。新员工在收到第一份工资时定会大为震惊。

读书导航