11.是真规律,还是伪科学?(11)

回归分析是一种数学工具,人们可以运用它推导出线、方程式和公式来恰当地解释数集。这是一种特别强有力的技能,可以迅速在给定的数集中总结出规律。然而,如果人们胡乱使用它,所得结果就可能毫无意义,就像疯子嘟囔时的胡言乱语。上文中提到了两个宣称女运动员会超过男运动员的预测,它们就是“胡乱回归分析”的典型案例,因为科学家们从数集中找出来的规律根本就是荒谬的,这些“规律”直接可以推导出“运动员最终的奔跑速度会超过光速以至于时光倒流”的可笑结论,我们凭此就能一眼看穿这些“规律”的虚假性。不过,“胡乱回归分析”所导致的问题通常是更加隐晦且难以看穿的。

在20世纪80年代,经济学家们一窝蜂地努力研究着来自耶鲁大学的一个科研话题。一位名叫雷·费尔的年轻经济学家根据1912~1976年的经济数据作了一项回归分析,然后得出了一个如果成立就将轰动一时的方程式,该方程式可以提前预测谁会在接下来的总统竞选中获胜。你仅仅需要在方程式中输入几个经济要素——通货膨胀率、国内生产总值增长率等。瞧!下一位总统就计算出来啦。那么,战争、国债、外交政策呢?这些几乎都是无关紧要的,经济形势完全决定了每次总统竞选的胜利者。经济学家们肯定会喜欢上这个方程式。

1980年,费尔的方程式预测,里根会在二选一的角逐中以55。4%的得票率战胜卡特。后来,里根的确拿到了55。3%的选票。全世界经济学家都为这个方程式的精准程度而激动万分。1984年,费尔预测里根会大胜蒙代尔而连任。他说对了。1988年,这个方程式显示老布什会轻松战胜杜卡基斯。老布什做到了。经济学家们向神机妙算的费尔致敬,费尔则得意洋洋地吹嘘着他的预测的准确性。他的方程式被视为令人惊叹的、准确的经济预测的标准范式,并在经济学专业大一新生的课堂上向学生传授。然而,费尔在1992年宣称,老布什会以57。2%的得票率击败新晋候选人克林顿,凭借公众那势不可当的支持回到白宫进入他的第二个总统任期。

嗤嗤……你或许可以想象一下,在最终选举结果揭晓后,经济学家们那膨胀的自负是如何被击得粉碎的。费尔被迫低调地修改了他的方程式,以便“纠正”他之前犯下的错误。在1996年美国大选前,他又勇敢地在一份报纸上公布了下一个预测:“按照方程式推导出的基本结论是,美国共和党人会在1996年大选中略占优势。”噢,他又错了。美国民主党人克林顿完胜美国共和党人多尔,他的领先优势跟1980年里根战胜卡特时一样明显。

真正的问题是,费尔的方程式就是典型的“胡乱回归分析”的产物。它是一个精心制作的数学模型,并用以表达费尔从数据中找到的“规律”,但这个“规律”本身就是毫无意义的。(费尔的成功可归结为一个常识性的结论,那就是在任总统会因良好的经济状况而受益。)方程式可以完美地解释过去的竞选结果,但用它来预测未来的竞选结果显然是不可能的,这便是虚假规律的典型特征。几乎所有的竞选预测都有着同样的问题。经济学家和其他领域的专家们年复一年地修正着他们那不靠谱的数学模型,并据此作出多数情况下都错得离谱的预测。他们甚至在一个缺乏新闻素材的日子里把预测结果发表到了一份赫赫有名的报纸的第二版上,题为“一切都还没有结束”。一位经济学家在2000年某一期的《华盛顿邮报》的第一版上发表文章,预测戈尔会在二选一的角逐中赢得56。2%的选票。当然,他又贻笑大方了。我受够了这些预测家的喧嚣,在《华盛顿邮报》上发表了一篇文章,使用令人费解的4组Kn?del数列来预测美国总统竞选的结果,其结论能够与1952年以来的历次竞选结果相符合。认为某组数列可以决定在总统竞选中的获胜者,这种想法着实很荒谬可笑,不过并不比经济学家们采用“胡乱回归分析”所得到的预测结论更荒谬可笑和离谱。

读书导航