关于预测的预测(1)

也许你认为预测是毫无希望的过时之举。毕竟,我们生活在一个由嗡嗡作响的强大计算机、晦涩的算法和大数据构成的时代。我所研究的预测,其核心是主观判断,即人们思考后得出结论,别无其他。现在难道不正是结束这种草率的推测行为的时候吗?

1954年,才华横溢的心理学家保罗·米尔(Paul Meehl)写了一本小册子,掀起了一场轩然大波。他回顾了过去20次研究,在这些研究中,见多识广的专家对一些事情做出预测,例如一位大学生是否能在大学里取得成功,一名假释犯人会不会重返监狱。研究表明,他们的预测准确性甚至不如某些简单的算法,这些算法的功能只是对能力测试分数和过往行为记录这样的客观指标进行统计,然后推测结果。米尔的结论让很多专家忐忑不安,但是之后的研究(现在已经超过200次)显示,多数情况下,统计算法击败了主观判断,在少量研究中,二者通常打成平手。考虑到算法迅捷又便宜,而主观判断则不然,那么,在平手的情况下,天平偏向算法。如果你有被证明有效的统计算法,就用它吧。这个观点现在已无争议。

然而,上述见解从未威胁到主观判断的统治地位,因为我们很少恰好遇到解决眼前问题的有效算法。用数学取代简单而古老的思维方式,是不切实际的,无论是1954年还是现在,都是如此。

但是,信息技术的惊人进步意味着,在人与机器的关系上,我们正经历历史性的飞跃。1997年,IBM(国际商业机器公司)的深蓝计算机(Deep Blue)击败了国际象棋冠军加里·卡斯帕罗夫。现在,商业化的国际象棋程序可以让任何人俯首称臣。2011年,IBM的超级计算机沃森(Watson)在游戏节目《危险边缘》中战胜人类冠军肯·詹宁斯和布拉德·鲁特。这是一次难度大大超出以往的计算机挑战,但是沃森的工程师们成功了。今天,想象在一场预测比赛中,超级计算机将超级预测家和超级评论员打得落花流水,这不再是异想天开。在那之后,人类预测师仍然存在,但是就像《危险边缘》的人类参与者那样,我们观看他们做预测,仅仅是为了娱乐。

于是我与沃森的首席工程师戴维·费鲁奇(David Ferrucci)进行了交谈。我相信沃森可以当场轻松地回答出关于现在或过去的问题,例如“过去10年哪两位俄罗斯领导人互换了工作?”但是,沃森或者它的数字后代要用多长时间解答诸如“未来10年这两位俄罗斯领导人还会互换工作吗”这样的问题?我对费鲁奇在这个问题上的观点很好奇。

读书导航