倒推法是分析完全且完美信息下的动态博弈的有用工具,在第五章我们分析言语博弈中“威胁”或“承诺”是否可信时,已给出了一个倒推法例子。我们看到,倒推法符合我们的直觉。然而,通过下面的蜈蚣博弈的悖论,我们将看到倒推法存在致命的缺陷。
蜈蚣博弈是由罗森塞尔(Rosenthal)与1981年提出的。它是这样一个博弈:两个参与人A、B轮流进行策略选择,可供选择的策略有“合作”和“背叛”(“不合作”)两种。假定A先选,然后是B,接着是A,如此交替进行。A、B之间的博弈次数为有限次,比如198次。假定这个博弈各自的支付给定如下:
A B A A B (100,100)
(1,1)(0,3) (2,2) (99,99) (98,101)
A、 B是如何进行策略选择的?
这个博弈因形状像一只蜈蚣,而被命名成蜈蚣博弈。
这个博弈的奇特之处是:当A决策时,他考虑博弈的最后一步即第198步;B在“合作”和“背叛”之间作出选择时,因“合作”给B带来100的收益,而“不合作”带来101的收益,根据理性人的假定,B会选择“背叛”。但是,要经过第197步才到第198步,在197步,A考虑到B在198步时会选择“背叛”——此时A的收益是98,小于B合作时的100,那么在第197步时,他的最优策略是“背叛”——因为“背叛”的收益99大于“合作”的收益98……如此推论下去,最后的结论是:在第一步A将选择“不合作”,此时各自的收益为1,远远小于大家都采取“合作”策略时的收益:A:100,B:100。
根据倒推法,结果是令人悲伤的。从逻辑推理来看,倒推法是严密的,但结论是违反直觉的。直觉告诉我们,一开始就采取不合作的策略获取的收益只能为1,而采取合作性策略有可能获取的收益为100。当然,A一开始采取合作性策略的收益有可能为0,但1或者0与100相比实在是太小了。直觉告诉我们采取合作策略是好的。而从逻辑的角度看,一开始A应取不合作的策略。我们不禁要问:是倒推法错了,还是直觉错了?
这就是蜈蚣博弈的悖论。
什么是悖论?悖论(paradox)来源于希腊语,para意即“超越”,doxos的意思是“相信”。Paradox的意思是:本来可以相信的东西不能相信,而有的东西看起来不可信但是反而是正确的。悖论指由肯定它真,就推出它假,由肯定它假,就推出它真的一类命题。在历史上有许多悖论。如“阿基里斯赶不上乌龟”的芝诺悖论,“一个克里特人说‘所有克里特人都说谎’”的说谎者悖论,“一个理发师说:‘我给所有不给自己理发的人理发’”的理发师悖论或罗素悖论,等等。这些悖论在历史上对于逻辑和数学的发展起了巨大的作用。
对于蜈蚣悖论,许多博弈专家都在寻求它的解答。在西方有研究博弈论的专家做过该方面的实验 。通过实验发现,不会出现一开始选择“不合作”策略而双方获得收益1的情况。双方会自动选择合作性策略,从而走向合作。这种做法违反倒推法,但实际上双方这样做,要好于一开始A就采取不合作的策略。
倒推法似乎是不正确的。然而,我们会发现,即使双方开始能走向合作,即双方均采取合作策略,这种合作也不会坚持到最后一步。理性的人出于自身利益的考虑,必定在某一步采取不合作策略。倒推法必定在某一步要起作用。只要倒推法在起作用,合作便不能进行下去。
这个悖论在现实中的对应情形是,参与人不会在开始时确定他的策略为“不合作”,但他难以确定在何处采取“不合作”策略。