重复性博弈的囚徒困境

假如你和同一个对手玩了100次的囚徒困境博弈,会出现什么情况?假如你只玩这个博弈一次,你很可能使坏。假如你的对手使坏,你也跟着使坏就会得1分,好心则会得0分。假如你的对手心存善念,你使坏就会得3行,好心则会得2分。因此,不管对手怎么做,假如这个博弈只玩一次,坏心对你一定比较有利。但假如你们要玩100次,情况会变成什么样子?

假如在整个博弈中,你们两个一直使坏,每次双方就只能各得1分的报酬。但要是你们两个一直善意合作,双方的报酬就是每回合2分。假如你开始使坏,对手就会跟着使坏,于是双方就会形成只得1分报酬的僵局。所以你宁可先展现善意,希望他也跟进,假如他不使坏,你的确可以占他便宜而使坏一回合。不过,等这回合结束后,他也就不会再心存善念了。接下来你就会陷入每次只得1分的窘境,因为自此之后,他大概会一直使坏下去。因此,你起码应该保持善意到他对你使坏为止。

遗憾的是,最后一次的问题会阻止所谓理性的双方善待对方,就算是第一回合也一样,想想看,在第100次,也就是最后一次时,你应该采取什么策略?在这个回合中,使坏带给你的报酬一定比善意来得高。假如你会在某个回合选择好心,唯一可能的原因就是为了让对手在下一回合选择好心(还记得在类似的同步行动博弈中,当你行动的时候,对手并不知道你会怎么做;因此,你在任何一回合的选择都不会影响对手在该回合的行动)。不过,最后一次显然不必考虑到其他回合。因此,在第100回合时,你肯定应该选择坏心,你的对手也应该这么做。

既然如此,你在第99回合应该怎么做?你在第99次选择使坏一定可以得到比较高的报酬。假如你不想在第99回合选择坏心,唯一的理由就是为了让对手在第100回合对你好心。但前面已经说过,不管怎么样,你的对手在第100回合都应该会对你使坏。因此,双方在第99回合都应该选择使坏。当然,这表示你们两个在第98回合也应该选择使坏,因为双方在第99和第100回合一定会选择使坏。你可以把这个逻辑一直往回推,并借此证明你在第一回合就应该选择使坏!

 因此,就算这个囚徒困境博弈玩100次、1000次或是10亿次,理性的参与者在每个回合都应该会选择使坏,只要这个博弈存在确定的最后一次。

读书导航