重复性博弈的囚徒困境

怪诞博弈论孙恩棣

假如你和同一个对手玩了100次的囚徒困境博弈，会出现什么情况?假如你只玩这个博弈一次，你很可能使坏。假如你的对手使坏，你也跟着使坏就会得1分，好心则会得0分。假如你的对手心存善念，你使坏就会得3行，好心则会得2分。因此，不管对手怎么做，假如这个博弈只玩一次，坏心对你一定比较有利。但假如你们要玩100次，情况会变成什么样子?

假如在整个博弈中，你们两个一直使坏，每次双方就只能各得1分的报酬。但要是你们两个一直善意合作，双方的报酬就是每回合2分。假如你开始使坏，对手就会跟着使坏，于是双方就会形成只得1分报酬的僵局。所以你宁可先展现善意，希望他也跟进，假如他不使坏，你的确可以占他便宜而使坏一回合。不过，等这回合结束后，他也就不会再心存善念了。接下来你就会陷入每次只得1分的窘境，因为自此之后，他大概会一直使坏下去。因此，你起码应该保持善意到他对你使坏为止。

遗憾的是，最后一次的问题会阻止所谓理性的双方善待对方，就算是第一回合也一样，想想看，在第100次，也就是最后一次时，你应该采取什么策略?在这个回合中，使坏带给你的报酬一定比善意来得高。假如你会在某个回合选择好心，唯一可能的原因就是为了让对手在下一回合选择好心(还记得在类似的同步行动博弈中，当你行动的时候，对手并不知道你会怎么做；因此，你在任何一回合的选择都不会影响对手在该回合的行动)。不过，最后一次显然不必考虑到其他回合。因此，在第100回合时，你肯定应该选择坏心，你的对手也应该这么做。

既然如此，你在第99回合应该怎么做?你在第99次选择使坏一定可以得到比较高的报酬。假如你不想在第99回合选择坏心，唯一的理由就是为了让对手在第100回合对你好心。但前面已经说过，不管怎么样，你的对手在第100回合都应该会对你使坏。因此，双方在第99回合都应该选择使坏。当然，这表示你们两个在第98回合也应该选择使坏，因为双方在第99和第100回合一定会选择使坏。你可以把这个逻辑一直往回推，并借此证明你在第一回合就应该选择使坏!

因此，就算这个囚徒困境博弈玩100次、1000次或是10亿次，理性的参与者在每个回合都应该会选择使坏，只要这个博弈存在确定的最后一次。