大国竞争的未来:囚徒困境与以牙还牙

大国之间的合作,比如中美之间,在双方缺乏信任的前提下如何能够培育出合作和互信?一个有益的思路就是把一次性的囚徒困境博弈转化成重复博弈和多边博弈。囚徒困境的结局只会是背叛,这是由人性与国际关系的丛林法则所决定的,但是如果能够转变成重复博弈和多边博弈,我们就可以通过以牙还牙策略(tit for tat)诱导出妥协和合作,最终培育出信任与和平。

合作还是背叛? 

关于为人处世,不同的先哲留下了不同的教诲。有人主张以德报怨,要宽恕,以免冤冤相报无穷无尽;也有人主张要以直报怨,也就是中国外交政策经常说的,按照事情本身的是非曲直去确定我们的态度,而不是根据以往的恩怨来考虑当前的具体态度。在西方这种争论更加激烈,《圣经·旧约》主张,要以眼还眼,以牙还牙;《圣经·新约》主张被人扇了左耳光,还要把右脸贴过去。所有这些道德性的、价值性的、伦理性的、形而上的争论是无休无止、无穷无尽的,是没有定论的。所幸现代社会科学的发展,给我们对相关问题提供了某些科学化的解释。

美国密歇根大学的政治学教授罗伯特·艾克斯罗德在20世纪80年代曾经进行过一项非常有意思的研究,利用囚徒困境的博弈论原理来研究自私的人类何以可能相互信任并进行合作,由此进一步解答对于个人和国家来讲,什么样的处世之道是最合理的。后来,他把这项研究整理为《合作的进化》一书,得到同为博弈论研究者的2005年诺贝尔经济学奖得主托马斯·谢林的强烈推荐。

要理解他的研究,首先要明确什么是囚徒困境。囚徒困境是博弈论中最常见的基础模型,假设有甲、乙两个罪犯被分别提审,他们可以互相揭发检举从而获得减刑或奖励;但是如果他们一起保持沉默的话,就死无对证,两个人都会被无罪释放。对于甲个人而言,如果保持沉默,可能会遭到乙的背叛,被从重判罚,也可能乙同样沉默,两人均被无罪释放;但是如果坦白从宽,可能甲、乙互相背叛,各自减刑,也可能乙把秘密带进了棺材,而甲领到了悬赏金。无论乙怎么选择,甲的坦白都能让他自己获得给定乙选择下的较好结局,而且甲也明白乙也面临着同样的选择和诱惑。所以假如这两个人都是自私的,不为对方考虑的,这种博弈的均衡结果必然是两个人各自招供,都被判刑。

一个更加关键的问题是关于人性自私的假设,处于囚徒困境中的个体是不是以个人利益的最大化为唯一诉求?关于这一点,生物学其实已经提供了很多答案。所谓物竞天择,绝大部分生物的基因都是自私的,因为那些愿意牺牲自己来换取别的个体生存概率最大化的利他个体大都灭绝了。不过自然界中也的确存在例外,一些利他主义基因能够通过生存竞争繁衍下来,最典型的就是蚂蚁、蜜蜂这两种生物。蚂蚁跟蜜蜂可以为了保护集体、保护“他人”而牺牲自己,比如蚂蚁抱团过河,最外边圈层的个体就淹死了;蜜蜂蜇人也是自杀式攻击,牺牲小我保护大家。什么原因导致这种利他主义基因能够不灭绝?它们具有一个共性,同一族群内两两个体之间的基因共享度达到75%。因此,对于确保整个种群的延续而言,只要牺牲某个体可以挽救其他一又三分之一的个体,这种交易就是可以接受的,换句话说,个体间基因共享程度越高,损失某个体对种群基因多样性所带来的成本越小。举个极端点的例子,如果个体间的基因100%共享,也就是所有个体都是一模一样的,哪怕只有一只活下来了,整个种群的基因也都能够得到延续。所以,虽然采取利他行动“舍己为人”的蚂蚁和蜜蜂死去了,但是这种利他基因仍然存在于因它的牺牲而活下去的个体里。

交代完这两个基本的问题之后,我们就可以分析罗伯特·艾克斯罗德教授的精彩研究了。在他看来,每次人际交往都可以简化为两种基本模式,合作与背叛。在人际交往中普遍存在囚徒困境,明知合作可以带来共赢,但是理性和自私导致信任的缺乏,使合作难以产生。从理性的角度考虑,人们总是希望对方采取合作行动而自己选择背叛,由对方承担全部成本,而自己获得最大化收益;即便你自己不贪心,你也难以相信对方会跟你一样不贪心,所以单次博弈中,很难产生合作的结局。

但是假如人与人之间的交往不再是一锤子买卖,而是低头不见抬头见,需要长期互利共生,这时的博弈格局就不一样了,人们往往愿意这次吃点儿小亏以换取对方下一次的回报,双边关系就容易稳定。所以熟人社会中的个体之间是友善的,乡里乡亲间是讲规矩的,大家互相体谅,互相谦让。在不定次的重复博弈中,每个决策主体都需要考虑自己的行为会不会招致对方的报复,同时也希望自己能够获得更大的收益,所以往往对于“背叛”的选项十分慎重,“合作”反而成为比较占优的策略。

最优策略——以牙还牙

在多主体间开展的不定次重复博弈中,是否存在一种为人处世的最优策略?艾克斯罗德教授向全世界不同学科的学者发出邀请,请他们提交各自认为最优的竞争策略,然后通过计算机进行模拟,让这些策略重复进行两两之间的囚徒困境博弈,并对囚徒困境博弈各结果赋值不同的分数,以得分最高者为优胜。第一轮参赛的有14个程序,最终以牙还牙策略获得了第一。艾克斯罗德教授把这个策略向全世界公开,并邀请学者们基于第一轮竞赛的结果设计更多的策略以开展第二轮竞赛,这次有63种策略参赛,而优胜者仍然是以牙还牙。

以牙还牙策略来源于一句美国俗语,就是一报还一报的意思,它的内容非常简单,第一步一定要跟对方合作,此后每一步都只是简单地重复对方上一步的行为。如此简单的程序之所以能够在两轮竞赛中都获胜,是因为它能够最有效地鼓励其他程序和它进行长期合作。它拥有五个基本特质,第一是善良的,它首先假设这个世界对我是好的;第二是可激怒的,它不是老好人,假如它发现对方是个坏蛋,它就会报复;第三是宽容的,也就是对方跟它进行了恶性互动之后,如果对方弃恶从善重新与它合作,它又可以原谅对方,再次跟对方进行合作;第四个是简单的,它的逻辑非常清楚,而且乐于告诉别人它的策略;第五个是不妒忌别人的成功,总是乐于与别人合作,而不是背后占别人便宜,所以在任何单次的双边博弈中,它的得分要么和对方一样,要么略低于对方。

比赛中的其他策略,或多或少都没有做到以上五点。有些恶意程序,第一步就选择背叛,最终都没有进入前10名;而有些程序又太过好脾气,所以被人背叛之后不立即做出反应,这就会鼓励狡猾的程序反复占它的便宜;某些程序对过往关系的好坏太过执着,一旦被别人欺骗一次就绝不原谅,所以很多能够恢复的关系就永久断绝了;还有一些程序把自己搞得太复杂,总是试图通过某种投机取巧来占人便宜,尽管在与某些“傻”程序的接触中得到了单次的高分,但是一旦碰到“个性刚烈”的程序就会陷入互相“死磕”的困境,从最后总得分来讲,它们的小聪明都是得不偿失的。

自从1999年拜读了艾克斯罗德教授的研究之后,我就被他此项研究设计的巧妙和结论的高明折服,在为人处世中一直身体力行:友善随和且心比赤子,不耍投机取巧的“小聪明”;宽容大度但坚持原则,不做随波逐流的“老好人”。淡泊宁静,不在双边关系中追逐强势;严守初心,能够抗拒嫉贤妒能的诱惑。这些信条本来就是生活中常见的为人处世之道,但是能够用博弈论模型加以总结,形成指导实践的科学结论,并且把这些信条连接起来,作为一种整体性的策略组合来行事,让我觉得自己与众不同。

这套策略的核心理念就是去跟尽可能多的人广结善缘,开展友好的互动,形成持久的互惠关系,并且发展出信任和友谊,当然它背后的动机仍然是自私,仍然是为了个体生活得更好。人跟人之间是如此,国与国之间也差不多,只不过人际交往之间有比较多的伦理和道德因素,但国家间关系自古以来就是丛林色彩更多一些,权力和利益关系更加赤裸裸一些。

多边主义的践行者

近年来美国的对外政策,尤其是对华政策文件中经常用一个英文词“reciprocity”,翻译成汉语是“互惠”,这其实是不够准确的,“reciprocity”其实还有“报复”的意思,我觉得一个更合适的翻译是“回报”,就是要对别人的各种行为进行质和量两个方面都相称的反应,其中就包含了“以牙还牙”的思想。

现实中以牙还牙策略的运用比计算机程序的博弈竞赛当然要复杂得多,比如现实中的朋友关系并不总是合作双赢的,某些关系是典型的高成本低回报,原因往往在于对方和自己在能力上的不对称;比如面对资源的硬约束,现实中总是无法有足够的资源来维持对别人的各种回报,尤其是当你拥有很多朋友的时候;比如如何做到回报相称,你觉得这种回报是一种相称的警告,但是你的朋友可能会认为你反应过度;再比如回报的内生问题,假如双方都采取以牙还牙策略,一旦由于误解进入了相互惩罚的恶性循环,就几乎永无解脱。

针对上述问题,我进行了相应的策略调整,其中一个重要的调整就是重视利用圈子来解决问题。双边关系中的回报一旦放进了多边关系中操作,不少问题就得以迎刃而解。得罪一个人可能并不会带来对社会关系的巨大损害,但是假如得罪某人意味着与一群人为敌,背叛的成本就非常高了,比如我就非常乐意把我的新朋友介绍给老朋友们认识,这就相当于用一张关系网分担了背叛行为对脆弱友情的冲击力。同样的原理可以用在国与国之间的关系中,多边主义外交就是一个不错的选择,一个小国可能无法有效地报复大国对它的背叛,但是如果大家都处于同一个多边体系里,一旦体系内大国对某小国进行了背叛,它就会信用受损,使它受到失去整个圈子的巨大潜在损失。而且一个大国越是积极地利用自己的信用和威望,别的国家就越敢相信它;反过来如果一个国家不太爱明确地承诺权利与义务,别的国家也无法相信它,就如同你若从来没有用过信用卡里的钱,那么信用卡的透支额度就非常小。

在任何一个双边关系中,中国人都是讲究礼让、大度、谦虚的,与此同时我们又坚决捍卫根本利益与整体原则,达成了刚与柔的平衡,正因如此,尽管中国跟世界上大多数国家存在政治制度和意识形态的差异,但是仍然能够做到朋友遍天下,成为全球七成国家的最大贸易伙伴。相反,特朗普执政美国的4年里犯了类似的错误,试图在每一个双边关系中都占上风,这种操盘模式导致美国处处树敌,国际地位、威望明显下滑。

本文摘自中国人民大学国际关系学院副院长翟东升的新作《平行与竞争》。

《平行与竞争:双循环时代的中国治理》,翟东升/著,东方出版社,2021年7月版

《平行与竞争:双循环时代的中国治理》,翟东升/著,东方出版社,2021年7月版


读书推荐

读书导航