第五章 理性选择与功能的解释(第2/10页)

通过采用现实主义关于理性的利己主义的模型,我上面的论证预先提出了制度主义者的这个缺陷。在本章和下一章,我和现实主义者一样假设行为者是理性的、利己主义的。我想指出的是,在这些假设的基础上,并不必然就会得出现实主义那种独有的关于合作的悲观主义论调。我试图显示现实主义关于世界政治的基本假设与制度化的安排协议是有联系的,这些制度化的协议包括规则和原则,它们促进着合作的进步。一旦我们通过这种方式建立起我们的论证,那么我们可以通过放宽关键的理性和利己主义的假设,考虑到有限理性、偏好变化以及移情对国家行为的影响,从而对我们的论证进行改造和修正。

一对一囚徒困境博弈与集体行动问题

对合作困难性的最好描述,不是通过完全冲突的博弈(其中纷争的出现是由于利益的结构所决定的)或者本质上合作性的博弈(其中只有戏剧性的坏运气或者诸如此类的东西阻止着合作),而是通过托马斯·谢林所谓的“混合动机博弈”(mixed motive games)来描述的,这种博弈是由一组“互相依赖和冲突,以及伙伴和竞争关系”刻画的(Schelling, 1960/1980, p.89)。在这种博弈状态中,两个博弈者可以通过相互的合作获得收益,但是每一个博弈者都可能从欺骗行为也即背叛行为中获得比其对手更多的收益。[1]

一些混合动机的博弈已经被认定是与世界政治中的现象有关的(Snyder and Diesing, 1977; Snidal, 1981; Oye, 1983b; Stein, 1983)。特别有意义的是众所周知的囚徒困境博弈,因为这个博弈说明了在某种条件下,理性的个体发现它们自己是不能达到一个帕累托最优解决方案的,尽管在它们之间存在一定程度的利益汇聚。不是世界政治或者国际政治经济中的所有形势都可以采取囚徒困境的形式表现出来,但是大部分是如此的,由囚徒困境所提出的问题对本书讨论的合作与纷争问题是关键性的(Taylor, 1976)。

囚徒困境说的是两个合伙犯罪的人被地方检察官隔离审判的故事。每个罪犯都知道如果两个人都拒不坦白的话,地方检察官只有有限的证据判他们很轻的罪行,每个人只能判30天监禁。如果每个人都坦白的话,他们每个人将被判一年的刑期。这种可能的情况似乎使两个人都有不坦白的激励机制,除非聪明的检察官许诺,如果一个人坦白而另外一个人抗拒的话,坦白的罪犯将不予起诉,而其同伴因为抗拒则予以5年刑期的严惩。

当检察官作出这种许诺时,每个罪犯都认识到,在狭隘的自身利益基础上,不管其同伴做什么,他都应该坦白。如果他的同伴也坦白的话,他的坦白至少可以使自己免于5年严厉惩罚,而如果他的同伙拒绝坦白的话,他自己的坦白可以使自己免于获得任何惩罚而不是被判很轻的罪行。由于这种估算的结果,我们就被迫得出这样的结论,两个理性的关心自身利益的个体在这种形势下都将会坦白,从而都会被判刑,而这两个人本来可以通过相互合作(不坦白)以及阻碍检察官行动的方法而不被判刑的。这就导致不与另外一个同伴合作的战略(向检察官坦白)似乎成了博弈者的优势战略。

下面将要提供一个人们熟悉的博弈论中的囚徒困境图式,以及现实生活中举不胜举的例子。如果两个博弈者互相合作的话,那么他们将得到回报R;如果两人互相都背叛的话,那么他们将受到惩罚P;如果一个人背叛而另外一个人合作的话,那么背叛的人因为屈从于诱惑而欺骗其同伙将得到收益T,而合作的人则因为受骗上当得到收益S。在这种博弈中,为了确保利用和被利用的机会要一直比相互合作更加糟糕,标准的囚徒困境博弈为合作行为提供的报酬要大于欺骗另一个同伙而能获得的收益的两倍。

囚徒困境

合作背叛
合作R,R(3, 3)S,T(1, 4)
背叛T,S(4, 1)P,P(2, 2)

支付排序:T>R>P>S

博弈条件:R>(S+T)/2

奥尔森(Olson, 1965)阐述的集体行动逻辑,本质上与囚徒困境的逻辑是一样的(Hardin, 1982,第2章)。在需要集体行动的状态中,合作对获得一种为所有相关成员共同享用的物品是必要的,不管这些成员是否为这种物品的供应作出贡献。当每一个成员为供应这种物品所承担的成本,与总的成本相比非常小的时候,利己的个体可能会作出估算,认为他们如果不作贡献的话会好一点,因为他们的贡献对自己来说是有成本的,而其贡献对这种物品最终被生产出来却只会产生微不足道的影响。因此就像在囚徒困境中一样,对一个利己主义的个体来说,占优势的战略是背叛而不是对这种物品的生产作出贡献。这种估算的结果自然会产生这样一个结论,也就是集体物品将不会被生产出来,或者处于供应不足的状况,尽管事实上这种物品的价值对这个集团来说要大于其付出的成本。