在探讨政治的初始状态过程中,罗尔斯推出一个别出心裁的称作“无知之幕”的初始状态假设,这个充满魅力的假设虽有严重的缺点,但也有突出的优点,可以说是初始状态理论的一个重要推进。无知之幕是一个纯属想象的环境,虽然不真实但非常有理论意义。“无知之幕”意在制造人人平等的完全公平的博弈环境,由此迫使人们做出真正合理的选择。这正是罗尔斯的创意所在,他想考察在公平条件下人们所能够订立的社会契约是什么样的。由无知之幕这一“完全公平的”博弈环境所定义的初始状态中的博弈各方都是自私的经济人,完全无视别人的利益,又都是充分理性的,而无知之幕完全遮蔽了博弈各方的利益、身份、地位和偏好,人人对自身状况一无所知,不知道自己与他人在各方面的差异,甚至不知道自己的价值观点以及所处的社会和时代。 这相当于既不知己又不知彼,甚至不知“魏晋”。在这样的条件下,人们为了保证自身安全,就只能按照风险规避原则去设想一种任何人在任何情况下都不至于落入悲惨处境的社会制度。据说在无知之幕的公平条件下,人们理性选择的社会制度必定表现“公平公正”的两条基本原则:(1)最大均等个人自由原则。人人都有平等权利去拥有最大程度的基本自由,而且,每个人的自由与他人的自由相容。(2)分配的平等主义原则,其中包括两个原则,核心是差异原则(the difference principle,其实是优待原则或者偏袒原则)。这说的是,既然社会和经济上总是存在不平等,那么就必须使之对处境最差的人最有利。并且,所有的职务和机会应该向所有人平等开放。关于这两条原则还有一条次序规则:原则(1)即自由原则优先于原则(2)即平等原则,就是说,如果两条原则形成冲突,自由原则必须优先被满足。罗尔斯相信,这样的选择就是人们真正需要的公正。

罗尔斯设计虽然新奇但颇多疑点。每个博弈方被假定为只有思维(mind)而没有心(heart),这种理解在单纯经济学中或许合适,但对于解释社会和生活则是严重缺陷。社会中许多根本性的冲突是心的冲突,而远不仅是利益冲突,而且没有理由证明物质利益比精神价值更重要。忽视精神需要对于人和生活都是歪曲,仅仅从理性和物质利益去理解的社会太过单调,以至于无法由此辨认出任何一个实际上可能的社会,这导致罗尔斯游戏与真实生活之间缺乏可通达性。无知状态的博弈与有知状态的博弈之间有着无法过渡或无法兑换的鸿沟,因为它们已经是本质不同的世界,不能互相兑换或转换。任何真实的社会博弈都是某种程度的有知状态,人们必须知道自己有什么需要保护的、有什么值得争夺的以及是否有条件争取自己想要的东西,否则这个游戏是无意义的。人们不可能不知道一个游戏是什么样的游戏就盲目同意加入这个游戏。这就像说,有人提出大家都去做某事,但必须大家都同意之后再告诉大家要做的是什么事,这无疑是危险的,出于风险规避原则,大家有理由拒绝。当然,罗尔斯需要一个充分公平的博弈环境去考察公正制度的构成,这一点仍然是有意义的,它作为对公正的一种理论检验,并非无用。不过,无知之幕这一公平环境排除了生活的最坏可能性(霍布斯的丛林战争),这一点大大削弱了罗尔斯初始状态的解释能力,因此,罗尔斯假设不是一个普遍有效的假设,而只是一个特殊有效的假设。罗尔斯对霍布斯思路的背叛看起来不是非常成功。

艾克斯罗德1980年进行了一个关于合作如何可能的计算机实验 ,其中给出了一个仿真性颇高的初始状态,它不需要诸如“无知之幕”之类在实际上根本不可能出现的不正常条件去促成不可信的合作,这一点使艾克斯罗德的初始状态明显优于罗尔斯。艾克斯罗德的博弈环境大概是这样的:(1)博弈者是多样的:理性或不理性,谨慎或投机,善良或邪恶,一切动机和心态都是可能的,就是说,博弈者是“人性人”而不是“经济人”;(2)博弈回合足够多;(3)参赛的博弈者也足够多;(4)博弈几乎可以不择手段,可以设计最阴险的策略。这一仿真性条件使艾克斯罗德实验具有明显吸引力。当然,这一博弈仍然并不足够真实,比如,博弈各方被假定为能力相等,而且不可能消灭对手而只能在得分上胜过对手。这个缺点暗含了严重破绽。

艾克斯罗德实验是一个全体混战的循环赛,参赛的14个策略由“足够精明的”各种专家分别设计。每一步的战术可以选择“合作”或“背叛”,双方合作各得3分,双方背叛各得1分,一方背叛而另一方合作则背叛5分而合作0分。背叛的回报很大因此诱惑很大,与真实生活的情况类似。经过12万回合的混战,比赛结果出人意料,一个具有善良、宽容和公正等优良品质的“一报还一报” 策略(TFT)以明显优势胜出。TFT策略非常简单:第一步选择合作;从第二步开始就模仿对方上一步的选择。这意味着:首先是善良,从不先背叛;其次是公正,如果对方背叛就进行回击;然后是宽容,一旦对方改正错误,就马上重新合作。而那些不成功的策略都太想占便宜,总是主动背叛。在比较成功的策略群与比较不成功的策略群之间也存在着明显的得分差异,比较成功的前8名策略都是善良的,所有不成功的策略都是故意与人为敌的。艾克斯罗德对这个太过美丽的结果不放心,第二次实验使参赛策略增加到62个,并且第一实验的结果事先公开,让第二次实验的参赛者都知道TFT的优势,可是大多数人还是宁可设计更复杂的敌意策略,可见大多数人多么希望多占便宜而不惜伤害他人,但第二次实验的结果仍然是TFT等善意策略胜出。这个实验被认为或多或少证明了好心有好报。

梦想只是梦想,事实不仅是事实。如果理论与事实不符,肯定是理论出了问题。艾克斯罗德实验所以能够证明好人笑到最后,其中一个原因是其“杀不死”假定:每个博弈者可能失败(得分低),但不可能被消灭(杀死)。这个与真实世界不符的规定显然不能正确表达人的命运。这是现代学术司空见惯的失误:人们为了实验效率,总是把实验设计成一个容易计算但不真实的可能世界。这虽是理论允许的,但理论世界至少应该对于真实世界是一个可通达的可能世界,否则原理不能通用。艾克斯罗德实验与罗尔斯实验都存在这个困难,都改变了某些必要的存在论条件而使实验世界与真实世界不相通。采取了“杀不死”假定,生死游戏就弱化成输赢游戏,博弈不再严重,命运不再严肃。杀不死就意味着永远还有机会卷土重来,这就限制了不择手段竞争的威力,从而造成善良策略必定具有博弈优势的假象。这不是在批评道德,而是说,道德行为必须同时成为具有博弈优势的生存行为,如果道德原则在生存博弈中是没有效率的,就是非常可疑的。正如宾默尔指出的:哲学家太喜欢想象对生活问题的道德解决,但道德游戏终究必须同时是生存游戏,否则在实际上根本行不通。

假如取消“杀不死”假定,把艾克斯罗德实验重新规定为:当博弈者由于选择合作而遭受n次背叛的打击(n次0分)就必须退出比赛,相当于被“杀死”,这样就比较接近真实世界了。可以推想:在这个生死博弈中还是会有一些善良合作者最后获得胜利,但也有一些合作者被吃掉。这是个危险的信息,当一些合作者发现这个问题,就会选择不出头、搭便车甚至蜕变成背叛者。坏人更容易占到便宜的信息会使好人退化,这是一个真实难题。在艾克斯罗德的实验中,博弈者之间不能交流经验,即使可以交流,博弈策略也不会因此改变(因为程序是设计好了的),好人即使总是吃亏也将坚持只做好人,这样的规定好像回避了这个困难,可是真实生活并不能回避困难。可以看出,艾克斯罗德实验虽具有一定的仿真性,但不能保证与真实世界的可通达性。即使经过我们修改的艾克斯罗德游戏升级版有了更高仿真性,也仍然与真实世界并不完全通达。相比之下还是最朴素的荀子—霍布斯结合版较为合理。

以荀子—霍布斯结合版为底本,我们可以设计一个荀子—霍布斯的升级版。按照前面论述的实验性初始游戏有效性要求,我们的升级版将满足:(1)与真实生活的可通达性;(2)能够普遍应用于各种真实的可能生活;(3)把生活的最坏情况考虑在内。毫无疑问,理论上的初始游戏与真实世界总会有些出入(这是允许的),但可以做到与真实世界足够匹配。我们的升级版初始游戏条件大概如下:

(1)每个博弈者都优先考虑自己的利益,包括自己的专属利益和自己可及的共享利益。在专属利益与共享利益之间不存在预先的偏好排序(比如不存在“专属利益总是优先于共享利益”这样的排序),而仅仅考虑某种利益——无论是专属的或是共享的,是否是自己可及的最大利益。

(2)每个博弈者都是理性的。在所有博弈者中不存在一个普遍通用的价值排序表,只有每个博弈者自己特殊的价值排序表。每个博弈者都将按照各自认定的价值排序表去理性地计算得失。假定某人p偏好x,即使其他人都认为x一钱不值,p仍然愿意为了x而牺牲别的利益,这一计算将被认为对于p是理性的。

(3)每个博弈者将不择手段地捍卫自己的利益和价值。

(4)足够多次的连续博弈,类似于历史的效果。

(5)每个博弈者拥有关于其他博弈者的部分知识。

(6)每个博弈者各自拥有不相等的初始策略知识,但可能的策略是有限多个的。每个博弈者都能够模仿并且学会其他博弈者的优势策略。

根据以上博弈条件,可以分析如下:

首先,可以修正一个流行的错误。在现代通常的理论分析模式中,个人利益的最大化通常只是计算到自己的专属利益,而没有把对自己同样有利甚至更有利的共享利益计算在内,殊不知自己可及的共享利益也是个人利益的一部分,因此才会把理性人定义为互相麻木不仁的人。事实上,专属利益往往并不很大,人的大多数“最大利益”都只存在于共享关系中,可以表达为:对于某人,存在着某种最大利益x,当且仅当,x同时为某个(某些)他人所分享。就是说,有些利益仅仅存在于与人共有的关系中,而不可能为个人所独占,一旦试图独占就反而破坏了这种利益,例如家庭、爱情、友谊以及任何合作所创造的幸福和效益。因此,人们真正关心的利益是“自己可及的利益”,而不限于个人独占的利益(自己可及的利益当然包括独占的利益)。人们对利益的理性排序完全不像现代理论所妄想的那样,永远把个人权利和财富排在最前面,因为人们的最大利益往往属于由特定“关系”所创造的利益,比如安全、幸福、成就和权力。强调理性计算,本来并没有错,但现代理论把需要计算的项目搞错了,被漏掉的利益项目太多,尤其把最大利益漏掉了。如果纠正了在利益项目上的计算错误,就能够发现人们的政治博弈真相:人们所以苦苦进行博弈,根本不是为了获得一些所谓的消极权利(据说是最基本的人权),而是为了形成最好的制度,这个制度能够保护那些使人们获得最大利益的所有合作关系,而合作关系是安全、幸福等等各种最大利益的必要条件甚至是充分条件。这个至今尚未存在的最好制度的标志是:(1)所有人都宁愿承认这个制度而不愿意失去这个制度;(2)所有人都失去采取不合作行为的积极性;(3)所有人都有自由和机会去形成个人幸福的帕累托改进。

在我们这个荀子—霍布斯升级版游戏中,博弈的第一回合甚至许多回合都不足以形成长期稳定的制度和规则。冲突是严重的,斗争是残酷的,制度是经过血流成河的斗争或者杀人不见血的斗争而建立的,恐怕不太可能是通过契约方式建立的。人性足够贱,贱人足够多(高贵的人和英雄好汉总是很少),在个人行动时见利忘义,在集体行动时总想搭便车,偏好五花八门,理想南辕北辙,在这种情况下,想通过商谈而达成契约绝非易事。更可能的是,人们在冲突中慢慢建立一些均衡的行为模式,进而形成制度。大家在别人行动时互相了解对方情况,并且互相学习到各种更具博弈优势的策略,这意味着人们的后续博弈条件和继发的博弈策略不断得到改进,而能力更强的人不断推出更高明的策略使自己取得占优地位。但领先总是暂时的,更高明的策略很快变成公开的知识而为大家所学习和模仿,等到出现“集体黔驴技穷”现象,大家拥有足够饱和的共同知识或对称知识(对称的知己知彼)以及普遍知识,这时将出现普遍的策略模仿,大家都模仿某种被证明为最好的策略,于是达到均衡和一致,成功的制度才能够产生。普遍的策略模仿是形成制度的关键,假如一种策略被普遍模仿而能够使所有人都受益,那么这种策略将发展成为稳定的制度。在这个意义上说,普遍的策略模仿可以成为检验一种制度是否合理的一个标准:凡是能够经得起普遍模仿的策略都是能够制度化的合理策略,而凡是经不起普遍模仿的策略都不可能发展成为制度。

来源:《中国社科网》

赵汀阳,男,1961年出生,广东汕头人。中国人民大学哲学系大学毕业、中国社会科学院研究生院博士毕业。现任中国社会科学院哲学研究所研究员。 中国社会科学院互动知识中心主持。

1.《爱智 | 赵汀阳:无知之幕?罗尔斯的正义论》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《爱智 | 赵汀阳:无知之幕?罗尔斯的正义论》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/yule/22875.html