协调博弈

1.什么是协调博弈

协调博弈,是指在博弈所定义的收益空间中,任何均衡点都符合以下条件:即

(1)在给定其他参与人行为策略的条件下,没有人有激励改变其行为策略;

(2)没有参与者希望其他参与者会愿意改变其行为。

2.协调博弈概述[1]

Jasmina Arifovic(2000); Hans Carlsson, Mattias Ganslandt(1998); Paul G.Straub(1995)等认为协调博弈就是存在多个能够进行帕累托排序纳什均衡的博弈;

Vincent P.Crawford and Hans Haller(1990);Vincent P.Crawford(1995)等认为协调博弈是参与人对不同策略组合有相同偏好的博弈,如果其他人能够正确地预期,那么在多个纳什均衡中会存在唯一解,即均衡选择依赖参与人之间对博弈进行有充分相似的信念

他们描述的侧重点不同,前者强调均衡多重性,后者强调参与人行为选择信念的一致性。当然,没有多重均衡就不存在行为选择信念,有了多重均衡就需要探讨行为选择信念的形成过程,参与人之间行为预期是协调博弈均衡选择问题的核心之所在。

根据均衡选择时参与人之间是相同行动的行为预期还是不同行动的行为预期而把协调博弈分为对称协调博弈与非对称协调博弈。

3.协调博弈典型实例[2]

夏娃靠左夏娃靠右
亚当靠左3,30,0
亚当靠右0,03,3

表:交通博弈

协调博弈的最为经典的弈局出现在“交通博弈”中。下表中的收益矩阵给出了一个交通博弈的收益分布。观察该矩阵可以发现:该矩阵有三个纳什均衡,即(靠左,靠左)、(靠右,靠右)以及一个靠左和靠右各占50%概率的混合动机策略均衡。因此,只要给定对方的选择,参与者就没有激励偏离均衡策略;或者即使不给定对方的策略,参与者也只能通过协调来实现均衡。

显然,在这种博弈中,每个参与者的策略问题是:他希望和他的对手就策略选择进行“协调”,因为不管是否给定对手的策略,协调的结果总是最好的。森在1967年的论文[3]中,将一个协调博弈称为“信心博弈”。他指出,协调博弈与囚徒困境博弈刚好相反,每个参与者选择策略A或B,仅仅需要确信对方也会相应地选择A或B。他们不像合作博弈那样需要一个有约束力的契约之类的东西,而是更需要在彼此之间确立一种相互信任的信心。

如果我们考虑将上述关于交通的协调博弈扩展为,(1)在固定参与者之间进行的重复博弈,或(2)在特定的群体系统内部非固定参与者之间进行的超博弈,那么就不难想象,与其每次出现时都去尝试解决这个博弈,远不如在行为人之间建立起某种行为或惯例的稳定的均衡模式,进而使得参与人在此后遇到类似问题时都可以加以遵循,而不需要反复支付信息成本和交易成本。但协调博弈的一个问题在于,均衡解具有不确定性和多样性,因此哪种均衡的规则将被选择具有随机特征。因此,在习俗层面上讲,协调博弈的均衡规则是多样的。但不管怎样,只要相应的一种行为模式被广泛接受,并被自觉遵从,就会形成习俗或自发秩序,并且有助于包括参与者在内的所有群体成员,避免类似弈局中无效率的非均衡收益。

4.协调博弈与选举[4]

在尧舜时代,自然资源相对丰富,人性淳朴,人们为争夺资源而进行争斗的情形相对较少。但是随着时间的推移,人口的增加,以及人性的复杂化,为争夺资源所进行的争斗就愈加激烈,且手段也花样百出了。特别是在目前的市场经济情况下,人们以无限追逐物资利益为目标,一个人能否在激烈的竞争中取得资源控制权就成为一个人或者一个单位生存及发展的关键要素。对于市场经济还欠成熟,法制传统还比较欠缺的国度来说,不择手段地进行资源控制权争夺就特别重要。因此,一些单位在与其它单位的资源或者市场控制权争夺中,实际上就是在玩“协调博弈 ”——给定其它单位不择手段地争夺资源,己方的最优策略就是不择手段地争夺资源。但是,能否有能力不择手段地去争夺资源是依赖于单位“领导”的人格素质的。

一般而论,能不择手段进行资源争夺的人通常是“胆大”的人,俗话说:“饿死胆小的,撑死胆大的”就是这个意思。而胆大的人一般又不太在乎社会公众舆论或者不太在乎社会规范的约束,通常就在“德行”上得分不高——即所谓大奸大恶之人,如三国时的曹操。所以,给定其它竞争性单位推选“大奸大恶之人”作领导,该单位也有动机推选自己的“大奸大恶之人”作领导,让他去迎战竞争方的“大奸大恶之人”是恰当的。当然,“大奸大恶之人”也可能并不受本单位广大人民群众的欢迎,但是作为集体的生存与发展,广大人民群众在一定程度上也可能容忍,让他们实际上并不喜欢的人去当他们的领导,这叫做“以毒攻毒 ”!如果竞争对手推选他们的领导是德高望重之人而非“大奸大恶之人”,本单位推选“大奸大恶之人”也是要占便宜的,因为在争夺资源上德高望重之人是斗不过 “大奸大恶之人”的;这样一来,每个单位都选择“大奸大恶之人”就是“占优战略”的了。也就是说,无论竞争对手推选什么样的人作领导,本单位都推选“大奸大恶之人”作领导是最优的。这样的博弈实际上是“囚徒困境 ”。但是,用“囚徒困境”来描述实际现象没有用“协调博弈”恰当。理由是,通常“大奸大恶之人”也会损害本单位广大人民群众的利益。如果竞争对手单位推选德高望重之人当他们的领导,本单位广大人民群众通常也会推选本单位的德高望重之人作本单位领导的。因为尽管本单位的领导是德高望重之人时不会比“大奸大恶之人”争夺带来更多的资源,但他也通常会比“大奸大恶之人”更少地损害本单位广大人民群众的利益,甚至通常还会增进本单位广大人民群众的利益。

一个更为强有力的原因是来自柏克利加州大学的Rabin教授的公平博弈观点。他根据近年来心理学实验的发现概括出人们普遍表现出的”互惠互损“行为准则。Rabin(1993)的一个有价值的贡献是把“公平性”(fairness)定义为“当别人对你友善良时你也对别人友善,当别人对你不善时你也对别人不善(即“投桃报李”和“以牙还牙”),而且他的独特贡献是将这种概念给予了明确的规定,即“如果你在损失自己效用(收入,利益等)情况下去损害别人的效用(收入,利益等),就被定义为你对别人不善;如果你在损失自己效用(收入,利益等)情况下去增进别人的效用(收入,利益等),就被定义为你对别人友善。”

心理学的诸多实验证据表明人的行为在许多情形下是遵循这样定义的“公平性”规则的,特别是在按照这种规则作出反应时所可能造成的潜在物质利益损失不太大的情况下更是如此。这样,当竞争对手单位推选“大奸大恶之人”作他们的领导时,事实上他们是以放弃让“大奸大恶之人”为他们带来更多资源的同时来增进本单位广大人民群众的利益。此时,按照Rabin的理论,本单位广大人民群众也会放弃让“大奸大恶之人”可能带来更多资源的好处而推选让德高望重之人来作本单位的领导。