对丰富的“共产主义”社会,所以竞争意识却不会很强。
对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效果并不好。
改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费完。
对于游戏设计者,这是一个最好的方案。成本不高,但收获最大。
原版的“智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规则的设计者是不愿看见有人搭便车的,政府如此,公司的老板也是如此。而能否完全杜绝“搭便车”现象,就要看游戏规则的核心指标设置是否合适了。
比如,公司的激励制度设计,奖励力度太大,又是持股,又是期权,公司职员个个都成了百万富翁,成本高不说,员工的积极性并不一定很高。这相当于“智猪博弈”
增量方案所描述的情形。但是如果奖励力度不大,而且见者有份(不劳动的“小猪”也有),一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法,奖励并非人人有份,而是直接针对个人(如业务按比例提成),既节约了成本(对公司而言),又消除了“搭便车”现象,能实现有效的激励。
许多人并未读过“智猪博弈”的故事,但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户;等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资;公司里不创造效益但分享成果的人,等等。因此,对于制订各种经济管理的游戏规则的人,必须深谙“智猪博弈”指标改变的个中道理。
2.囚徒困境
在博弈论中,含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”
(prisoners’ dilemma)博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8年;如果另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪(因已有证据表明其有罪)再加刑2年,而坦白者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判入狱1年。
我们来看看这个博弈可预测的均衡是什么。对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择“坦白”总是最优的。显然,根据对称性,B也会选择“坦白”,结果是两人都被判刑8年。但是,倘若他们都选择“抵赖”,每人只被判刑1年。(抵赖、抵赖)是最优的,因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出,“坦白”是任一犯罪嫌疑人的占优战略,而(坦白,坦白)是一个占优战略均衡。
3.笨蜗居
Ross和Rachel是一对情侣,暗地里都有过不忠的行为。但他们并不想分开,而是希望能继续生活在一起,于是不得不面对一个问题:是否应该向对方坦白自己的不忠行为?对于Ross来说,他有两个战略,“坦白”或者“隐瞒”。如果他向Rachel坦白自己的过错,Rachel作为“清白”的一方(Ross并不知道Rachel的不忠行为,当Rachel选择“隐瞒”)将在二人关系中占据心理优势,从而使得Ross处于弱势状态。如果他决定隐瞒,则将背负良心上的谴责。这个博弈是对称的,因此对于Rachel来说同样存在这样的两难抉择。
我们引入经济学的收益概念来衡量博弈中战略的优劣,设收益上限为10分。如果Rachel选择“隐瞒”而Ross选择“坦白”的话,Rachel将占据“我是清白的”的心理优势,从而获得9的收益,而劣势一方的Ross的收益只有5。反过来对Ross来说也是一样。如果两人都不约而同地选择“坦白”,虽然彼此都会感到被背叛的痛苦,但是能够将心比己地互相原谅,二人的收益都是8。如果两人都选择“隐瞒”,他们之间感情得以维系的信任基础已经在事实上消失了,对双方来说都是非常大的损失,收益都只有6。下表列出了四种情况下双方的收益,Rachel在前。
Ross 坦白 Rachel 坦白 隐瞒 8 , 8 9 , 5 隐瞒 5 , 9 6 , 6 直观地说,肥皂剧观众和经济学家们最愿意看到的结果自然是双方都坦承错误并互相原谅,这样可以使这部肥皂剧更加吸引人并且使双方收益之和最大。但博弈论给出的结论却正好相反。
从表中可以看出,在Rachel选择“坦白”的情况下,Ross选择“隐瞒”的收益大于选择“坦白”的收益;在Rachel选择“隐瞒”的情况下,Ross选择“隐瞒”的收益也大于选择“坦白”的收益。因此,“隐瞒”对于Ross来说是一个占优战略,无论对方做出什么选择,这个战略都可以保证他的收益最大。作为一个理性的人(这是博弈论的基本假设),Ross必然会选择“隐瞒”。同样,Rachel也会选择“隐瞒”。于是,博弈的结果就是双方都选择“隐瞒”,各得到6收益。 这是个稳定的纳什均衡,虽然结果出乎意料:博弈双方都选择了使自己利益最大化的战略,却得到了最差的收益(总收益是四种方案中最低的)。
而观众所期待的“彼此坦白”的情况下,任何一方都可以通过改变策略而获得更大的收益,比如Ross由“坦白”转向“隐瞒”可以使自己的收益由8上升到9。因此它是一个不稳定解,必须依靠某种外界约束才能存在。我们设想Ross和Rachel之间达成某种形式的协议,承诺对对方的不忠行为既往不咎。在这个约束条件下“彼此坦白”的解能够稳定存在,这就是合作解。
这是个典型的社会两难问题。各自从自身利益出发的博弈双方会自然而然地达到稳定的纳什均衡,但这往往导致最坏的收益。如果双方能建立有约束力的协议,则可以形成合作解,从而获得最好的收益。
http://hi.http://www.njliaohua.com//D??ú°?μ??úáú2è/blog/item/ee05bb119e51f47ccb80c45f.html
最近三四十年,经济学经历了一场\博弈论革命\,就是引入博弈论的概念和方法改造经济学的思维,推进经济学的研究。诺贝尔经济学奖授予包括美国普林斯顿大学的纳什博士在内的3位博弈论专家,可以看作是一个标志,这自然也激发了人们了解博弈论的热情。博弈论作为现代经济学的前沿领域,已成为占据主流的基本分析工具。
博弈论是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡,也就是说,当一个主体的选择受到其他主体选择的影响,而且反过来影响到其他主体选择时的决策问题和均衡问题。
一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织;第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失。
\囚徒困境\
\囚徒困境\是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是\坦白从宽,抗拒从严\,如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。
在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。
囚徒困境反映了个人理性和集体理性的矛盾。如果A和B都选择抵赖,各判刑1年,显然比都选择坦白各判刑8年好得多。当然,A和B可以在被警察抓到之前订立一个\攻守同盟\,但是这可能不会有用,因为它不构成纳什均衡,没有人有积极性遵守这个协定。
实证分析:
\囚犯困境\在经济学上有很多应用,也有力地解释了一些经济现象。
一.电信价格竞争
根据我国电信业的实际情况,我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争,一开始的价格都是P0。A(中国电信)是老牌企业,实力雄厚,占据了绝大多数的市场份额;B(中国联通)则刚刚成立不久,翅膀还没有长硬,是政府为了打破垄断鼓励竞争而筹建起来的。
正因为B是政府扶植起来鼓励竞争的,所以B得到了政府的一些优惠,其中就有B的价格可以比P0低10%。这一举动,还不会对A产生多大的影响,因为A的根基实在是太牢固了。在这样的市场分配下,A、B可以达到平衡,但由于B在价格方面的优势,市场份额逐步壮大,到了一定程度,对A造成了影响。这时候,A该怎么做?不妨假定: A降价而B维持,则A获利15,B损失5,整体获利10; A维持且B也维持,则A获利5,B获利10,整体获利15; A维持而B降价,则A损失10,B获利15,整体获利5; A降价且B也降价,则A损失5,B损失5,整体损失10。
从A角度看,显然降价要比维持好,降价至少可以保证比B好,在概率均等的情况下,A降价的收益为15×50%-5×50%=5,维持的收益为5×50%-10×50%=-2.5,为了自身利益的最大化,A就不可避免地选择了降价。从B角度看,效果也一样,降价同样比维持好,其降价收益为5,维持收益为2.5,它也同样会选择降价。在这轮博弈中,A、B都将降价作为策略,因此各损失5,整体损失10,整体收益是最差的。这就是此博弈最终所出现的纳什均衡。我们构造的这一电信业价格战博弈模型是典型的囚徒困境现象,各个局部都寻求利益的最大化,而整体利益却不是最优,甚至是最差。
许多其他行业的价格竞争都是典型的囚徒困境现象,如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。 二.OPEC组织成员国之间的合作与背叛
\囚徒困境\告诉我们,个人理性和集体理性之间存在矛盾,基于个人理性的正确选择会降低大家的福利,也就是说,基于个人利益最大化的前提下,帕累托改进得不到进行,帕累托最优得不到实现。
上述我们在对电信价格竞争的博弈分析中,只是一次性的\囚徒困境\博弈,因此得到了互相降价的纳什均衡。而在现实生活当中,信任与合作很少达到如此两难的境地,无论在自然界还是在人类社会,\合作\都是一种随处可见的现象。比如中东石油输出国组织(Organizationof Petroleum Exporting Countries?简称OPEC)的成立,本身就是要限制各石油生产国的产量,以保持石油价格,以便获取利润,是合作的产物。OPEC之所以能够成立,各组织成员国之间之所以能够合作,是因为囚徒困境如果是一次性博弈(One shot game)的话,基于个人利益最大化,得到纳什均衡解,但如果是多次博弈,人们就有了合作的可能性,囚徒困境就有可能破解,合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解,这也是博弈论上著名的\大众定理\
(Folk Theorem)的含义。
但合作的可能性不是必然性。博弈论的研究表明,要想使合作成为多次博弈的均衡解,博弈的一方(最好是实力更强的一方)必须主动通过可信的承诺(Credible commitment) ,向另一方表示合作的善意,努力把这个善意表达清楚,并传达出去。如果该困境同时涉及多个对手,则要在博弈对手中形成声誉,并用心地维护这个声誉。这里\可信的承诺\是一个很牵强的翻译,\commitment\并不是什么空口诺言,而是实实在在的付出。所以合作是非常困难的。 所以OPEC组织经常会有成员国不遵守组织的协定,私自增加石油产量。每个成员国都这样想,只要他们不增加产量,我增加一点点产量对价格没什么影响,结果每个国家都增加产量,造成石油价格下跌,大家的利润都受到损失。当然,一些产量增加较少的国家损失更多,于是也更加大量生产,造成价格进一步下降--结果,陷入一个困境:大家都增加产量,价格下跌,大家再增加产量,价格再下跌......。
理论上,几乎所有的卡特尔都会遭到失败,原因就在于卡特尔的协定(类似囚犯的攻守同盟)不是一个纳什均衡,没有成员有兴趣遵守。那么是不是不可能有卡特尔合作成功了?理论上,如果是无限期的合作,双方考虑长远利益,他们的合作是会成功的。但只要是有限次的合作,合作就不会成功。比如合作10次,那么在第九次博弈参与人就会采取不合作态度,因为大家都想趁最后一次机会捞一把,反正以后我也不会跟你合作了。但是大家料到第九次会出现不合作,那么就很可能在第八次就采取不合作的态度。第八次不合作会使大家在第七次就不合作......一直到,从第一次开始大家都不会采取合作态度。
以上是运用博弈论中的经典案例\囚徒困境\对现实经济生活的一些简单的理论上的分析,虽然在现实生活当中影响人们决策和态度的因素很多,但是,博弈论作为现代经济学的前沿领域,始终是一个强有力的分析工具。 http://jnumis0001.bokee.com/1262473.html
一个著名的博弈寓言:村庄里的大屠杀
在一个偏僻的山里,有一个村庄。这里是女人掌权,女人对一切事务说了算。村里有100对夫妇。
在这个村里已经形成了约定俗成的规定。如果女人发现自己的丈夫对自己不忠的话,就会毫不犹豫地将他杀死,而且就在当天执行。当然,她必须有确切的证据来证明她丈夫不忠。由于这个因素,某个女人发现某个男人不忠,她不会将之告诉那个不忠男人的妻子。但是,她会告诉其他人的妻子,并且女人们会相互传递这一信息,因此最后,一个男人不忠,除了其妻子不知道外,其他女人都知道。
而事实上是,村子里的这100对夫妇的男人都不忠,但由于女人不会将她知道的事实告诉不忠男人的妻子,每个女人都不知道自己的男人不忠。因此,该村子一直很稳定,而没
有发生妻子杀死丈夫的行为。
村子里有一个辈份很高的老太太,她德高望重,诚实可敬。每个人都向她汇报村里的情况,因此她对村里的情况了如指掌,她知道每个男人都不忠,当然,其他女人不知道她所知道的。
一天,这位老人对这100个女人说了一句很平常的话:“你们的男人当中至少有一个是不忠的。”于是,村里发生了这样一个事情:前99天,村里风平浪静,但到了第100天,村里发生了一场大屠杀,所有的女人都杀死了她们的丈夫。 故事就是这样的。 为什么会这样?
公共知识与行动均衡的打破这是一个推理和行动的过程。如果她的丈夫不忠的话,她就杀死他;如果没有证据证明她的丈夫不忠的话,她便相信他,不杀死他。这是女人的策略。 在老太太作了宣布之后的第一天,如果村里只有一个男人是不忠的话,这个男人的妻子在老太太宣布之后就能知道。因为,她会作这样一个推理:如果其他男人不忠的话,她应当事先知道,既然不知道并且至少有一个男人不忠,那么这个不忠的男人肯定就是她的丈夫。因此,村里如果只有一个男人不忠的话,老太太宣布之后,当天这个男人就会被杀死。 如果村里有两个男人不忠,那么,这两个男人的妻子第一天都不会怀疑到自己的丈夫,因为她知道另外一个女人的丈夫不忠。但是当第一天过后她没有发现那个不忠诚的男人被杀死,那么她会想,肯定有两个男人是不忠的,否则她知道的那个不忠的男人会被他的妻子当天杀死的。既然有两个男人不忠,但这两个不忠的男人的妻子想,她只知道一个,那么另一个不忠的男人肯定是她的丈夫!……
事实上这个村子里的100个男人不忠,那么,这样推理会继续到99天,就是说,前99天每个女人都没怀疑到自己的丈夫,而当第100天的时候,每个女人都确定地推理出她的丈夫不忠,于是村子里便发生了一场大屠杀,所有的男人都被他们的妻子杀死。
这里,在老太太宣布“至少一个男人是不忠的”这样一个事实时,每个女人其实都知道这个事实(村子里的规则她们也知道),老太太对这个事实的宣布似乎并没有增加这些女人的知识——关于村里男人不忠行为的知识。但为什么老太太的宣布使得村里的女人产生了对她们丈夫的屠杀行为呢?这是因为,老太太的宣布使得这个群体里的女人的知识结构发生了变化,本来“至少一个男人是不忠的”对每个女人都是知识,但不是公共知识,而老太太的宣布使得这个事实成为公共知识。 所谓公共知识是指,一群体的每个人不仅知道这个事实,而且每个人知道该群体的其他人知道这个事实,并且其他人也知道其他的每个人都知道这个事实……这涉及一个无穷的知道过程。
在上述例子中,老太太未宣布之前,对村子里的女人来说,“至少一个男人是不忠的”不是一个公共知识。设想一下,假定共有3个女人A、B、C,那么在未宣布之前,A想:由于自己不知道自己的丈夫不忠,其他两个女人B、C也同样不知道,那么A想B不知道C是否知道“至少有一个男人是不忠的”。而当老太太宣布了“至少一个男人是不忠的”之后,“至少一个男人是不忠的”便成了A、B、C之间的公共知识。
在这个100人组成的小村里,老太太的宣布使得“至少一个男人是不忠的”成了公共知识。于是,推理与行动便开始了。这是大屠杀的原因!
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库博弈论经典例子(3)在线全文阅读。
相关推荐: