博弈论案例分析

指纹锁前十名品牌多少钱

博弈论分析

一、经济学中的“智猪博弈”（Pigs’payoffs）

这个例子讲的是：猪圈里有两头猪，一头大猪，一头小猪。猪圈的一边有个踏板，每踩一下踏板，在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板，另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时，大猪会在小猪跑到食槽之前刚好吃光所有的食物；若是大猪踩动了踏板，则还有机会在小猪吃完落下的食物之前跑到食槽，争吃到另一半残羹。

那么，两只猪各会采取什么策略？答案是：小猪将选择“搭便车”策略，也就是舒舒服服地等在食槽边；而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。

原因何在？因为，小猪踩踏板将一无所获，不踩踏板反而能吃上食物。对小猪而言，无论大猪是否踩动踏板，不踩踏板总是好的选择。反观大猪，已明知小猪是不会去踩动踏板的，自己亲自去踩踏板总比不踩强吧，所以只好亲力亲为了。

“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是：每次落下的事物数量和踏板与投食口之间的距离。

如果改变一下核心指标，猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗？试试看。

饶威改变方案一：减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩，大猪将会把食物吃完；大猪去踩，小猪将也会把食物吃完。谁去踩踏板，就意味着为对方贡献食物，所以谁也不会有踩踏板的动力了。

如果目的是想让猪们去多踩踏板，这个游戏规则的设计显然是失败的。

改变方案二：增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃，谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会，所以竞争意识却不会很强。

对于游戏规则的设计者来说，这个规则的成本相当高（每次提供双份的食物）；而且因为竞争不强烈，想让猪们去多踩踏板的效果并不好。

改变方案三：减量加移位方案。投食仅原来的一半分量，但同时将投食口移到踏板附近。结果呢，小猪和大猪都在拼命地抢着踩踏板。等待者不得食，而多劳者多得。每次的收获刚好消费完。

对于游戏设计者，这是一个最好的方案。成本不高，但收获最大。

原版的“智猪博弈”故事给了竞争中的弱者（小猪）以等待为最佳策略的启发。但是对于社会而言，因为小猪未能参与竞争，小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置，规则的设计者是不愿看见有人搭便车的，政府如此，公司的老板也是如此。而能否完全杜绝“搭便车”现象，就要看游戏规则的核心指标设置是否合适了。

比如，公司的激励制度设计，奖励力度太大，又是持股，又是期权，公司职员个个都成了百万富翁，成本高不说，员工的积极性并不一定很高。这相当于“智猪博弈”增量方案所描述的情形。但是如果奖励力度不大，而且见者有份（不劳动的“小猪”也有），一度十分努力的大猪也不会有动力了----就象“智猪博弈”减量方案一所描述的情形。最好的激励机制设计就象改变方案三----减量加移位的办法，奖励并非人人有份，而是直接针对个人（如业务按比例提成），既节约了成本（对公司而言），又消除了“搭便车”现象，能实现有效的激励。

许多人并未读过“智猪博弈”的故事，但是却在自觉地使用小猪的策略。股市上等待庄家抬轿的散户；等待产业市场中出现具有赢利能力新产品、继而大举仿制牟取暴利的游资；公司里不创造效益但分享成果的人，等等。因此，对于制订各种经济管理的游戏规则的人，必须深谙“智猪博弈”指标改变的个中道理。

二、囚徒困境博弈

在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”（prisoners’ dilemma）博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果一个犯罪嫌疑人坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪。如果另一个犯罪嫌疑人也作了坦白，则两人各被判刑8年；如果另一个犯罪嫌人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵。

表囚徒困境博弈 [Prisoner's dilemma]

B　坦白 B　抵赖

A 坦白 –8, –8 0, –10

A 抵赖 –10, 0 –1, –1

我们来看看这个博弈可预测的均衡是什么。对A来说，尽管他不知道B作何选择，但他知道无论B选择什么，他选择“坦白”总是最优的。显然，根据对称性，B也会选择“坦白”，结果是两人都被判刑8年。但是，倘若他们都选择“抵赖”，每人只被判刑1年。在表2.2中的四种行动选择组合中，（抵赖、抵赖）是帕累托最优的，因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。不难看出，“坦白”是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡。

要了解纳什的贡献，首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子，每本书上的例子都大同小异。

博弈论毕竟是数学，更确切地说是运筹学的一个分支，谈经论道自然少不了数学语言，外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题，所以不能不食人间烟火。其实这一理论是从棋弈、扑克和战争等带有竞赛、对抗和决策性质的问题中借用的术语，听上去有点玄奥，实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局，常常寓深刻道理于游戏之中。所以，多从我们的日常生活中的凡人小事入手，以我们身边的故事做例子，娓娓道来，并不乏味。

话说有一天，一位富翁在家中被杀，财物被盗。警方在此案的侦破过程中，抓到两个犯罪嫌疑人，斯卡尔菲丝和那库尔斯，并从他们的住处搜出被害人家中丢失的财物。但是，他们矢口否认曾杀过人，辩称是先发现富翁被杀，然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离，分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。

检察官说，“由于你们的偷盗罪已有确凿的证据，所以可以判你们一年刑期。但是，我可以和你做个交易。如果你单独坦白杀人的罪行，我只判你三个月的监禁，但你的同伙要被判十年刑。如果你拒不坦白，而被同伙检举，那么你就将被判十年刑，他只判三个月的监禁。但是，如果你们两人都坦白交代，那么，你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢？他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖，结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以，按照亚当·斯密的理论，每一个人都是从利己的目的出发，他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月，但前提是同伙抵赖，显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此，坦白还有更多的好处。如果对方坦白了而自己抵赖了，那自己就得坐10年牢。太不划算了！因此，在这种情况下还是应该选择坦白交代，即使两人同时坦白，至多也只判5年，总比被判 10年好吧。所以，两人合理的选择是坦白，原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。

这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”，也叫非合作均衡。因为，每一方在选择策略时都没有“共谋”(串供)，他们只是选择对自己最有利的策略，而不考虑社会福利或任何其他对手的利益。也就是说，这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突，各人追求利己行为而导致的最终结局是一个“纳什均衡”，也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己，这样他们必然要服长的刑期。只有当他们都首先替对方着想时，或者相互合谋(串供)时，才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当·斯密的“看不见的手”的原理提出挑战。按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果。

不妨让我们重温一下这位经济学圣人在《国富论》中的名言：“通过追求(个人的)自身利益，他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论：从利己目的出发，结果损人不利己，既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说，“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此，从“纳什均衡”中我们还可以悟出一条真理：合作是有利的“利己策略”。但它必须符合以下黄金律：按照你愿意别人对你的方式来对别人，但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次，“纳什均衡”是一种非合作博弈均衡，在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯·诺依曼和摩根斯特恩的合作博弈理论的重大发展，甚至可以说是一场革命。

从“纳什均衡”的普遍意义中我们可以深刻领悟司空见惯的经济、社会、政治、国防、管理和日常生活中的博弈现象。我们将例举出许多类似于“囚徒的两难处境” 这样的例子。如价格战博弈、军奋竞赛博弈、污染博弈等等。一般的博弈问题由三个要素所构成：即局中人(players)又称当事人、参与者、策略等等的集合，策略 (strategies)集合以及每一对局中人所做的选择和赢得(payoffs)集合。其中所谓赢得是指如果一个特定的策略关系被选择，每一局中人所得到的效用。所有的博弈问题都会遇到这三个要素。

美国密西根大学一位叫做罗伯特·爱克斯罗德的人。爱克斯罗德是一个政治科学家，他组织了一场计算机竞赛。这个竞赛的思路非常简单：任何想参加这个计算机竞赛的人都扮演“囚徒困境”案例中一个囚犯的角。他们把自己的策略编入计算机程序，然后他们的程序会被成双成对地融入不同的组合。分好组以后，参与者就开始玩“囚徒困境”的游戏。他们每个人都要在合作与背叛之间做出选择。关键问题在于，他们不只玩一遍这个游戏，而是一遍一遍地玩上200次。这就是博弈论专家所谓的“重复的囚徒困境”。

“重复的囚徒困境”更逼真地反映了具有经常而长期性的人际关系。而且，这种重复的游戏允许程序在做出合作或背叛的抉择时参考对手程序前几次的选择。如果两个程序只玩过一个回合，则背叛显然就是唯一理性的选择。但如果两个程序已经交手过多次，则双方就建立了各自的历史档案，用以记录与对手的交往情况。同时，它们各自也通过多次的交手树立了或好或差的声誉。虽然如此，对方的程序下一步将会如何举动却仍然极难确定。实际上，这也是该竞赛的组织者爱克斯罗德希望从这个竞赛中了解的事情之一。一个程序总是不管对手作何种举动都采取合作的态度吗？或者，它能总是采取背叛行动吗？它是否应该对对手的举动回之以更为复杂的举措？如果是，那会是怎么样的举措呢？

事实上，竞赛的第一个回合交上来的14个程序中包含了各种复杂的策略。但使爱克斯罗德和其他人深为吃惊的是，竞赛的桂冠属于其中最简单的策略：一报还一报。我把它叫做“以其人之道，还治其人之身”。

“一报还一报”的策略是这样的：它总是以合作开局，但从此以后就采取以其人之道还治其人之身的策略。也就是说，一报还一报的策略实行了胡萝卜加大棒的原则。它永远不先背叛对方，从这个意义上来说它是“善意的”。它会在下一轮中对对手的前一次合作给予回报（哪怕以前这个对手曾经背叛过它），从这个意义上来说它是“宽容的”。但它会采取背叛的行动来惩罚对手前一次的背叛，从这个意义上来说它又是“强硬的”。而且，它的策略极为简单，对手程序一望便知其用意何在，从这个意义来说它又是“简单明了的”。

三、价格战博弈

现在我们经常会遇到各种各样的家电价格大战，彩电大战、冰箱大战、空调大战、微波炉大战……这些大战的受益者首先是消费者。每当看到一种家电产品的价格大战，百姓都会“没事儿偷着乐”。在这里，我们可以解释厂家价格大战的结局也是一个“纳什均衡”，而且价格战的结果是谁都没钱赚。因为博弈双方的利润正好是零。竞争的结果是稳定的，即是一个“纳什均衡”。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对厂商而言意味着自杀。从这个案例中我们可以引伸出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个有效率的零利润结局。二是如果不采取价格战，作为一种敌对博弈论 (vivalry game)其结果会如何呢？每一个企业，都会考虑采取正常价格策略，还是采取高价格策略形成垄断价格，并尽力获取垄断利润。如果垄断可以形成，则博弈双方的共同利润最大。这种情况就是垄断经营所做的，通常会抬高价格。另一个极端的情况是厂商用正常的价格，双方都可以获得利润。从这一点，我们又引出一条基本准则：“把你自己的战略建立在假定对手会按其最佳利益行动的基础上”。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，每一个厂商或消费者都是按照所有的别人已定的价格来进行决策。在这种均衡中，每一企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。在完全竞争的情况下，非合作行为导致了社会所期望的经济效率状态。如果厂商采取合作行动并决定转向垄断价格，那么社会的经济效率就会遭到破坏。这就是为什么WTO和各国政府要加强反垄断的意义所在。

四、污染博弈：

假如市场经济中存在着污染，但政府并没有管制的环境，企业为了追求利润的最大化，宁愿以牺牲环境为代价，也绝不会主动增加环保设备投资。按照看不见的手的原理，所有企业都会从利己的目的出发，采取不顾环境的策略，从而进入“纳什均衡”状态。如果一个企业从利他的目的出发，投资治理污染，而其他企业仍然不顾环境污染，那么这个企业的生产成本就会增加，价格就要提高，它的产品就没有竞争力，甚至企业还要破产。这是一个“看不见的手的有效的完全竞争机制”失败的例证。直到20世纪90年代中期，中国乡镇企业的盲目发展造成严重污染的情况就是如此。只有在政府加强污染管制时，企业才会采取低污染的策略组合。企业在这种情况下，获得与高污染同样的利润，但环境将更好。

五、贸易战博弈论

这个问题对于刚刚加入WTO的中国而言尤为重要。任何一个国家在国际贸易中都面临着保持贸易自由与实行贸易保护主义的两难选择。贸易自由与壁垒问题，也是一个“纳什均衡”，这个均衡是贸易双方采取不合作博弈的策略，结果使双方因贸易战受到损害。X国试图对Y国进行进口贸易限制，比如提高关税，则Y国必然会进行反击，也提高关税，结果谁也没有捞到好处。反之，如X和Y能达成合作性均衡，即从互惠互利的原则出发，双方都减少关税限制，结果大家都从贸易自由中获得了最大利益，而且全球贸易的总收益也增加了。

博弈论--这是一个热得烫手的概念。它不仅仅存在于数学的运筹学中，也正在经济学中占据越来越重要的地位（近几年诺贝尔经济学奖就频频授予博弈论研究者），但如果你认为博弈论的应用领域仅限于此的话，那你就大错了。实际上，博弈论甚至在我们的工作和生活中无处不在！在工作中，你在和上司博弈，也在和下属博弈，你也同样会跟其他相关部门人员博弈；而要开展业务，你更是在和你的客户以及竞争对手博弈。在生活中，博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。

诺贝尔经济学奖获得者包罗·萨缪尔逊如是说：要想在现代社会做个有价值的人,你就必须对博弈论有个大致的了解。也可以这样说,要相赢得生意,不可不学博弈论;要想赢得生活,同样不可不学博弈论。

弈中最优策略的产生

艾克斯罗德（Robert Axelrod）在开始研究合作之前，设定了两个前提：一、每个人都是自私的；二、没有权威干预个人决策。也就是说，个人可以完全按照自己利益最大化的企图进行决策。在此前提下，合作要研究的问题是：第一、人为什么要合作；第二、人什么时候是合作的，什么时候又是不合作的；第三、如何使别人与你合作。

社会实践中有很多合作的问题。比如国家之间的关税报复，对他国产品提高关税有利于保护本国的经济，但是国家之间互提关税，产品价格就提高了，丧失了竞争力，损害了国际贸易的互补优势。在对策中，由于双方各自追求自己利益的最大化，导致了体利益的损害。对策论以著名的囚犯困境来描述这个问题。

A和B各表示一个人，他们的选择是完全无差异的。选择C代表合作，选择D代表不合作。如果AB都选择C合作，则两人各得3分；如果一方选C，一方选D，则选C的得零分，选D的得5分；如果AB都选D，双方各得1分。

显然，对体来说最好的结果是双方都选C，各得3分，共得6分。如果一方选C，一方选D，总体得5分。如果两人都选D，总体得2分。

对策学界用这个矩阵来描述个体理性与体理性的冲突：每个人在追求个体利益最大化时，就使体利益受损，这就是囚徒困境。在矩阵中，对于A来说，当对方选 C，他选D得5分，选C只得3分；当对方选D，他选D得1分，选C得零分。因此，无论对方选C或D，对A来说，选D都得分最多。这是A单方面的优超策略。而当两个优超策略相遇，即A，B都选D时，结果是各得1分。这个结果在矩阵中并非最优。困境就在于，每个人采取各自的优超策略时，得出的解是稳定的，但不是帕累托最优的，这个结果体现了个体理性与体理性的矛盾。在数学上，这个一次性决策的矩阵没有最优解。

如果博弈进行多次，只要对策者知道博弈次数，他们在最后一次肯定采取互相背叛的策略。既然如此，前面的每一次也就没有合作的必要，因此，在次数已知的多次博弈中，对策者没有一次会合作。

如果博弈在多人间进行，而且次数未知，对策者就会意识到，当持续地采取合作并达成默契时，对策者就能持续地各得3分，但如果持续地不合作的话，每个人就永远得1分。这样，合作的动机就显现出来。多次对局下，未来的收益应比现在的收益多一个折现率W，W越大，表示未来的收益越重要。在多人对策持续进行下去，且W比较大，即未来充分重要时，最优的策略是与别人采取的策略有关的。假设某人的策略是，第一次合作，以后只要对方不合作一次，他就永不合作。对这种对策者，当然合作下去是上策。假如有的人不管对方采取什么策略，他总是合作，那么总是对他采取不合作的策略得分最多。对于总是不合作的人，也只能采取不合作的策略。

艾克斯罗德做了一个实验，邀请多人来参加游戏，得分规则与前面的矩阵相同，什么时候结束游戏是未知的。他要求每个参赛者把追求得分最多的策略写成计算机程序，然后用单循环赛的方式将参赛程序两两博弈，以出什么样的策略得分最高。

第一轮游戏有14个程序参加，再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作)，运转了300次。结果得分最高的程序是加拿大学者罗伯布写的"一报还一报"(tit for tat)。这个程序的特点是，第一次对局采用合作的策略，以后每一步都跟随对方上一步的策略，你上一次合作，我这一次就合作，你上一次不合作，我这一次就不合作。艾克斯罗德还发现，得分排在前面的程序有三个特点：第一，从不首先背叛，即"善良的"；第二，对于对方的背叛行为一定要报复，不能总是合作，即" 可激怒的"；第三，不能人家一次背叛，你就没完没了的报复，以后人家只要改为合作，你也要合作，即"宽容性"。

为了进一步验证上述结论，艾氏决定邀请更多的人再做一次游戏，并把第一次的结果公开发表。第二次征集到了62个程序，加上他自己的随机程序，又进行了一次竞赛。结果，第一名的仍是"一报还一报"。艾氏总结这次游戏的结论是：第一，"一报还一报"仍是最优策略。第二，前面提到的三个特点仍然有效，因为63人中的前15名里，只有第8名的哈灵顿程序是"不善良的"，后15名中，只有1个总是合作的是"善良的"。可激怒性和宽容性也得到了证明。此外，好的策略还必须具有的一个特点是"清晰性"，能让对方在三、五步对局内辨识出来，太复杂的对策不见得好。"一报还一报"就有很好的清晰性，让对方很快发现规律，从而不得不采取合作的态度。

[编辑]合作的进行过程及规律

"一报还一报"的策略在静态的体中得到了很好的分数，那么，在一个动态的进化的体中，这种合作者能否产生、发展、生存下去呢？体是会向合作的方向进化，还是向不合作的方向进化？如果大家开始都不合作，能否在进化过程中产生合作？为了回答这些疑问，艾氏用生态学的原理来分析合作的进化过程。

假设对策者所组成的策略体是一代一代进化下去的，进化的规则包括：一，试错。人们在对待周围环境时，起初不知道该怎么做，于是就试试这个，试试那个，哪个结果好就照哪个去做。第二，遗传。一个人如果合作性好，他的后代的合作基因就多。第三，学习。比赛过程就是对策者相互学习的过程，"一报还一报"的策略好，有的人就愿意学。按这样的思路，艾氏设计了一个实验，假设63个对策者中，谁在第一轮中的得分高，他在第二轮的体中所占比例就越高，而且是他的得分的正函数。这样，体的结构就会在进化过程中改变，由此可以看出体是向什么方向进化的。

实验结果很有趣。"一报还一报"原来在体中占1/63，经过1000代的进化，结构稳定下来时，它占了24%。另外，有一些程序在进化过程中消失了。其中有一个值得研究的程序，即原来前15名中唯一的那个"不善良的"哈灵顿程序，它的对策方案是，首先合作，当发现对方一直在合作，它就突然来个不合作，如果对方立刻报复它，它就恢复合作，如果对方仍然合作，它就继续背叛。这个程序一开始发展很快，但等到除了"一报还一报"之外的其它程序开始消失时，它就开始下降了。因此，以合作系数来测量，体是越来越合作的。

进化实验揭示了一个哲理：一个策略的成功应该以对方的成功为基础。"一报还一报"在两个人对策时，得分不可能超过对方，最多打个平手，但它的总分最高。它赖以生存的基础是很牢固的，因为它让对方得到了高分。哈灵顿程序就不是这样，它得到高分时，对方必然得到低分。它的成功是建立在别人失败的基础上的，而失败者总是要被淘汰的，当失败者被淘汰之后，这个好占别人便宜的成功者也要被淘汰。

那么，在一个极端自私者所组成的不合作者的体中，"一报还一报"能否生存呢？艾氏发现，在得分矩阵和未来的折现系数一定的情况下，可以算出，只要体的 5%或更多成员是"一报还一报"的，这些合作者就能生存，而且，只要他们的得分超过体的总平均分，这个合作的体就会越来越大，最后蔓延到整个体。反之，无论不合作者在一个合作者占多数的体中有多大比例，不合作者都是不可能自下而上的。这就说明，社会向合作进化的棘轮是不可逆转的，体的合作性越来越大。艾克斯罗德正是以这样一个鼓舞人心的结论，突破了"囚犯困境"的研究困境。

在研究中发现，合作的必要条件是：第一、关系要持续，一次性的或有限次的博弈中，对策者是没有合作动机的；第二、对对方的行为要做出回报，一个永远合作的对策者是不会有人跟他合作的。

那么，如何提高合作性呢？首先，要建立持久的关系，即使是爱情也需要建立婚姻契约以维持双方的合作。（火车站的小贩为什么要骗人？为什么工作中要形成小组制度？换防的时候一方总是要小小地进攻一下的，在中越前线就是这样）第二、要增强识别对方行动的能力，如果不清楚对方是合作还是不合作，就没法回报他了。第三、要维持声誉，说要报复就一定要做到，人家才知道你是不好欺负的，才不敢不与你合作。第四、能够分步完成的对局不要一次完成，以维持长久关系，比如，贸易、谈判都要分步进行，以促使对方采取合作态度。第五、不要嫉妒人家的成功，"一报还一报"正是这样的典范。第六、不要首先背叛，以免担上罪魁祸首的道德压力。第七、不仅对背叛要回报，对合作也要作出回报。第八、不要耍小聪明，占人家便宜。

艾克斯罗德在《合作的进化》一书结尾提出几个结论。第一、友谊不是合作的必要条件，即使是敌人，只要满足了关系持续，互相回报的条件，也有可能合作。比如，第一次世界大战期间，德英两军在战壕战中遇上了三个月的雨季，双方在这三个月中达成了默契，互相不攻击对方的粮车给养，到大反攻时再你死我活地打。这个例子说明，友谊不是合作的前提。第二、预见性也不是合作的前提，艾氏举出生物界低等动物、植物之间合作的例子来说明这一点。但是，当有预见性的人类了解了合作的规律之后，合作进化的过程就会加快。这时，预见性是有用的，学习也是有用的。

喜马拉雅山有多高当游戏中考虑到随机干扰，即对策者由于误会而开始互相背叛的情形时，吴坚忠博士经研究发现，以修正的"一报还一报"，即以一定的概率不报复对方的背叛，和 "悔过的一报还一报"，即以一定的概率主动停止背叛。体所有成员处理随机环境的能力越强，"悔过的一报还一报"效果越好，"宽大的一报还一报"效果越差。

[编辑]艾克斯罗德的贡献与局限性

艾克斯罗德通过数学化和计算机化的方法研究如何突破囚徒困境，达成合作，将这项研究带到了一个全新境界，他在数学上的证明无疑是十分雄辩和令人信服的，而且，他在计算机模拟中得出的一些结论是非常惊人的发现，比如，总分最高的人在每次博弈中都没有拿到最高分。（刘邦和项羽的战争）

艾氏所发现的"一报还一报"策略，从社会学的角度可以看作是一种"互惠式利他"，这种行为的动机是个人私利，但它的结果是双方获利，并通过互惠式利他有可能覆盖了范围最广的社会生活，人们通过送礼及回报，形成了一种社会生活的秩序，这种秩序即使在多年隔绝，语言不通的人之间也是最易理解的东西。比如，哥伦布登上美洲大陆时，与印地安人最初的交往就开始于互赠礼物。有些看似纯粹的利他行为，比如无偿损赠，也通过某些间接方式，比如社会声誉的获得，得到了回报。研究这种行为，将对我们理解社会生活有很重要的意义。

囚徒困境扩展为多人博弈时，就体现了一个更广泛的问题──"社会悖论"，或"资源悖论"。人类共有的资源是有限的，当每个人都试图从有限的资源中多拿一点儿时，就产生了局部利益与整体利益的冲突。人口问题、资源危机、交通阻塞，都可以在社会悖论中得以解释，在这些问题中，关键是通过研究，制定游戏规则来控制每个人的行为。

艾克斯罗德的一些结论在中国古典文化道德传统中可以很容易地到对应，"投桃报李"、"人不犯我，我不犯人"都体现了"tit for tat"的思想。但这些东西并不是最优的，因为"一报还一报"在充满了随机性的现实社会生活里是有缺陷的。对此，孔子在几千年前就说出了"以德报德，以直报怨"这样精彩的修正策略，所谓"直"，就是公正，以公正来回报对方的背叛，是一种修正了的"一报还一报"，修正的是报复的程度，本来会让你损失5分，现在只让你损失3分，从而以一种公正审判来结束代代相续的报复，形成文明。

但是，艾氏对博弈者的一些假设和结论使其研究不可避免地与现实脱节。首先，《合作的进化》一书暗含着一个重要的假定，即，个体之间的博弈是完全无差异的。现实的博弈中，对策者之间绝对的平等是不可能达到的。一方面，对策者在实际的实力上有差异，双方互相背叛时，可能不是各得1分，而是强者得5分，弱者得0分，这样，弱者的报复就毫无意义。另一方面，即使对局双方确实旗鼓相当，但某一方可能怀有赌徒心理，认定自己更强大，采取背叛的策略能占便宜。艾氏的得分矩阵忽视了这种情形，而这种赌徒心理恰恰在社会上大量引发了零和博弈。因此，程序还可以在此基础上进一步改进。

其次，艾氏认为合作不需预期和信任。这是他受到质疑颇多之处。对策者根据对方前面的战术来制定自己下面的战术，合作要求个体能够识别那些曾经相遇过的个体并且记得与其相互作用的历史，以便作出反应，这些都暗含着"预期"行为。在应付复杂的对策环境时，信任可能是对局双方达成合作的必不可少的环节。但是，预期与信任如何在计算机的程序中体现出来，仍是需要研究的。

最后，重复博弈在现实中是很难完全实现的。一次性博弈的大量存在，引发了很多不合作的行为，而且，对策的一方在遭到对方背叛之后，往往没有机会也没有还手之力去进行报复。比如，资本积累阶段的违约行为，国家之间的核威慑。在这些情况下，社会要使交易能够进行，并且防止不合作行为，必须通过法制手段，以法律的惩罚代替个人之间的"一报还一报"，规范社会行为。这是艾克斯罗德的研究对制度学派的一个重要启发。

[编辑]博弈论案例分析

[编辑]案例一:博弈论在企业人力资本投资中的应用[1]

一、引言

一个企业能否在市场中取得经济优势,依赖于企业科技优势、产品的市场适应性等等,而这一切又源于人才优势。因此,一个企业面临着如何尽可能地保持自己人力资源的优势,如何吸引优秀人才加入企业添加新动力,如何有效培训使己有员工获得技能的提高,如何使员工适应外部环境变化的要求,如何有效挽留公司的核心人才等等。但是统计调查显示,我国的培训现状不尽如人意。总体来看,我国企业培训管理的制度化、规范化程度有待加强,培训计划执行不力,培训效果跟踪与评价环节薄弱,培训对改善员工绩效的效用没有发挥,培训结果与员工晋升没有太大影响等。造成这种现状的原因固然是多方面的,其中一个主要原因就是人力资本投资收益的滞后性和不确定性,担心员工“硬了翅膀就飞走”,得不偿失。企业是否增加人力资本投资,员工是否留任企业,都是利益的博弈,结果是选择有利于自己的战略。本文用博弈论对企业人力资本投资作分析,说明企业应当进行人力资本投资和投资后应采取措施保证人力资本投资收益的获取。

二、概念和假定

1.概念界定

①人力资本。人力资本是通过投资于已有人力资源而形成的、以复杂劳动力为载体的、能实现价值增值的可变资本。

②企业人力资本投资。企业人力资本投资是指企业通过一定的投入(货币、资本或实物)获得人力资源,增加企业员工的知识、技能、健康水平,提高企业管理、文化水平和企业形象,从而提升企业人力资本存量,使企业经济效益提高的一种投资行为。

2.基本假设

①经济人。经济人假设是指无论是组织还是个人,追求自身利益的最大化。

②完全信息。完全信息是指信息是完全通畅的,不存在滞塞,而且客观存在的信息的获取是不需要成本的。

③物质资本充足。商品的生产总是物质资本和人力资本结合在一起进行的。

要使生产高效率的进行,物质资本和人力资本必须保持适当的比例。

三、人力资本投资与员工个人的博弈分析

本文从企业与员工之间的角度作人力资本投资的完全信息静态博弈分析,重点分析企业是否增加人力资本投资以及投资后如何行动。

假定在完全信息的条件下,企业和员工都是理性的。企业可以选择对员工培训或不培训。根据企业的选择,员工会做出留下或是转投其他企业的选择。假设企业不对员工进行培训是员工的收入为d,当企业选择培训,假设分摊到员工个人的培训费用为c,经过培训后多支付员工的薪水为e(e可以为零,即经过培训后不增加员工薪水),经过培训后员工为企业带来的收益增加值为b。又假设员工离职去另一单位获得的报酬为a。这里为了分析更简单一些,假设员工经过培训与未经过培训跳槽的收入一样,都为a。有时候培训后由于员工技能提高跳槽会获得更多的收入,但是并不影响下面的分析。企业培训博弈分析如表1所示: 当b-c-e<0时,即企业对员工培训后得到的收益增加值小于支出时,不管员工做出如何决策,企业都不会得到任何的收益增加值,因此企业是不会对员工进行培训投入的。

当b-c-e>0时,该博弈成立并可能会出现两种均衡:如果此时员工选择留下所获得的收益d+e大于其选择跳槽时所获的收益a时,理性的员工必定会留在原来的企业,企业也必然会选择培训投入,这也是这个博弈中双方的最优决策;如果此时员工选择留下所获得的收益d+e小于其选择跳槽时所获的收益a时,理性的员工必定选择跳槽,此时企业损失为c,损失最惨重。对企业而言,如果知道这样做令员工跳槽的话,那么企业还不如刚开始就不培训,那样蒙受的损失会少些。这里需要指出的是,一个员工是否跳槽并不简单的取决于对方企业开出的薪酬。影响因素有很多,比如员工个性是否与企业匹配、员工个人发展前景、员工兴趣与岗位的匹配等等。上述表格中,企业如果不对员工进行培训,那么员工留下或离职取决于现有收入d和跳槽企业的薪酬a。

如果d>a,员工留下:反之员工跳槽

总之,员工是否留任企业,是一种利益的博弈,并且企业与员工之间存在着信息的不对称,企业必须采取先发行动传递信号减弱员工离任的动机,只要企业能留住员工,人力资本投资就会给企业带来巨大的经济效益。

[编辑]案例二:博弈论在企业经营活动的应用策略[2]

哈佛商学院波特教授的竞争五种力量,给出了我们思考行业市场竞争状况和态势时一种全面而详细的分析方法,其中一种力量是潜在进入者的威胁。

那么,根据市场类型(完全竞争市场、垄断竞争市场、完全垄断市场和寡头垄断市场),由于多数行业市场属于垄断竞争市场,就存在现有企业和新进入者之间的进入和退出博弈,这取决于彼此结构性的进入障碍、对关键资源的控制度、规模经济效应及现有企业的市场优势的因素。

如果你是现有行业的垄断者和一定程度的影响者,阻止潜在进入者进入市场或遏止现有企业恶性竞争的博弈策略有:

1.扩大生产能力策略

垄断者为阻止潜在进入者进入市场,垄断者可能对潜在进入者进行威胁。但垄断者的这种威胁是否能达到阻止进入的目的,取决于其承诺。所谓承诺(Promise),是指对局者所采取的某种行动,这种行动使其威胁成为一种令人可信的威胁。那么,一种威胁在什么条件下会变得令人可信呢?一般是,只有当对局者在不实行这种威胁会遭受更大损失的时候,与承诺行动相比,空头威胁无法有效阻止市场进入的主要原因是,它是不需要任何成本的。发表声明是容易的,仅仅宣称将要做什么或者标榜自己是说一不二的人也都缺乏实质性的意义。因此,只有当对局者采取了某种行动,而且这种行动需要较高的成本或代价,才会使威胁变得可信。

2.保证最低价格条款的策略

所谓“保证最低价格”条款策略,即可采取限制性定价策略,通过收取低于进入发生时的价格来防范进入。如某商店规定,顾客在本商店购买这种商品一定时期内(如一个月),如果其他任何商店以更低的价格出售同样的商品,本店将退还差价,并补偿差额的一定百分比(如10% )。例如,如果你在该商店花5 000元购买了一架尼康相机,一周后你在另一家商店发现那里只卖4500元,那么你就可以向该商店交涉,并获得550元的退款。

又如假定一个将存在两期的市场。在第1期只有一个厂商,面临两种选择:

①制定一个垄断高价60元,可获1 000元的利润,但会使潜在企业认为该行业有利可图,从而选择在第2期进入;而一旦该市场有两个企业存在,将会使市场价格下降到30元,企业利润降为200元。这样,两期的总利润是1000+200=1200元。

②制定低价40元,潜在企业如果进来,价格降到20元,两个企业的利润都将是0。

故此时潜在企业将不会进入。这样,第二期的价格可以确定一个垄断高价60元,因此总利润将为600+1000=1600元。

对消费者来说,保证最低价格条款使你至少在一个月内不会因为商品降价而后悔你的购买,但这种条款对消费者是承诺,对竞争者是警告,无疑是企业之间竞争的一种手段。

保证最低价格条款是一种承诺,由于法律的限制,商店在向消费者公布了这一条款之后是不能不实行的,因此它是绝对可信的。这一承诺隐含着企业A向企业B发出的不要降价竞争的威胁,并使这种威胁产生其预期的效果。

3.限制进入定价策略

限制进入定价是指现有企业通过收取低于进入发生的价格的策略来防范进入,潜在进入者看到这一低价后,推测出进入后价格也会那么低甚至更低,因而进入该市场终将无利可图而放弃进入。

4.掠夺性定价策略

掠夺性定价是指将价格设定为低于成本来达到驱逐其他企业的目的,而期望由此发生的损失在新进入企业或者竞争对手被逐出市场后,掠夺企业能够行使市场权力时可能得到补偿,即在驱逐其他企业后,再制定垄断高价以弥补前期的损失。这也是一种价格报复策略。掠夺性定价与限制定价之间的差异在于限制定价是针对那些尚未进入市场的企业,是想较长一段时间内维持低价来限制新企业的进入,而掠夺性定价则将矛头指向已经进入的企业或即将来临之际。如你产能过剩,在新企业进入时可以进行产能扩张,将商品大幅降价防堵其进入。

5.广告战博弈

有些商品只有在使用后才知道其质量真正如何,我们把这种商品称为经验品。只有生产那些高质量经验品的企业才会选择做巨额广告,而低质量的企业将不会做广告。原因是高质量经验品会有大量的回头客,而低质量经验品则鲜有人再次光顾。

另外现有厂商之间产量、价格竞争的博弈,尚有古诺模型、伯川德模型可以描述。博弈理论在宏微观层面对企业参与竞争、制定竞争策略均有指导意义。著名营销专家希顿曾说,企业家的艺术就是对企业的策略性经营和管理,博弈作为策略,企业在当今激烈的市场竞争中需要博弈!

[编辑]案例三:博弈论在企业管理中的应用[3]

什么净水器最好一、博弈论在企业决策中的应用

1.博弈论成果与经营决策

博弈论的研究成果可直接运用于现代企业的经营决策之中。在市场经济条件下，企业之间的竞争日益加剧，行业内的竞争逐渐表现为几个大型集团之间的直接对抗。从博弈定义来看，这类问题都可归结为博弈问题。因此企业运用博弈论中的决策模型进行决策，将使决策过程更加合理化。当今社会，各个方面的竞争性和对抗性日益加剧，人们对自身行为、理性决策和对效率的追求日益增高，现代企业管理充满了博弈的思想。

2.博弈论与企业最优决策

在社会经济生活中，企业或个人为了自身利益的最大化，面对市场会做出自己的最优决策，不同的市场情形会影响经济主体人的决策行为。在完全竞争市场条件下，企业会根据给定商品的市场价格计算出生产和供应到市场上的商品的数量，以实现最大的利润。而寡头市场的情形要比完全竞争市场复杂得多。企业大量面对的是信息不完全的市场，企业不知道面对强大的竞争对手该如何做出抉择，市场的时效性要求企业必须在信息不完全的情况下做出决策。在这样的决策中存在着三个合理的假设。

春望原文第一，理性的“经济人”。每一个行为主体都依据自身利益的最大化作为行动的出发点。

第二，每一个行为主体做出的决策都不是在真空的世界中。现实的世界使得一个人的生存必须以他人的生存为前提。这种相互依赖的关系使得一个行为主体的决策会对其他行为主体产生重要的影响，其他行为主体的决策也会直接影响着这个行为主体的决策结果。

第三，寡头市场的情形。也即一个行业里面只有少数几家企业，甚至只有两三家企业，每一方的市场份额都很大。由于竞争对手很少，每一个主体的行为产生的后果受对手行为的影响都很大。那么这样的决策就带有了博弈的彩。

3.博弈均衡理论与企业决策

企业决策要充分考虑均衡，博弈论的精髓在于其中的任何一个理性决策者，必须考虑在其他局中人反应的基础上来选择自己最理想的行动方案。所谓均衡，即所有局中参与人的最优策略组合，各方博弈产生的结果是一个均衡结局，它可能不是局中各方及整体的利益最大化，但它是在已给定信息与知识条件下的一种必然结果，因为任何一方改变策略而导致均衡的变化都有可能使自己得到一个更差的结果。近来，人们越来越重视博弈论在市场竞争过程中的作用，人们正在通过调整决策，避免冲突以寻求合作，实现共赢，规避双输。

二、博弈论在构建和谐企业中的应用

博弈论的研究成果，提高了人们对竞争和冲突这一社会现象的认识，对于我们在现实生活中如何运用合作的理念，创建和谐企业具有重要的启示和作用。企业作为社会的组成单元，在构建社会主义和谐社会中承担着义不容辞的责任。对企业来说，“和谐”的基本特征应当表现为依法治企、科学发展、协调有序、安全环保、公平诚信、服务社会，并建立一个长效的协调机制，其核心在于通过促进企业内外环境的“和谐”，达到企业的经济效益与社会效益相统一，最终实现企业健康、协调、可持续发展。

1.处理好个人、集体和国家的利益关系

在市场经济中，个人、企业和政府都会追求自己的利益，在各自的运转环境中，实际上都处于博弈状态，各自都是在现实生活环境中的博弈一方，冲突和矛盾是难免的。随着国有企业改革的不断深化，在股份制改造和现代化企业制度建设过程中，轮岗、下岗、合并、重组等问题所引发的分工、收入、保障的差距越来越成为矛盾的焦点。掩盖这种利益的差别，否认博弈的现实并不能解决问题。所以，需要客观地看待这些差别。

2.处理好博弈与规则透明、诚实守信的关系

规则透明和诚实守信是博弈各方达成协议的基础，规则透明是互信的条件。管理者要想取得人们的信任，政策必须公开、公正。对于企业，企业管理者要取得职工的信任和拥护，企业要在市场上立得住、站得稳，必须讲诚信、讲公平、讲公正。如果所要的结果不是通过透明、可信的规则取得的，必然不会与职工众达成共识，企业氛围也不会是和谐的、稳定的。

3.处理好博弈过程中利益各方的关系

和谐企业建立的基础是企业各方面的共赢，博弈各方达成的协议虽然未必是利益均等，但应该是各方面都能接受的。建立和谐企业，需要从根本上、制度上解决问题，而制度的建立、措施的完善应建立在科学的基础上，建立在各方都能接受的共赢的基础上，而不是企业方想怎样做就怎样做。如果不能保证各方共赢，必然得不到其他方面的支持，那它必然是不稳定的、不和谐的，甚至会导致更多、更严重的问题。

4.处理好经济利益之外的博弈关系

和谐不完全建立在经济利益上，除此之外仍然有很多人文因素影响着社会的和谐。因此，企业管理者的充分沟通、理解职工的非经济期望和需求，给予人文关怀，对于促进和谐社会的形成有着不可忽视的作用。

三、博弈论在企业价格战中的应用

引号有什么作用在现实生活中，我们经常会遇到各种各样的价格大战，如彩电大战、冰箱大战、空调大战等，这些大战的受益者首先是消费者。在这里，厂家价格大战的结局是一个“纳什均衡”，而且价格战的结果是谁都没赚到钱，因为博弈双方的利润正好是零。这个结果可能对消费者是有利的，但对厂商而言是灾难性的。所以，价格战对于厂商而言意味着自杀。从中我们可以引申出两个问题，一是竞争削价的结果或“纳什均衡”可能导致一个零利润结局；二是如果不采取价格战，作为一种敌对博弈论其结果有两种，一种是企业采取正常价格策略，另一种是采取高价格策略形成垄断价格。事实上，完全竞争的均衡就是“纳什均衡”或“非合作博弈均衡”。在这种状态下，没一个厂商或者消费者是按照别人已定的价格来进行决策。在这种均衡中，企业要使利润最大化，消费者要使效用最大化，结果导致了零利润，也就是说价格等于边际成本。

博弈论案例分析

发布评论取消回复

最近发表

热门文章

标签列表