第一篇 CHAPTER 1 博弈的定义：选择决定成败

傲世中文网 www.23zw.so，最快更新哈佛博弈课！

要想在现代社会做一个有文化的人，你必须对博弈论有一个大致的了解。——诺贝尔奖得主保罗·萨缪尔森第一课不一样的博弈哈佛的博弈课程先从与博弈相关的几个话题开始，就如何应对现实中的难题提供一些初步的思路。我们意在指出：类似的情形普遍存在，而且形成了一系列相互关联的问题，系统地思考这些问题能够让大家在处事时取得事半功倍的效果。绑住自己的手在希腊神话中，遥远的海面上有一座岛屿，石崖边居住着吟唱魔歌的海妖塞壬三姐妹。半人半鸟的塞壬姐妹，坐在花丛里唱着蛊惑人心的歌谣，美妙的歌声把过往的船只引向该岛，它们撞上礁石便船毁人亡。过往的海员和船只都受到迷惑走向毁灭，无一幸免。奥德修斯事先得知塞壬那令凡人无法抗拒的致命歌声，于是命令水手用蜡封住耳朵，并将自己用绳索绑在桅杆上。他还告诫手下，在通过死亡岛时不要理会他的任何命令和手势。在船只驶经海岛的时候，迷人的歌声如期传出。那歌声是如此令人神往，奥德修斯完全沉浸其中，他绝望地挣扎着想要解除束缚，并向水手们叫喊着要求他们驶向塞壬姐妹，但没人理他。海员们驾驶船只一直向前，直到最后再也听不到歌声才给奥德修斯松绑，取出他们耳朵中的蜡。这次塞壬三姐妹白费力气，算是开了一场免费的演唱会。而且三姐妹中的老大帕耳塞洛珀深深地爱上了奥德修斯，当他的船只过去之后，她就投海自尽了。奥德修斯的选择是在和未来的自己对抗。奥德修斯知道，如果他允许未来的自己听塞壬唱歌，未来的自己就会把船开向礁石。所以，他绑住了自己的手。但生活中，很多人在面对类似的问题时，通常都任由未来的自己获胜，因为人们总是最后才行动，不懂得预先做出安排。解决这一问题的方法是，改变对未来自己的激励，从而改变自己的行为。蚂蚁和狮子的策略我们可以用博弈论来研究动物的行为，如果持某种基因的狮子或蚂蚁数量壮大了，这并不是说它们选择了这种策略，只是说明带有该基因的狮子或蚂蚁能繁衍出很多的后代而已。我们假设博弈主体是一个巨大的种群，种群中所有个体都采用相同的策略S，这是与生俱来的。假设突然间出现了一种变异，有那么一小部分个体开始采用别的策略，比如是S’。那么这个采用S’的突变小群体会不断繁衍还是灭绝呢？如果对于任何可能出现的突变情况，即任何采用S’的突变小群体最后都灭绝了，那么原始策略S就是进化稳定的，不过前提是它对所有可能的突变都成立。有一点要注意，开始时变异个体很少，因此进行随机配对的时候，大多数情况下它们是和S进行配对的，偶尔才会遇到别的突变个体。因此大多数情况下我们只需要研究突变个体在现有种群中的生存状况即可。假设一群蚂蚁与生俱来地选择策略S，都进行随机配对。两只配对的蚂蚁与生俱来地选择合作，它们各自收益为2（为了便于说明收益情况，我们采用这种用数字代替收益的模式）。从基因的适应性上来说，它们的选择很好。两只蚂蚁生出另一只蚂蚁，整个种群中合作型的蚂蚁互相配对，就会繁殖出更多的合作型蚂蚁。现在再假设突然产生了一个突变个体，这个小小的突变产生了一种不合作的蚂蚁。合作型的蚂蚁是占大多数的，但现在有一小部分的蚂蚁突变后不合作了，采用策略S’。大多数合作型的蚂蚁相互配对，大家互利共生。但如果一个突变个体和一个合作型蚂蚁随机配对，接下来会发生什么呢？对于合作型蚂蚁来说这很不幸，它和一只不太友善的蚂蚁进行了配对。假设这只合作型蚂蚁叫尼克，选策略S，不合作型蚂蚁拉胡尔选择策略S’。尼克的收益为0，也就是说它被淘汰了。而拉胡尔的收益是3，这样就不仅仅只有一个拉胡尔了，突变个体的数量将增多并继续配对。每一次配对时，合作型蚂蚁中的一部分会跟其他合作型蚂蚁配对。但是，有时候合作型蚂蚁会和某一个突变个体配对，而且其概率越来越大，这些突变个体的数量会不断增长。如果合作策略是进化稳定的，那么突变小群体就会慢慢消失而不产生更多的突变个体。但是现在这种突变个体不但没有灭绝反而不断繁衍，在随机配对中，突变个体的收益更大，这也就意味着突变个体不会灭绝，而将不断壮大。由此我们可以得出，合作不是进化稳定策略。在这个例子中，我们把基因当作策略，把遗传适应性当作收益。这里的重点就是，带有适合基因的个体会繁衍，带有不适合基因的个体会灭绝，即好的策略会使种群不断壮大。我们从中得出的结论就是，自然选择的进化结果是糟糕而低效的。整体与联盟的较量一个原始部落共有100个猎人，部落规定：猎人们每天早出晚归地打猎，并把打到的所有猎物带回部落，所有猎物在这100个猎人中平均分配。日复一日，年复一年，一直以来都是如此。设想某个年代，其中一个猎人富有政治头脑，并具有与生俱来的领袖气质与领导才能。他采用各种方法，拉拢了50个人，组成一个利益集团，并和这50个人协商，要求进行投票以确定每个猎人的打猎技术高低，并以此来确定猎物的分配比例。很自然地，这个集体会以51：49的过半数优势获胜。此后，我们不妨假设猎物的95%被51人集团平均分享，那么剩下的49人分到的猎物自然很少。这个猎人当然不会就此满足，他仍然会采用同样的方式来左右投票表决。于是他又组成了26人的小集团，重新分配这90%的猎物。接着不妨假设26人集团分到了85%的猎物。如果那被排挤的25人中胆敢有人表示不满，这个富有谋略的猎人就可以威胁冒犯者：如果不满意就通过投票让他得到的猎物更少（当然也是投票操纵，26人集团当然是支持，而被排挤的剩下的24人被告知说他们可以投票分享这个冒犯者的应得猎物，自然他们也会持支持态度）。在这种情况下，那25个人都将屈服于这种分配方案，结果猎物的绝大部分就被这26人的联盟分享。以此类推，26人转化为14人……最终的结果就变成极少数人甚至是这个领导者占有猎物的绝大部分。此时，这个领导者可以把手中的猎物当成诱饵来招募武士保卫其特权和地位，拥有这样的特权以后，领导者还可以分得更多的猎物，有了更多的猎物就可以招募更多的武士来维护自己的特权。民主中“少数服从多数”的原则最终变成了一个人的大多数，众人追求的民主最终却选出了独裁者。这似乎是天大的讽刺，然而的确是事实。如果投票中的所有人都是理性人，那么私下协商的存在必然会导致这样的结果。困扰NBA的高薪难题高水平的职业联赛都需要用优秀的运动员来吸引观众，所以尽管全球经济低迷，但NBA球员们的平均年薪依旧能够达到惊人的530万美元。而在2010年4月3日与湖人续约三年的科比·布莱恩特，今后三年的薪水总额更是高达令人咋舌的8400万美元。很多人认为，职业联赛的本质就是用高薪吸引最优秀的运动员。需要进一步讨论的问题是，当能够以适当的理由给一位运动员支付10万美元的年薪时，是否意味着没有适当的理由给他一个年薪数百万美元的合同？比如，NBA历史上最伟大的球员迈克尔·乔丹，篮球技术登峰造极，但在1993年第一次退役之后打棒球期间，他并未取得如何令人印象深刻的成就。他的篮球专业技术并不能转换成打棒球的技术，或者其他运动的职业技术。这样看来，虽然球队必须用高薪才能吸引某位特定的球员，但让同一个人成为职业运动员所需的工资并不是太高。如果所有球队提供的薪水都很低，同样也能吸引最优秀的队员，因为这些队员除了打本专业外不会做其他事。每支球队在他们的球员的薪水方面都面临着类似的困境。如果其他球队提供的薪水都非常低，你的球队支付高薪水就能够获得很大的收益，你会得到最优秀的球员，赢得所有联赛冠军，而且总有买票支持你们球队的观众。如果其他球队都提供高薪水，你还是必须提供高薪水，否则，你的队员就可能是最差的，这样你们队的票房收入就会很低。因此，给球员提供高薪水是每个球队的优势策略。对球队来说，不幸的是，它们全部支付高薪水会使它们比只支付低薪水时情况更糟。职业联赛委员会明白自身所面对的困境，并且试图限制运动员的薪水。比如NBA联盟，各俱乐部已经在执行薪水上限，以限制一个球队所支付薪水的总量，但这并未能阻止一些财大气粗的球队一掷千金。比如，2011年6月刚夺得球队历史上首个总冠军的达拉斯小牛队的老板马克·库班，就是一位疯狂的球迷兼老板。为了打造豪华之师，他不惜向联盟缴纳巨额奢侈税。而且对于球员来说，他们会从其球队所处的薪水困境中受益，因此球员工会也反对设定薪水上限。非合作的选择四位男士正坐在吧台前喝酒聊天，这时，走进来四位美女和一位绝色美人。四位男士目不转睛地盯着她们，随后，其中一个叫纳什的男士便跟他另外三个同学解释，他们该怎样去追求这些女生。纳什说，在正常情况下，四位男士会同时对这个绝色美人展开攻势。但纳什认为，采取这种策略并不聪明，因为如果所有的男士都追求那位绝色美人，他们就会互相牵制，到头来没有一个人能如愿以偿。而如果四位男士被这个绝色美女拒绝后再去找那些姿色稍逊的美女，她们就会因为自己成为别人的第二选择而恼羞成怒，于是也会把这些男士一脚踢开。因此，纳什提议说，为了避免两头落空，他们四人应该一起冷落绝色美女，转而去追求那些姿色稍逊一些的美女。这是奥斯卡获奖影片《美丽心灵》中的一个情节，那位叫纳什的男士即是该片的主人公，他的同名原型是普林斯顿大学的约翰·纳什教授——1994年的诺贝尔经济学奖得主。纳什是普林斯顿的数学天才，1950年，他将自己的研究成果写成题为《非合作博弈》的长篇博士论文。该论文在美国全国科学院每月公报上一经刊登，立即引起轰动。在这篇论文中，纳什提出了后来为其带来巨大声誉的“非合作博弈均衡的概念”，即后来众所周知的“纳什均衡”。第二课这，就是博弈我们常常陷入不知该如何选择的两难境地，这也好，那也不错，到底应该如何选择呢？有些事情错了可以重新来过，而有的事情一旦决定就无法更改。如何让自己更有机会远离后悔的痛苦深渊？你我都需要一种可以让我们更好地进行选择的方法——这，就是博弈。策略性的互动决策“所谓博弈，就是策略性的互动决策。”这是2005年因博弈论而获得诺贝尔经济学奖的罗伯特·奥曼教授给博弈所下的定义。互动性是博弈的最大特色。无论是下棋、赌博，还是为谋取利益而进行竞争，实质都是在做策略性的互动决策。参与者都不能单纯地从自己的意愿出发采取行动，还必须充分考虑到其他博弈参与者会采取何种策略，并针对他们可能的策略选择，选择最有利于自己的应对策略。博弈的目的就是为了实现自身利益的最大化。为了帮助大家理解博弈及博弈最优策略的选择，我们用下面这样一个小例子加以说明：在风光旖旎的马尔代夫海滩上，均匀地分布着为数不多的几位游客，每个游客将消费一瓶水。现在假设哈佛大学的两位经济学教授来此做卖饮料的小贩。如果每个游客都只在靠自己最近的那个小贩那里买水，那么两位教授将如何布置他们的摊位呢？两位教授的竞争，就形成了一个简单的博弈。在这样一个博弈中，两位教授其实都明白，自己摆在海滩中点以左或右的任何位置都不是最优选择，因为对方摆在紧邻自己的右（左）边即可获得超过1/2的游客消费者，而自己只能获得少于1/2的游客消费者。那么，只有将自己的摊位安置在沙滩的正中点，这才是最好的，此时，无论对方紧邻自己左边还是右边，自己始终可以得到1/2的游客消费者。基于这种考虑，两位教授无疑都会把摊位紧挨着摆在沙滩的中心点上。在“沙滩卖饮料”的博弈中，两位哈佛教授的最优策略就是将摊位都布置在海滩的中心点上。由此，我们也可以得出，所谓最优策略，就是无论其他博弈参与者如何选择，我们做出的策略选择都是最佳的。通俗来说即是，不管你怎么做，我所做的都是我能做的策略中最好的。我们在第一章提到了“纳什均衡”的概念，其内涵是，给定其他人的选择之后，没有人对自己的策略感到后悔。这就意味着一旦达到纳什均衡，每个博弈参与者都选择了自己的最优策略。纳什均衡就是所有博弈参与者最优策略的组合。既然在纳什均衡状态下，所有参与人都选择了自己的最优策略，那么我们就可以通过判断博弈参与者的策略是否为各自的最优策略，来确认当前局面是否已达成纳什均衡。这个“沙滩卖饮料”的博弈模型，可以解释为什么卖同类物品的商家总是紧挨着布局，还可以用于政治选举中拉票的分析。关于政治选举中拉票这一点，我们会在后面讨论“换位思考”时详细论述。博弈的构成要素2010年公映的英国电影《百夫长》，情节非常简单，主要就是围绕一场令人紧张到几乎忘记呼吸的逃亡与追杀的博弈展开。在这场殊死搏斗中，博弈双方除了向我们展示了粗犷、野蛮以及冷酷的敌对气氛，还为我们异常鲜活地演绎了博弈对局的基本构成要素。一场博弈的基本构成要素主要包括以下三点：1.参与者以昆图斯·迪亚斯为首逃亡的罗马战士，悍女艾泰恩率领的皮克特追杀者。博弈对局存在一个必需的条件，就是要有两个或两个以上的参与者，自己跟自己玩不叫博弈。从经济学的角度来看，如果不存在对手，只是一个人做决策而不需要考虑他人如何行动，这就是一个传统的最优化问题，也就是在一个既定的局面或情况下如何决策的问题。比如气温骤降，出门必须多穿衣服，只要有“气温骤降”这样一种既定情况的存在，你要出门时的最优策略选择就是多穿衣服，而不用考虑其他人是否多穿衣服。这种只有你一个人做出决策的情形不能构成博弈。2.策略昆图斯·迪亚斯通过采取迂回战术和各种迷惑追踪者的策略来躲避追杀，追上罗马军队；艾泰恩则通过其神秘的近似猎犬的追踪本领，总是能够感应到罗马人的逃跑路线。如果没有艾泰恩嗜血般的疯狂追杀，昆图斯·迪亚斯率领的几名罗马士兵就没必要在逃跑的过程中千方百计地隐蔽逃跑路线；同样，如果昆图斯·迪亚斯等人不知道后边有追杀者，艾泰恩就没必要不断地施展其追踪技术。双方如果没有策略选择的交锋，就根本构不成一场博弈。就像四个人坐在牌桌前面对着一堆牌而不打，那自然无法构成牌局一样。因此在博弈中，参与者必须“出招儿”，也就是做出策略选择，直接、实用地针对某一个具体问题采取应对方法。3.收益昆图斯争取率领罗马士兵逃出生天，艾泰恩则要将罗马人留下做异乡亡魂。博弈的结果就是双方的收益。在这场异常血腥的博弈中，艾泰恩率领的追杀者在最后的决战中全军覆没，而罗马人一方只有昆图斯和博特霍什追上了罗马军队。但博特霍什在欣喜若狂之余被罗马守城士兵射死，昆图斯也差点死于意图掩盖真相的罗马高官手中，最后一个人逃了出来。他没有留在罗马领地，而是回到了逃亡途中结识且互生情愫的“女巫”那里。在这场博弈对局中，可以说没有真正的胜者，因为双方都未能实现预期的收益。即使残存的昆图斯算是仅有的胜利者，他也并没有得到真正希望的胜利。在参与者自利动机的驱使下，每个人都希望自己在博弈中实现利益最大化。这就是博弈论的第三个基本要素：参与者要有预期收益。就像赌博，每个参与者都希望自己赚得盆满钵满，而不是输得倾家荡产。在“人都是理性的”这一假定前提下，博弈的参与者都是为了获取利益而参与博弈，预期将来所获得利益的大小直接影响到博弈的吸引力和参与者的关注程度。预期收益越大，博弈对参与者的吸引力就越强。在此处必须说明，博弈虽由参与者、策略和收益三个基本要素构成，但并不是说博弈中只包括这三个要素，可能还会有更多的要素，比如参与者的出招顺序、参与者拥有的信息量等，但文中所论述的三个要素，是任何博弈都必备的，因此我们称这个要素为博弈构成的基本要素。什么叫做理性一个人跟着一位魔法师来到一座二层楼里，在进入一层的时候，他发现里面有一张长长的大桌子，桌子旁围坐着一圈人，桌子上摆满丰盛的佳肴。他们不停地尝试着去吃到食物，但每次都失败了，没有一个人能把美食放进口中，因为大家的手臂受到魔法师诅咒，手肘难以弯曲，只能空对着满桌美食，一筹莫展。这时，他听到楼上传来了欢笑声，便好奇地上楼去看个究竟。楼上的场景让他大吃一惊。二楼同样也有一群人，他们的手肘也不能弯曲，但是，大家都吃得兴高采烈。原来他们每个人都与对面的人彼此协助，互相喂食，所以每个人都吃得十分尽兴。魔法师设定了同样的博弈环境，然而两层楼的人们博弈的结果截然不同。这种差别主要源于博弈论的基本假设，这一点在上节我们已经提到，就是所有博弈参与者都是理性的，只要参与博弈，就是为了实现自己收益的最大化。在博弈中，“所有的人都是理性的”用一个经济学术语表达叫做“理性经济人”。所谓“理性经济人”原本是经济学的一个基本假设，即假定人都是利己的，而且在面临两种以上选择时，总会选择对自己更有利的方案。通俗来说就是大家都是明白人，谁也不比谁更傻，你能想到的别人也想得到，别人能想到的你也能想到。关于经济学中的“理性”，有几点需要说明：第一，理性的人一定是自利的。经济学和博弈论中的自利和社会学中的自私不是一回事。在博弈论中，“自利”是一个中性词。博弈论假设参与者都是纯粹理性的，他们以自身利益最大化为目标。上述故事中的人都有明显的自利性，面对满桌佳肴，他们的共同目标就是尽可能地享用，选择自顾自的人如此，选择互相合作的人亦是如此。第二，理性和道德不是一回事。理性选择的结果是最有可能实现自己的目标，而不一定最合乎道德，理性和道德有时会发生冲突。当然，理性的人也不一定就是不道德的。第三，理性和自由不一定一致。这一点，很多人都深有体会。小孩子对学习感到厌倦，但父母认为只有好好学习将来才能有出息，于是，家长和孩子之间展开博弈：父母会根据孩子的行动采取各种各样的激励方案，孩子也会根据父母的行动寻找对策。文章开始的故事中被下了诅咒的人们，显然是不自由的，但他们心里享用美食的欲望仍然是理性的，这一点毫无疑问，这就是理性与自由的悖论。当然，现实并非完全如此，有些理性的选择和自由的选择也会达成一致，这是最理想的状态了。理性人的主要特征就是“目标明确”四个字，博弈的参与者十分清晰、明确地知道自己的目的，并为此进行各种理性的选择。无处不在的对局博弈论并不仅限于经济或政治领域，人们的工作和生活，甚至生命的演化，都可以看作是永不停息的博弈决策过程。哈佛大学的博弈论教学，就摈弃了传统的枯燥数学模型分析，通过关注我们实际生活中的方方面面，引领大家自然而然地进入无处不在的博弈对局。人们每天从一早醒来就必须不断地做决定，日复一日决定早餐要吃什么；要不要到超市疯狂采购一番；要不要看场电影、散散步，甚至读一本书……这些都是小事情，更重大的则比如：报考哈佛还是耶鲁，选择什么专业，如何选择伴侣，从事什么样的工作，如何开展一项研究，如何打理生意，该与谁合作，做不做兼职，要不要竞争总裁的职位，要不要竞选总统……几乎你能想到的所有人生场景，都会有博弈的参与。在这些决策中，有些是完全由你一人做决定的（比如去不去散步），但决定的空间不可能是完全封闭的。你不可能在一个毫无干扰的真空世界里做决定，相反，你的身边全是和你一样的决策者，他们的选择与你的选择相互作用。这种互动关系自然会对你的思维和行动产生重要的影响，而且别人的选择和决策直接影响着你的决策结果，这种相互影响你有时甚至觉察不到。时至今日，我们已经很难摆脱这种相互影响了，因为我们都生活在一个联系紧密的社会中，是一张大网上的一个个结。为了解释和理解博弈决策的相互影响，我们不妨看看一个石匠的决策和一个拳击手的决策有什么区别。当石匠考虑怎样开凿石头的时候，如果地质情况清楚，他不必担心石头主动跳起来跟他过不去——他的“对象”原则上是被动和中立的，不会对他表现出策略对抗。然而，当一名拳击手打算攻击对手的时候，不仅他的每一招进攻都会招致抵抗，而且他还面临对方的主动出击。在人与人的博弈中，你必须意识到，你的商业对手、未来伴侣乃至你的孩子都是聪明而有主见的人，是关心自己利益的活生生的“明白人”，而不是被动的、中立的角色。一方面，他们的目标常常与你的目标发生冲突；另一方面，他们当中包含潜在的合作因素。在你做决定的时候，必须将这些冲突考虑在内，同时注意充分发挥合作因素的作用。博弈论是一种决策的艺术。因为博弈无处不在，为了自己，也为了与他人更好地合作，掌握博弈的策略思维对你无疑是有很大帮助的。正因为如此，著名经济学家、哈佛大学博士保罗·萨缪尔森说：“要想在现代社会做一个有文化的人，你必须对博弈论有一个大致的了解。”第三课博弈给我们带来什么哈佛博弈课程并非脱离实际的理论讲解，它有很强的实用性。掌握博弈论的一些基本原理，你的思维方式也会随之改变，以前在你看来百思不得其解的问题，或者生活中稀奇古怪的现象，都可以从中找到解答。实现均衡我们在前面说过，博弈是一种策略性的互动决策，在这一过程中，参与者的决策相互依赖，你选择什么样的策略，取决于其他参与者的策略选择。哈佛有很多学生体形比较“丰满”，这大概是他们经常光顾麦当劳或肯德基造成的。这些学生应该都注意到这样一种现象，麦当劳与肯德基通常会在同一条街上选址，或相隔不到100米的对面或同街相邻门面。而大多数超级市场和购物中心的布局也存在类似现象。照常理来说，同类商家聚集在一起意味着更激烈的竞争，那为什么他们偏偏喜欢聚合经营，在一个商圈中争夺市场呢？这样选址会不会造成资源的巨大浪费？会不会造成各超市或商家利润的下降呢？聚合选址不可避免地导致更为激烈的竞争，其结果是企业要生存和发展就必须提升自己的竞争力。企业有个性，才有竞争力。以超市为例，在超市经营上要有特色，就要明确市场定位、深入研究消费者的需求，从产品、服务、促销等多方面进行改善，树立起区别于其他门店的品牌形象。如果每一个连锁超市都能够做到这一点，就可以发挥互补优势，形成“磁铁”效果，这样不仅能够维持现有的消费群，而且能够吸引新的消费者。另外，商业的聚集会产生“规模效应”。一方面，是所谓的“一站式”消费，丰富的商品种类满足了消费者降低购物成本的需求，而且同业大量聚集实现了区域差异最小化，为消费者实现比较购物建立了良好基础；另一方面，经营者为适应激烈的市场竞争环境，谋求相对竞争优势，会不断进行自身调整，在通过竞争提升自己的同时让普通消费者受益。正因为上面的几个原因，像麦当劳、肯德基这种聚合选址能使商家充分发挥自己的优势，从而促成自身利益最大化，选择聚合经营也就是商家的占优策略。在这种博弈中，每一方在选择策略时都没有“共谋”，他们只是选择对自己最有利的策略，而不考虑其他人的利益，然而这种追求自身利益最大化的本能恰好促成了双方最终实现纳什均衡。这就是一种相互依存的博弈，而相互依存的策略就会促成均衡。同一博弈中，所有博弈参与者的策略都有相互依存的关系。每一个博弈参与者从博弈中所得结果不仅取决于自身的策略选择，同时也取决于其他参与者的策略选择。均衡可以说是博弈论中最重要的思想之一，但本质并不复杂。我们在前面章节中已经多次论述了纳什均衡的内涵，此处介绍一下一般均衡的概念：在博弈达到均衡时，博弈中的每一个参与者都不可能因为单方面改变自己的策略而增加收益，于是各方为了自身利益的最大化而选择某种最优策略，并与其他参与者达成某种暂时的平衡。在外界环境没有变化的情况下，倘若有关各方坚持原有的利益最大化原则并理性地面对现实，那么这种平衡状况就能够长期保持稳定。在所有均衡中，纳什均衡是一个基础性的概念。纳什均衡是所有参与者最优策略的组合，不一定所有选择都能实现各人收益的最大化，但能使所有人的收益都达到最大化的均衡状态。在现实生活中，有相当多的博弈我们无法使用严格优势策略均衡（指不论对方采取何种策略，我们采取此策略总比采取其他任何都好的策略）或重复剔除严格劣势策略均衡的方法找出均衡解。比如在房地产开发中，假定市场需求有限，只能满足一定规模的开发量，A、B两个开发商都想开发这一规模的房地产，而且，每个房地产商必须一次性开发这一规模的房地产才能获利。在这种情形下，无论对开发商A还是B来说，都既不存在严格优势策略，也不存在严格劣势策略（严格劣势策略是指在博弈中，不论其他人采取什么策略，某一参与者可能采取策略中对自己严格不利的策略）。如果A选择开发，则B的最优策略是不开发；如果A选择不开发，则B的最优策略是开发。A与B在做出策略选择的时候，显然是相互依存的。研究这类博弈的均衡解，就需要引入纳什均衡。在纳什均衡中，每个参与者都对自己的策略感到满意，构成纳什均衡的策略一定是重复剔除严格劣势策略过程中不能被剔除的策略。与重复剔除的占优策略均衡一样，纳什均衡不仅要求所有博弈参与者都是理性的，而且要求每个参与者了解所有其他参与者也都是理性的。在占优策略均衡中，不论所有其他参与者选择什么策略，一个参与者的占优策略都是他的最优策略。因此，占优策略均衡一定是纳什均衡。而在重复剔除的占优策略均衡中，最后剩下的唯一策略组合，一定是在重复剔除严格劣势策略过程中无法被剔除的策略组合。因此，重复剔除的占优策略均衡也一定是纳什均衡。需要注意的是，博弈的结果并不都能成为均衡。博弈的均衡是稳定的，因此可以预测。零和博弈在哈佛大学经济系，流传着这样一则著名的笑话：麦克和查尔斯是两个经济学家，他们经常在一起交流学术问题。一次，他们边散步边讨论。麦克看到一堆狗屎，就对查尔斯说：“你吃了这堆狗屎，我给你100万美元。”查尔斯犹豫了一会儿，但最终还是经不住诱惑吃了那堆狗屎。麦克果然兑现承诺，给了查尔斯100万美元。走不多远，查尔斯也看见了一堆狗屎，他对麦克说：“吃了这一堆，我也给你100万美元。”麦克也是先犹豫，但最终还是倒在了金钱面前，于是查尔斯又把麦克给他的100万美元还了回去。故事并未到此为止。走着走着，查尔斯忽然缓过神来了，对麦克说：“不对啊，我们俩谁都没赚到钱，却帮环卫工人清理了两堆狗屎。”麦克也感觉很不对劲，但他辩解说：“我们是都没赚到钱，但我们创造了200万美元的GNP！”这则笑话虽是对经济学家的嘲弄，但它反映了零和博弈的基本道理。在零和博弈中，所有参与者的获利与亏损之和正好等于零，赢家的利润来自于输家的亏损。博弈根据是否可以达成具有约束力的协议分为合作博弈和非合作博弈。合作博弈也称为正和博弈，采取的是一种合作的方式，或者说是一种妥协，博弈双方的利益都有所增加，或者至少是一方的利益增加，而另一方的利益不受损害，因而整个社会的利益有所增加。非合作博弈是指参与者不可能达成具有约束力的协议的一种博弈类型，具有一种互不相容的味道，包括负和博弈与零和博弈。零和博弈属于非合作博弈，参与博弈的各方，在严格竞争下，一方的收益必然意味着另一方的损失，博弈各方的收益和损失相加总和永远为“零”，双方不存在合作的可能。零和博弈的结果是一方吃掉另一方，一方的所得正是另一方的所失，整个社会的利益并不会因此而增加一分。也可以说，零和博弈中自己的幸福建立在他人的痛苦之上。零和博弈现在广泛应用于有赢家必有输家的竞争，“零和游戏规则”也越来越受到重视，因为人类社会中有许多与“零和游戏”相似的局面。如果用一种最简单的现象来帮助人们理解零和博弈，那就是赌博：赌桌上赢家赢得的钱就是输家输掉的。法国作家拉封丹有一则寓言讲的就是狐狸和狼之间的零和博弈。一天晚上，狐狸来到水井旁，低头看到井底的月亮圆圆的，它以为这是块大奶酪。井边有两只吊桶，人们用来一上一下交替汲水。这只饿得发昏的狐狸马上跨进一只水桶下到井底，另一只水桶则升到了井面。到了井底，它才明白水中的圆月是吃不到的，自己已铸成大错，处境十分不利，长久下去就只有等死了。如果没有另一个饥饿的替死鬼来打这水中月亮的主意，坐井口的另外一只水桶下来，它就别指望活着回到地面上了。两天两夜过去了，没有谁光顾水井。沮丧的狐狸正无计可施时，刚好一只口渴的狼途经此地。此时月亮高挂，狐狸不禁喜上眉梢，它抬起头跟狼打招呼：“喂，伙计，我免费招待你一顿美餐怎么样？你看到这个了吗？”它指着井底的月亮对狼说：“这可是块非常美味的干酪，就算主神朱庇特病了，只要尝到这美味可口的食物都会胃口大开。我已吃掉了这奶酪的一半，剩下的这半也够你吃一顿的了。就委屈你钻到我特意为你准备好的桶里下到井里来吧。”这只狼果然中了它的奸计。狼下到井里，它的重量使狐狸升到了井口，这只被困了两天的狐狸终于得救了。狐狸上来得救，狼下去受困，得与失相等，这就属于零和博弈。生活中的游戏通常都是一场零和博弈，因为游戏总有输赢，一方赢了，另一方就是输了。为什么在赌场赌博总是输的多呢？这就是因为赌博是一场零和博弈，而开赌场的老板是要赚钱的，他赚的钱从哪里来呢？显然只能靠赌徒输钱了。在属于非合作博弈的零和博弈中，双方是没有合作机会的。各博弈方决策时都以自己的最大利益为目标，结果是既无法实现集体的最大利益，也无法实现个体的最大利益。零和博弈是利益对抗程度最高的博弈，甚至可以说是你死我活的博弈。在社会生活的各个方面都能发现与零和博弈类似的局面，胜利者的光荣后面往往隐藏着失败者的辛酸和苦涩。从个人到国家，从政治到经济，到处都有零和博弈的影子。比如篮球、拳击等体育比赛，美国民主、共和两党的总统竞选等，都属于零和博弈。非零和博弈电影《美丽心灵》中有这样一个情节：一个烈日炎炎的下午，约翰·纳什教授给学生上课。楼下有几个工人正施工，机器的轰鸣声非常刺耳，于是纳什走到窗前狠狠地把窗户关上。马上有同学提出意见：“教授，请别关窗户，实在太热了！”而纳什一脸严肃地回答：“课堂的安静比你舒不舒服重要得多！”然后转过身一边在嘴里叨叨着：“给你们来上课，在我看来不但耽误了你们的时间，也耽误了我的宝贵时间……”一边在黑板上写着数学公式。此时，一位叫阿丽莎的漂亮女同学（她后来成了纳什的妻子）走到窗前打开了窗户，她对窗外的工人说道：“打扰一下，嗨！我们有点小小的问题，关上窗户，这里会很热；开着，却又太吵。我想能不能请你们先修别的地方，大约45分钟就好了。”正在干活的工人愉快地说：“没问题！”又回头对自己的伙伴们说：“伙计们，让我们先休息一下吧！”阿丽莎回过头来快活地看着纳什教授，纳什教授也微笑地看着阿丽莎，既像是讲课，又像是在评论她的做法地对同学们说：“你们会发现在多变性的微积分中，往往一个难题会有多种解答。”阿丽莎对“开窗难题”的解答，使得原本的零和博弈变成了另外一种结果：同学们既不必忍受密闭室内的高温，教授也可以在安静的环境中讲课，结果不再是“0”，而成了“2”。由此我们可以看到，很多看似无法调和的矛盾，其实并不一定是你死我活的僵局，那些看似零和博弈或者是负和博弈的问题，也会因为参与者的巧妙设计而转为正和博弈。这一点无论是在生活中还是工作上都给我们以有益的启示。非零和博弈既可能是正和博弈，也可能是负和博弈。该理论的代表人物，是哈佛大学企业管理学教授亚当·布兰登勃格和耶鲁大学管理学教授巴里·奈尔伯夫。他们在合著的《合作竞争》一书中提出，企业经营活动是一种特殊的博弈，是一种可以实现双赢的非零和博弈。在非零和博弈中，对局各方不再是完全对立的，一个局中人的所得并不一定意味着其他局中人要遭受同样数量的损失。博弈参与者之间不存在“你之得即我之失”这样一种简单的关系，参与者之间可能存在某种共同的利益，能够实现“双赢”或者“多赢”，这是正和博弈；与之相对的则是负和博弈，即博弈参与者最终无人获利，两败俱伤。对于正和博弈与负和博弈，可以举一个简单的例子加以说明，譬如一对情侣，双方可能一起得到精神的满足，这是正和博弈；恋爱中一方受伤的时候，对方并不一定得到满足，双方也许都很受伤，这种情况则是负和博弈。负和博弈博弈的理论承认人人都有利己动机，人的一切行为都是为了实现个人利益最大化，但同时，博弈策略的本质在于参与者的决策相互依存，帮助别人有时就是帮助自己，这样反而更能促成个人收益最大化。市场经济中，崇尚的道德应该是利己又利他，这两点并不矛盾。如果市场上每个人都只为自己，自私自利，甚至损人利己，最终结果还是损害自己，而能够为别人考虑的往往也会为自己带来好处。当你从利己的角度出发去帮助别人的时候，就会起到“利己又利他”的效果。反之，为了利己而做伤害别人的事，自己虽然会得一时之益，但从长远来看，必定得不偿失。2009年12月31日，冰岛总统格里姆松表示，将推迟签署议会批准的偿付协议——偿付在冰岛Icesave银行破产中遭受损失的英国及荷兰储户，该协议遭到冰岛民众的普遍反对。议会30日批准的支出计划遭到普遍的反对，格里姆松称，正如此前预计，他“今天将不对此做出决定”。3天后，他收到32万冰岛居民中接近4万人签署的反对该协议的请愿书。如果总统拒绝支持该议案，该问题将诉诸全民投票表决。冰岛议会29日晚些时间授权向英国和荷兰政府支付38亿欧元，这些资金中部分用来补偿在冰岛Icesave银行倒闭中逾32万个损失储蓄的储户。31日早些时候，评级公司标准普尔曾称赞冰岛议会的决定，并在一份声明中将冰岛的信用等级前景从“负面”上调至“稳定”。冰岛总统格里姆松说，他不会签署赔偿英荷两国存户38亿欧元存款损失的议案。他说，他将改而让全民投票，决定是否作出赔偿。这引起英国和荷兰的不满。荷兰说，冰岛的做法让人“无法接受”；英国财政部则希望冰岛履行其“责任”。英国金融服务部长麦纳斯警告，冰岛倘若这么做，不仅将面临金融孤立的危险，其通往欧盟的道路也可能受阻。在冰岛同英国和荷兰的这场博弈中，如果冰岛真的赖账，那么冰岛和英荷两国将陷入双输的局面：英荷两国储户会遭受巨额损失，而冰岛则会有受到欧洲其他国家金融孤立的危险，这无疑会让本来就已风雨飘摇的冰岛经济雪上加霜。如果冰岛真的采用这一策略，那么这就是一场典型的负和博弈，双方都没有获利。正和博弈小溪边有三处灌木丛，每处灌木丛中都居住着一群蜜蜂。附近的一个农夫总觉得这些灌木丛没有多大用处，便决定铲除它们。当农夫动手清除第一处灌木丛的时候，住在里面的蜜蜂苦苦地哀求：“善良的主人，看在我们每天为您的农田传播花粉的情分上，求您放过我们的家吧！”农夫看看这些无用的灌木丛，摇了摇头说：“没有你们，别的蜜蜂也会传播花粉的。”很快，农夫就毁掉了第一群蜜蜂的家。没过几天，农夫又来砍第二处灌木丛，从中冲出一大群蜜蜂，对农夫嗡嗡大叫：“残暴的地主，你要敢毁坏我们的家园，我们绝不会善罢甘休的！”农夫的脸上被蜜蜂蜇了好几下，他一怒之下，一把火把整个灌木丛烧得干干净净。当农夫把目标锁定在第三处灌木丛的时候，蜂王飞了出来，它对农夫柔声说道：“睿智的投资者啊，请您看看这处灌木丛给您带来的利益吧！您看看我们的蜂窝，每年我们都能生产出很多的蜂蜜，还有最有营养价值的蜂王浆，这可都能给您带来不菲的经济效益啊。如果您把这些灌木丛给除了，您将什么也得不到，您想想吧！”农夫听了蜂王的介绍，觉得有道理，于是放下了斧头，与蜂王合作，做起了经营蜂蜜的生意。在这场人与蜂的博弈中，面对农夫，三群蜜蜂运用了三种策略——恳求、对抗、合作，只有第三群蜜蜂保住了自己的家园，农夫也从中获益匪浅，双方实现了双赢。这则寓言告诉我们，如果博弈的结果是“零和”或“负和”，那么，一方得益就意味着另一方受损或双方都受损，这些显然都不是最优结果。人与人之间如果都能争取合作，把一味利己的竞争博弈变成双赢的正和博弈，就能使人际关系和个人成长向着更健康的方向发展。双赢是最佳的合作效果，合作是利益最大化的有效武器。很多情况下，对手并不仅仅是对手，正如矛盾双方可以转化一样，对手也可以变为助手和盟友，微软公司对苹果公司慷慨解囊就是一个最好的案例。如同国际关系一样，商场中也不存在永远的敌人，利益才是永恒的。皮尔斯和杰夫同时进入美国加利福尼亚州一家电力公司，他们的工作能力不相上下。皮尔斯是电力公司总经理的亲属，而杰夫则毫无后台背景。他们都是部门负责人，但杰夫并没有因为自己没有皮尔斯那样的关系而表现消极。在工作中，杰夫经常与皮尔斯相互协作，完成工作中的难点，互相配合非常默契。皮尔斯也愿意同杰夫编在一组，相互促进。在完成11万伏高压输电线路安装过程中，皮尔斯与杰夫一起晚上看图纸，安排工序，白天干活，比预定工期提前1/3完成任务，因此受到表彰。曾经有朋友劝杰夫，皮尔斯本来就有关系，现在你帮他的忙相当于断了自己的升迁之路。杰夫对朋友说：“第一，我佩服的是皮尔斯的能力和人品，皮尔斯能成功，靠的是自己的实力；第二，如果自己能力不强，即使领导不会看重皮尔斯，自己也不会有什么出息，我现在也是向他学习本事；第三，一旦皮尔斯升迁，自己与他配合默契，工作起来也顺手。”通过相互之间的配合，他们取得了很大的成绩。上级通过皮尔斯也认识了杰夫，认为两个人的能力同样突出。在皮尔斯被提为安装公司经理之后，杰夫理所当然地成了副经理。皮尔斯心里也明白，没有杰夫的帮助，仅靠自己也不会有这样突出的成绩。不久之后，通过关系，皮尔斯将杰夫调到另一部门担任正职。这样，杰夫的路子也宽广起来。同时，两个人在两个部门相互协调，工作就更加好干了。展示自己的才能，配合他人的工作，在工序流程中能够独挑大梁，在团体运作中具有团结精神，都是能够得到别人赏识的。当然，协助别人工作同给别人当下手不一样，协助别人要有自己的思想，有自己独到的见解。没有独到的见解，总是像跟屁虫似的人云亦云，帮助别人做打杂的活儿，是永远成不了气候的。多次博弈与单次博弈休斯敦火车站广场边上的一家小卖店，出售饮料、汉堡包等商品，店门口的一个玻璃柜子中摆着各种香烟。“我马上就要上火车了，你在达拉斯车站接我。老板，来包万宝路。”凯尔打着电话，给店主递过钱去后，买了一包万宝路烟匆匆离开。但凯尔突然又回过身来问：“老板，你的烟不会有假吧？”“怎么可能，这些烟都是从烟草公司进的，正规渠道，怎么会有假。”“真的吗？”“你要不要，不要走开！”看到店主凶巴巴的样子，凯尔苦笑着走向站里。经常出差或旅行的人，在车站或景点等地购物时，会注意到这些人群流动性很大的地方，不但服务质量差，而且假货横行。这是因为在商家和顾客之间存在的是“一次性博弈”。在博弈中，每个参与者在轮到自己决策时，必须思考自己的行动将会给其他博弈参与者以及自己未来的行动造成什么影响。也就是说，相继行动的博弈中，每个参与者必须预计其他参与者接下来会有什么反应，据此盘算自己的最佳策略。但在一次性博弈中，因缺乏强烈的道德与情感因素的约束，参与人仅为自己当前的最大收益而奋斗。他不太关心自己未来的利益，因为他确信今后自己不会再和对方进行博弈，从而会尽可能地施展所有手段争取当前利益的最大化。所以，凯尔遇到的那位老板才如此态度恶劣，他卖的万宝路香烟真假如何，不用猜都知道。假如市场交易都是一次性的，那么市场上肯定假冒伪劣商品泛滥，因为销售者出卖假冒伪劣商品可以获得更多的收益。但生活中更多的是重复性博弈，与一次性博弈完全不同，它遏制了人们的绝对功利性，每一个参与者的行动都必须小心翼翼，因为他们需要为将来考虑。如果有谁在第一次博弈中就耍尽欺诈手段，或者背叛，那么在未来的博弈中，他将付出代价，显然采取这种策略对他来说是不明智的。因此，在重复性博弈中，不诚信的情况比较少。我们也可以借用重复博弈的理论来解释夫妻之间的一些行为。夫妻之间闹别扭，妻子一般不敢闹得太过分，丈夫也不会一直记恨在心，因为他们都明白，仅为一时意气而严重伤害对方，最终对双方都没有好处。对于夫妻而言，博弈的目的不是为了在分手时能得到更多的“好处”，而是希望能更好地“维持合作的稳定性”，白头偕老。通常来说，在经历多次博弈之后，会达到一个纳什均衡。在纳什均衡点上，每个参与者的策略都是最好的，此时如果任何一个参与者改变策略，他的收益都会降低，任何一个理性的参与者都不会有单独改变策略的冲动，没有人愿意先改变或主动改变自己的策略。这种相对稳定的结构会一直持续下去，直到博弈的终点。重复博弈可以有效地防止背叛策略的出现，只要博弈继续下去，博弈的双方就不得不考虑自己背叛后对方会采取什么样的策略来对付自己。此外，重复博弈还有另外一个作用，它可能无限放大一次性博弈的结果。员工和雇用他的公司就处在重复博弈当中。因此，员工往往会为了将来的利益而抑制自己的背叛行为，公司也同样会因为希望提高员工的忠诚度而表现出好的姿态，这是一种合作的博弈。将来的博弈，不仅仅是一种防止背叛的手段，也是一种可以寄予希望的手段。当将来存在时，人们会因为考虑长远而更理性地处理眼前的问题。