当前位置：文档库 › 纳什均衡与博弈论

纳什均衡与博弈论

这不仅仅是一篇有关《纳什均衡与博弈论》的读书报告，同时也是有关《美丽心灵》的一篇观后感和对约翰纳什的无限礼赞。

在中国经济学界有一句名言：棍棒打不垮经济理论。现代经济学从亚当?斯密（按照今天的翻译应该是亚当?史密斯，但是斯密这个翻译已经深入人心，所以不做修改）奠定基础以来，更多的时候给人的感觉应该是较为抽象的规律，而不是数学知识——虽然当代诺贝尔经济学奖大部分都给数学家得了去，也算是弥补了诺贝尔奖没有数学奖项的空缺吧。但是却又不得不承认经济学似乎和精确不容有误的数学关系依然不大，至少相对于物理这样的学科。在博弈论成熟以前，经济学理论还是普遍规律，但是始终不能像数学那样精确。

《纳什均衡与博弈论》开篇曾提到过，很多人，包括一些学者都认为经济学是一门很愚蠢的学科，因为在它长篇累牍的理论中始终缺乏应有的精确和公理——现在也没人能预测明天哪一支股票会暴涨。

即使如此，它的规律依旧不能有误，也无法违反，这一点明朝和清朝失败的经济政策就足以说明问题，所以说棍棒打不垮经济理论。

根据约翰纳什的个人传记片、2001年奥斯卡最佳电影《美丽心灵》中的叙述，亚当斯密的经济理论足足维持了150年之久，而打破它的正是纳什建立的博弈论模型——纳什均衡。

《纳什均衡与博弈论》中提到，斯密相信政府对商业的干预—

—不管是支持还是限制——都会损害正常的自由企业的利益，通过消除优待和限制，明了简单的天赋自由系统会自主地建立起来。这也正是亚当斯密的“看不见的手”（又称为无形之手）理论。在斯密看来，只要政府不对经济进行干涉，经济社会自然而然会自发地向着一个好的方向发展。我曾经咨询过我的两位高中时读文科的室友，在高中政治对经济学的表述中，始终坚持“经济是政治的基础，政治是经济的集中表现”，这一点和斯密的观点是背道而驰的——事实上，中国一直缺少真正意义上的经济学人才或许也是因此。

亚当斯密在他那本传世巨着《国富论》中表明了他的态度：推崇自由资本主义和强调个人利益。这一点和上百年后安兰德在《阿特拉斯耸耸肩》中的观点一致，但是安兰德对垄断企业似乎并不是特别反感，而斯密则十分反对自由资本主义中的垄断产业。斯密还指出政府应该扮演的三个角色：保卫国家不受入侵、执法保护个人免受不公平之害、提供个人无法从中牟利的公共设施和机构。根据书上所提，当今许多的博弈论实验与亚当斯密的观点并不相悖。

值得注意的是，书中曾强调过斯密的理论对达尔文的影响，应该说“自然选择和适者生存的观点却像是从思想上继承了斯密的经济竞争观点”。

斯密所谓不需要一个有效的经济系统（在这里我觉得可能指的是不需要法律上建立的经济规划模型而非自发形成的，即“找个设计师是个坏主意”），如果不去干预，经济系统会自己建设的很好。书中指出，达尔文在生物学上是这样描绘的：追求自身利益（生存

与繁衍）的生物个体就会逐渐地建立起一套有如经济体系一样复杂的生命体系。达尔文引用了斯密的“劳动力分工”概念。

“我想，我们可以假设一种物种的后代在结构变异上越多样化，它们就越会成功的生存，从而蚕食其他物种的领土，因此在任何一块土地的‘综合经济系统’中，动物和植物的生活习性分化得越完全越广泛，这块土地上就会有越多的个体可以自足。”

书中表示达尔文的生命“综合经济系统”和斯密的“政治经济学”观点相似。

事实上，这篇文章主要讲述的是博弈论而非经济学，但是因为经济学中的部分理论恰恰是博弈论成熟的基础，因而在这里特别提出一下。

当然，这些只是那个时代，我说的是，在约翰纳什提出纳什均衡以前的时代。

看过《美丽心灵》的人对约翰纳什后半生的悲惨人生绝对不会陌生，毕竟，从天才——数学家——精神病人——诺贝尔得主这样巨大的反差实在是少见的——虽然数学家中疯子真的不少。

在约翰纳什以前，最杰出的博弈论大师是冯诺依曼，有着“博弈论之父”美称的他的成就可不仅仅是博弈论而已，如果你对大学计算机基础有了解的话就知道当代的计算机存储器基础就是他建立的。冯诺依曼是上世纪一位非常着名的天才数学家，纳什来到普林斯顿大学时他正在那儿任教，当时除了冯诺依曼外普林斯顿还有无数着名的科学家，这一点在《美丽心灵》中有表现，其中就包括

大名鼎鼎的爱因斯坦，影片中有一段是纳什请求教授能让爱因斯坦看看他的论文，而这篇论文就是我们下文将提到的“讨价还价问题”。并且当时的普林斯顿已经是全球的博弈论研究中心。

冯诺依曼和摩根斯特恩合作的《博弈论与经济行为》标志着博弈论的诞生，这本并不全面的典籍被认为是“博弈论的圣经”。回到文章开头，我们回顾一下经济学的特点，“经济学中，基本思想被描述的很模糊，因而注定了把数学应用到该领域的尝试只能以失败而告终，因此经济学需要一种理论，使得精确且具有实际意义的度量成为可能，博弈论正是为此而生”，《纳什均衡与博弈论》中这样写道。

冯诺依曼虽然成功建立了博弈论，但是他并没有将这栋宏伟的大厦打好地基，他的理论仅仅适用于少部分理想状态。他的理论特点在于主要研究的是二人零和博弈，意即仅有两人参与博弈或者参与博弈的人们自发组成联盟最后变成一对一的局面，一方失去的另一方就会得到，用效用来描述的话，双方的效用增量之和是零。《纳什均衡与博弈论》中称这种问题是“鲁滨逊问题”（鲁滨逊漂流到孤岛上，后来收留星期五，两个人平分财产，他们之间的博弈再也没有第三个人参与）。

二人零和博弈中，一方赢的就是另一方输的，因此如果要保证自己“利益”最大化（博弈论中，对其有一个统一的概念，即“效用”），只要制定一个策略，保证对方输得最多就好。对这种有点二元论味道的模式，冯诺依曼给予了完整的解决方案：最小最大化原

理。

最小最大化原理书中并没有完整的表述，学校图书馆中博弈论方面的书籍大部分都是国内数学家出版的，特点是浅入深出，没有很深的博弈论基础根本看不懂，而且研究的全部都不是二人博弈（国内科学界通病，从来不会研究早期的问题，认为已经过时了），因此根本无法找到最小最大化原理的系统介绍。网上对最小最大化原理似乎有不同的译名，因此仅凭“最小最大化原理”我无法找到更多的有关资料，所以对于这个原理也根本没有更多的了解。据说冯诺依曼对这条原理的证明过程是出了名的复杂，书中并未介绍，不过书中用了几个有趣的例子向我们解释最小最大化原理的基本模式。

书中列举的几个有趣的例子，比如二战时，乔治肯尼将军得知日军将向新几内亚岛派遣一支补给护航舰队，盟军要炸毁这支舰队面临两个选择：日军可能到达新不列颠的北边或南边。

都是三天行程，但是并不是说有三天的袭击时间，因为天气影响，走北边路线会有一天阴雨，所以只有两天进攻；南边则一直晴天，三天进攻。肯尼将军必须选择侦察机是前往南边还是北边，如果前往南边而日军走北边，则会失去一天的进攻时间（在北边原本可行进攻时间原本就只有两天）；若侦察机去北边而日军走南边的话则即使失去一天也还是有两天进攻时间，当然如果侦察机和日军方向一致的话那么就只需要考虑天气的影响了。

这样看来侦察机前往北边似乎更好，因为侦察机走北边则无论

如何可以保证有两天的时间袭击，如果侦察机前往南边判断正确虽然可以保证三天，但是如果判断错误则只有一天时间进行攻击。

即使如此，盟军还是很难准确判断，因为走南边运气好的话可以保证三天袭击时间，但是如果我们从日军的角度来看呢？

假设日军走南边，那么至少是遭受到两天甚至三天的袭击，可是假设走北边，因为有天气的影响，那么可以保证最多只受到两天袭击，运气好的话甚至只有一天，得出结论走北边的结果只会比南边好或者一样但是绝对不会更差了，所以肯尼将军判断日军会走北边路线，选择派遣侦察机前往北边。顺便告知一下结局，日军在盟军的炮轰下损失惨重。

作为博弈论中的经典案例，书中对这次战争还进行了矩阵分析。但是要知道的是这仅仅是一个纯策略问题，而事实上很多博弈中即使是二人零和博弈纯策略也不一定就是最佳策略，最佳策略往往不是那么显而易见，商场如战场，不是那么容易对付的，这个时候又有一个名词横空出世：混合策略。

对于混合策略和纯策略的不同，书中介绍了一个打网球的例子，我的体育很差，因此换一个例子：下象棋时当头炮是名招，经常有人玩这一招，如果是纯策略你就是无论怎样下，反正对方当头炮我就飞马（或者走别的），反正绝对不会改变这条基本策略；而混合策略就是你和对方下很多局，每一局对方都会因为上一局的结果而改变心情，虽然开头仍是当头炮，但你意识到对方的战术会有改变，因此对每一局的当头炮你都有不同的应对，比如飞马，或者你也走

当头炮，这就是混合策略——多个纯策略的混合。

书中对混合策略的解释实在是很让人火大，因为字真的很多而且乏味。鲍勃欠爱丽丝10美元，但是鲍勃不想还，于是提议玩个游戏，他赢了则欠债减免，爱丽丝同意了。

游戏规则如下：他和爱丽丝在图书馆见面，鲍勃先到，给爱丽丝4美元，爱丽丝先到则付6美元，两人同时到，则付5美元。（真不知道爱丽丝怎么愿意答应的）

两人住在一起，至少是邻居，均有两种策略到达图书馆：走路和公汽。我们知道公汽比走路快，假设公汽十分便宜，那么我们会发现二人为了保证利益都会选择坐公汽，因为只有那样才能保证效益最大，当然这只是一个简单的纯策略问题，也根本用不上博弈论，论典型比上面那个肯尼将军的问题差远了。

但是爱丽丝绝对不会轻易答应，她意识到自己绝对拿不回那10美元的外债，于是她针对鲍勃这个游戏进行了修改。

在一个月的每一个工作日里，他们都到图书馆去一次，如果都是乘车去的，鲍勃付3美元；都走路去，鲍勃付4美元，鲍勃乘车爱丽丝走路即鲍勃先到，鲍勃付5美元；爱丽丝先到鲍勃付6美元。

这个游戏无疑会让鲍勃痛苦不堪，因为对他而言最好的策略就是二人都坐车，但是爱丽丝显然也意识到这点，如果这时她选择走路的话鲍勃就要付5美元，显然效益不及二人都走路；但是如果鲍勃走路的话爱丽丝坐车鲍勃则需付6美元，是最大的损失，然后我们就可以发现，在这种策略环境下，似乎并没有“最佳策略”。

但是我们可以发现一件事，这个游戏是重复进行的，一个月中每个工作日是20天，也就是可以进行20次，每次你都可以选择不同的策略，然后这就是我们所要提到的混合策略。

在书中经过一系列缜密的分析最终得出了对于两人而言最好的策略，不过当然，这个问题并没有想象中那么难，如果你能够静下心来进行计算或者矩阵分析的话，都是可以很快得出答案的。

这个事例告诉我们，即使在冯诺依曼看来，在二人零和博弈中，很多甚至绝大多数情况下，最佳策略都是混合策略而非纯策略。而刚看这本书的我也十分相信，在你和别人进行这种博弈时，对方也是不会傻到让你一眼就能看出真正的最佳策略的。

效用一词，最早是由丹尼尔伯努利提出的，根据书中的内容，其主要是“对价值或者选择的一种度量”。现在已经成为博弈论甚至经济学中衡量收益的最重要标准。有趣的是，因为博弈论最早是用于解决经济学问题的，所以效用完全可以说等同于货币，但是当博弈论渗透到社会科学等不同学科时，这个概念就明显过于狭隘了。当然，如果我们是在打篮球，那么效用指代的完全就是分数，这个比较单一。可是假如是遇到一些较复杂的问题呢？比如后来纳什在“议价问题”中提到的情况，对于热爱锻炼的男孩而言乒乓球拍明显比书本值钱，可是对于文艺青年来说答案就是相反的，那么假设这两个孩子进行博弈书本、乒乓球拍对他们的效用就是不同的。

网上对于效用的定义是这样的：一般认为，效用是指消费者通

过消费或者享受闲暇等使自己的需求、欲望等得到满足的一个度量。

这个定义具有较强的普遍性，也再也没有人愿意去简化、准确地定义效用，因为从博弈论后来的发展来看，效用的定义已经成为一个哲学沼泽，想要再去探索是不太可能的。

可是难于定义不代表不能量化，科学家的智慧在这里得到了印证。对于这一突破，书中并没有特别详细的介绍，但是可以知道的是数学家在这里借鉴了热力学中科学家量化温度、热量的方法。不管怎么说，对效用的量化扫清了博弈论的一大障碍，冯诺依曼为它提供了先声，然后所要的，就是约翰纳什的均衡理论打开大门。

《美丽心灵》是我心中唯一一部足以和《肖申克的救赎》相媲美的励志电影，虽然事实上这部影片并不是以励志为主题，但是这部影片确实在我沉浸于被甩掉的痛苦时大大地帮助了我。电影的原着小说我到现在都没有看，也没有看的打算，我觉得小说和电影（不是电视剧）是截然不同的艺术体系，小说根本没法表现出电影那种陈旧的感觉（小说毕竟不能控制光线而摄像机可以），当然小说也有电影无法企及的优点，比如伟大的《阿特拉斯耸耸肩》的电影就被认为是最烂的电影之一。虽然在我看来《美丽心灵》还算不上完美（相对于《肖申克的救赎》而言），但是已经足够好。至少我每次看的时候都会想人家连几十年的精神病都能战胜，我还有什么不能摆脱呢？每次想到纳什几十年对那些幻觉中的人都视若不见我都不得不佩服他的毅力。

应该说罗素克劳真的是个好演员，从开头的天才学生，到后来的执着少年，再到惠勒实验室的顶级科学家和自大狂，精神病，卑微的数学研究者，最后的受人爱戴的老师和诺贝尔经济学奖得主他都炮制得很好，但是回过神来一看，纳什这样子的一生实在是让人唏嘘不已，这部电影感动了无数人，事实上就我所知如果这部影片不成功的话国内数学界可能到现在也不会重视博弈论——虽然这门学科在国外已经被认为非常重要，甚至根据电影最后的介绍，纳什均衡已经左右了全球贸易谈判、全国劳工关系以及生物进化等领域。

据说当代很多科学家认为纳什对博弈论的贡献几乎可以和牛顿对物理学的贡献媲美，也有很多人说如果不是他的疾病，他的成就早已经超出了纳什均衡的藩篱，这个我倒不清楚，不过作为一名数学家，纳什仅凭均衡理论的确已经可以成为当代最伟大的科学家之一了，就如电影中那位部门主任（他将美国的未来交给那群年轻的数学家，每次看到这里我都会震惊这群不富有的社会精英的力量）看到他的论文时所说：“好吧，纳什先生，凭借如此重大的突破，我确信你可以得到任何你想得到的职位（这里指的是惠勒实验室中的职位）。”事实上在我的《纳什均衡与博弈论》中，作者很乐意将当代博弈论称为纳什博弈论，虽然他是个精神病。就我所知纳什还对偏微分方程有研究，他还有一个符合嵌入理论也是经济学中非常重要的理论，电影中甚至解出了部分情况的黎曼假设，如果我没记错的话这个假设还没人能完整解答。但是他最重要的成果还是为非

合作博弈找到了共赢的模型，也就是纳什均衡。

纳什来到普林斯顿大学时是一个出了名性格糟糕的家伙，自以为是、不成熟、傲慢自大但是聪明过人，不过也不是没有资本，因为当时他已经完成了有关议价问题的论文（那是在卡内基工学院完成的），而且当时他也是其中仅有的两个获得卡内基奖学金的两个人之一，他对上课提不起兴趣，也不喜欢“高雅”的应酬。电影《美丽心灵》中说他长了两个有用的脑袋和半颗有用的心真是一针见血，比如开头时别的普林斯顿新来的年轻数学家（真的不是开玩笑，的确是数学家，那些二十出头的家伙要么完成过战争武器论文，要么曾经破解过纳粹密码，都是不折不扣的精英）都在开怀地喝酒吃食物，他却在拿着玻璃杯玩弄光线效果最后还尝试用这个来解释他的同学的领带有多差！反正就这么说吧，那个时候的纳什是个标准的数学疯子，同时也是那群精英中的精英。

出于尊敬和景仰，我上网查过纳什的背景，他最早学习的是化学工程，似乎也曾学习过物理，可是他发现整天拨弄烧瓶并不能满足他（我也觉得很无聊），所以最后他将兴趣转向了他所擅长的数学理论（真应该庆幸他做出了改变）。根据书中记载，据说最早在卡内基工学院时他曾经完成过一篇论述“议价问题”（讨价还价问题）的论文，有趣的是这篇文章的观点虽然后来被大多数人认同可是人们还是认为它很天真——当中出现的都是类似于袖珍小刀、乒乓球拍之类的东西，很显然，出自一个少年之手。

这篇论文最大的突破在于纳什有意无意地涉足了一个比二人零

和博弈更加复杂的环境：博弈者们有着共同的利害关系——讨价还价博弈提供了一种双赢的可能，前提是双方都是理性的，能准确衡量自己的效用。而这种最理想的状态在二人零和博弈中是不可能出现的。不过电影导演朗霍华德似乎不是对这篇论文特别感冒，这篇博弈论中具有承上启下作用的论文在电影中只出现过一次：当时的纳什正尝试说服上文我们提到过的部门主任能安排他与爱因斯坦见一次面，好让他介绍一下自己有关议价问题的突破，但是被拒绝了。不过据说这个问题被用在了反托拉斯法上。

“在这种‘合作性’博弈理论中，对所有人来说都是自己做的最好，但不必以牺牲他人利益为代价。”书中这样解释道，还举了一个有趣的例子：公司与工会间的谈判就是典型的“讨价还价博弈”。

上文提到过的，博弈双方甚至多方可能会对不同物品有不同的估价（效用不同），“纳什展示了如何评价这些不同的估价，计算每个人在各种交换中的效用，并提供了精确的数学图解，找寻最佳成交点”。

这篇文章是纳什涉足博弈论的初试，而真正让他奠定整个博弈论世界基础的则是他在普林斯顿大学发表的论文——纳什均衡理论。

电影中一开始纳什是个十分特殊的家伙，因为不上课又从不发表论文，同学们甚至戏谑他已经退学了，事实上如他自己所说：他正在寻找一种原创理论，他把同学们的论文都看做毫无创造力的垃

圾。对这一点即使是那一位开明的部门主任也曾经批评过他，并且委婉地表示：对不起，但是根据你现在的记录，还不能保证你能有任何职位。这一句话一度让他迷惘，更在宿舍里用头去撞他写满了题目的窗户，可是后来一次同学们在酒吧的娱乐中，他通过同学对女孩的议论以及亚当斯密有关个人价值对团队利益的话找到了灵感，并且花了一整个冬天的时间完成了他的原创理论论文（事实上这篇论文是有人指导的，电影中没有提到），也就是我们说的纳什均衡。

四个单身汉百无聊赖地坐在酒吧里，这个时候五个单身女郎走进酒吧，其中一位长得特别漂亮，这时四个单身汉都想去和美女搭讪并且得到美女，他们会勾心斗角，可是对于美女而言，四个单身汉同时找上来时最好的应付办法就是一个也不搭理，四个单身汉失败之余又去找另外四个女郎，然而那四个女郎不想成为替代品于是选择了拒绝——所以对于四个单身汉而言，从一开始最好的策略就是都不去追求那个美女，这样每个单身汉都能得到一个女郎。

《美丽心灵》中通过这样一幕讲述了纳什领悟“纳什均衡”的过程，均衡理论相对于冯诺依曼最大的突破在于打破了二人零和博弈的局限性，电影中甚至指出这个模型突破了维持150年之久的经济体制。事实上，相对于单一的二人零和博弈，即使只增加一方变成三方博弈，问题也会变得复杂许多倍，这也正是冯诺依曼始终无法解决的原因，以至于那个证明起来出了名复杂的最小最大化原理也无法解决。（我想我国古代类似于《三国演义》、《隋唐》什么的

故事比《封神榜》引人入胜的原因可能就在这里吧，参与对象多而不仅仅只是阐教和截教的对抗）

可是即使复杂许多倍，也必须解决这个问题，因为生活中不可能永远都只是双方博弈的，排开三国之类小说不算，举一个有趣的例子，北京一块黄金地段的参与竞标开发商相信也是不只一两个的。

纳什证明均衡理论用到了一条很重要的拓扑学定理：不动点定理。网上查到的不动点定理是布劳威尔证明的，书中则指出另外一个日本数学家角谷静夫也曾证明过，二人的证明以及结果似乎是有差别的，但是纳什运用任何一人的理论都能证明出他的均衡理论。

不动点定理很复杂，说明了对于一个拓扑空间中满足一定条件的连续函数f，存在一个点x0，使得f(x0)=x0。对其具体内容，网上是这样说的：如果f 是n+1维实心球Bn+1={x∈R n+1|x|≤1}到自身的连续映射（n=1，2，3…），则f 存在一个不动点x∈Bn+1（即满足f（x0）=x0）。

这个证明于1911年的拓扑学定理曾伤透了我的脑筋，为了具体弄懂它，我专程前往学校图书馆，没想到学校系统讲述拓扑学的书籍仅有一本而且还被人借走了。于是我到目前为止对不动点定理的理解还是处在一个一知半解的状态，不过书中对不动点定理有一个比较通俗的概括十分有趣：取两张一样大小的地图，将一张地图平铺在桌面，而另外一张随意揉成一个形状不要撕裂，放在第一张地图之上，不超出第一张的边界。那么第二张纸上一定有一个地点正

好就在第一张地图的对应点的正上方。

反正无论如何，纳什运用这个定理证明了他的均衡理论，电影里他完成这篇论文足足花了一个冬天的时间，对这一成果，鲍尔斯这样评价：纳什均衡的概念可能是博弈论中唯一最基础的概念，绝对的基础。尽管冯诺依曼对此不以为然。

冯诺依曼的博弈论在于简单的二人对立，若是超出二人则会自发组成联盟，纳什称这是合作博弈，然而纳什却将博弈论深化使之具有了更广泛的适用性，换句话说，纳什将我们带到了博弈论的另外一个更加广阔的领域：非合作博弈。

纳什证明出，当多个独立决策的参与者进行决策时，并且他们之间不进行任何交流，他们有这样的平衡点（也许不止一个），在这个点上，所有人都认为此时的策略最好，书中指出：也许有人不喜欢这个策略，但是如果有人改变了，那么得到的结果即最后的期望，只会更糟。因此每个参与者都乐于将策略设定在这个点上——于是构成了稳态，即均衡。

电影中，纳什针对斯密“在竞争中，个人的雄心是为了公共的利益”以及“最好的结果来自于组里的每个人都只做对自己有利的事情”发表了自己的看法：“没错，但不完整，最好的结果来自于组里的每个人都只做对自己以及对组有利的事情。”

以上描述大致符合均衡论的经济学定义，我还专门找到了书中没有的数学定义：在博弈G=﹛S1,…,Sn：u1,…，un﹜中，如果由各个博弈方的各一个策略组成的某个策论组合（s1*,…，sn*）中，

任一博弈方i的策论si*，都是对其余博弈方策略的组合（s1*,…s*i-1,s*i+1,…，sn*）的最佳对策，也即ui （s1*,…s*i-1,si*,s*i+1,…，sn*）≥ui（s1*,…s*i-1,sij*,s*i+1,…，sn*）对任意sij∈Si都成立，则称（s1*,…，sn*）为G的一个纳什均衡。（我想说的是，我看不懂）

书中将均衡与化学平衡进行类比，化学平衡实际上是一种动态平衡，反应仍在进行，但是逆反应与其速率相等，因此本质上与没有进行一样了。（高中化学，化学平衡仅适用于可逆反应）对于博大精深的纳什均衡，书中并没特别详尽介绍，毕竟只是一本入门书籍，但是书中也举了一些有趣的例子来简单介绍纳什均衡，其中最有名的莫过于我曾多次见过的“囚徒困境”。

两个嫌疑犯作案后被警察抓住，分别关在不同的屋子里接受审讯。警察知道两人有罪，但缺乏足够的证据。警察告诉每个人：如果两人都抵赖，各判刑一年；如果两人都坦白，各判八年；如果两人中一个坦白而另一个抵赖，坦白的放出去，抵赖的判十年。于是，每个囚徒都面临两种选择：坦白或抵赖。然而，不管同伙选择什么，每个囚徒的最优选择是坦白：如果同伙抵赖、自己坦白的话放出去，不坦白的话判一年，坦白比不坦白好；如果同伙坦白、自己坦白的话判八年，不坦白的话判十年，坦白还是比不坦白好。结果，两个嫌疑犯都选择坦白，各判刑八年。

这个例子十分典型，我直接从网上选择了复制粘贴，需要说明的是，这并不是二人零和博弈（请注意“零和”二字）。网上曾表

示二位囚徒的最佳策略应该是都不坦白，但是因为这个策略是“帕累托优化”（就我所知，这是一种在非合作博弈中，在不减少他人效益的前提下增加某些人效益的优化过程）所无法达到的，因而没能选择。而事实上，书中对这个有更简单也更重要的诠释：这个最佳策略并不能满足人类的理性要求，两位囚徒是无法选择相互相信的，在他们看来自己的那个同伙随时都有可能会背叛自己。

这一点来看他们还不是那么天真，因为他们的同伙确实背叛了他们，比起《明朝那些事儿》中那个朱高煦居然相信京城的张辅会帮助自己谋反，结果最后自己的信使直接就被张辅绑了献给朱瞻基，他们还是聪明得多。

需要探索的是“均衡”二字，均衡即稳态，化学平衡中一旦达到平衡如果不能改变外在条件如压强、温度、反应物等外在客观条件的话反应也就等于停止了（动态平衡）。这种时候博弈达到了一种十分平衡的状态，如果不是客观条件的改变，均衡态也就不能改变了，陷入稳定状态。然而我们知道，二位囚徒先生显然没有这种觉悟，他们对自己的同伙原本就不信任，因此虽然二人都不坦白确实是最佳策略，却并不是均衡，也就是说这个并不符合“纳什均衡”的标准。而实际上我整理这篇文章时最后惊喜的发现，真正满足了纳什均衡最佳效益和稳态的恰恰是他们选择的策略：坦白。

帮助我们在博弈中找到最佳策略，主宰全球经济体系的确立，做出人类动向的理性解释，甚至在生物进化论中也起到了至关重要的作用，这些都是约翰纳什的不朽功绩。

《美丽心灵》并不是一部讲解数学理论的电影（否则杀了我也不信它有那么高的票房），它的主题是讲述纳什如何从一个高傲自负的精神病患者、偏执狂，在妻子艾丽西亚、友人和医生的帮助下走出阴影，最终战胜幻觉并且在暮年终于登上诺贝尔奖台的故事。

个人传记片中我最喜欢两部，一部是《莫扎特传》，另一部就是《美丽心灵》，“美丽心灵”其实有两重意思，一是纳什的妻子艾丽西亚在纳什确诊为精神病以后依然对其不离不弃帮助他渡过难关；二则是指纳什天生的自大狂在多年以后终于消失而成为一个受人尊敬的、拥有美丽心灵的伟大科学家。

看好电影绝对是一件非常愉快的事，这一点我深信不疑，从不看粗制滥造的电影是我一贯的作风。我还因为不喜欢简单的动作片而被同学们认为是怪人，《美丽心灵》是我最喜欢的电影之一，因为它我才对博弈论产生兴趣，而针对最近被甩掉的事情，这部电影也让我真正有了信心。应该说很少有这样完全讲述高等学府的电影，整部影片将近一半的场景都在普林斯顿大学（虽然事实上电影并不是在普林斯顿拍的），另一半在麻省理工学院和精神疗养院。我想说明的是，这部影片中的大学可不像国内某些垃圾青春电影中的大学那样只有三角恋和高富帅，要知道，纳什最初在普林斯顿活跃时正是二战结束两年，美国战争年代大量投入的年轻或年老科学家在战争后又回到学校，因此美国那些年有许多学校被称为“战争学府”，其中最有名的就是马萨诸塞理工学院，它还有一个更有名的名字，叫做“麻省理工学院”。这批经历过世界大战的科学家无

疑都是精英中的精英，因此大家可以想见当时的普林斯顿大学是多么的群英荟萃，更何况还有爱因斯坦和冯诺依曼这样子的人在普林斯顿大学，而电影中成功表现了当时的普林斯顿大学作为文化中心的杰出，各式各样的求学人，当然也有浪子式的人物。不过值得注意的是纳什后来前往的惠勒实验室就在麻省理工学院。

影片一开始就是那位部门主任给新来普林斯顿大学的数学家们进行简单的演说：是数学家们赢得了二次大战，数学家们破解了日本的密码，制造了原子弹，就是~~~（他指着眼前包括纳什在内的十多个年轻数学家）像你们这样的数学家，苏联所定的目标是让共产党遍布全球，无论在医药还是经济上、在科技或太空技术上，战线已经分明了。想要胜利，我们就需要有成果，可以发表、实用的成果。你们当中谁会成为第二个莫尔斯，第二个爱因斯坦？你们当中谁会成为民主、自由和探索的先锋？今天，我们将美国的未来交于你们的手中，各位，欢迎来到普林斯顿。

很励志也很让人震惊的演说词，至少在这部影片以前我从来不知道有哪所大学被认为寄托了一个国家的未来。我知道数学家甚至拥有改变世界的力量，尽管他们并不富有。然后影片就是大量讲述年轻数学家们在大学里不断求学和发表成果的过程，其中最主要的就是约翰纳什的探索之路。

如果不知道他就是和马丁汉斯共享卡内基奖学金的神秘天才，谁也不会注意到这个不善交际又不上课的学生（按他的话说，不能够把时间浪费在那些无聊的假设上），虽然他相貌英俊（真正的纳

什年轻时比扮演他的罗素克劳还帅），他每天的事情就是忙活他那个连影子都没有的原创理论，为此他在宿舍窗户上写下自己的研究理论，整天在书桌前工作，偶尔离开宿舍就是做别人不能理解的实验或者去图书馆，比如他曾经想通过观察鸽子的行为来完善理论。

对此他的浪子舍友也是他唯一的朋友查尔斯曾经劝过他，最后当他理论无法完成而痛苦万分甚至用头撞窗户时，查尔斯说：“解决问题的方法不是思考，也不是面壁，而是工作！”得到开导的他选择和查尔斯一起将书桌扔下楼，他的痛苦减轻了，不久后，他完成了均衡理论。当然看过电影的人都知道，事实上，查尔斯是他幻觉中的人物，大学时他是一个人住的。

影片主题是中间那一部分，也就是在妻子理解和帮助下战胜精神病的故事，我查过资料，事实上他妻子艾丽西亚在得知他的精神分裂后马上就和他离婚了——因此很多人都表示影片美化了艾丽西亚，然而人们往往忽略了一点：艾丽西亚在离婚后一直没有再婚，而是凭自己的薪水照顾着纳什以及他们的儿子——另一个精神病人，在《美丽心灵》大获成功以后，他们复婚了。

影片中纳什战胜幻觉的办法是再也不和幻觉中的人们说话，这实在是让人难以置信的，在普林斯顿他曾经遭到别人的嘲笑，但是这个时候的他已经变得卑微而谨慎，面对他人的嘲笑他选择的是不作理会和逃离，就这样几十年如一日地每天前往图书馆做着研究，偶尔会去听听课——当年作为学生时他是从不听课的。

1978年一个名叫托比凯利的学生看到他在图书馆玻璃窗上留下

博弈论与纳什均衡

《博弈论与纳什均衡理论》姓名张贺祺学号 2010010404 专业政治经济学指导老师张秉云

摘要博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法，也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。关键字：博弈论；纳什均衡；合作博弈；非合作博弈

目录摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) （一）博弈论的主要思想 (4) （二）博弈论的分类 (5) 三、经典案例 (7) （一）博弈论的经典案例 (7) （二）纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) （一）博弈论的重要影响 (8) （二）纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论一、引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。 1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。博弈论（Game Theory）:亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：（Nash equilibrium）又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。二、博弈论与纳什均衡的主要内容（一）博弈论的主要思想一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P：为局中人，博弈的参与者，也称为博弈方，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。决策人：在博弈中率先做出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者：在博弈二人对局中行动滞后的那个人，与决策人要做出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。他的策略可能依赖于决策人劣势的策略选择，因此对

博弈论和纳什均衡

博弈论和纳什均衡文件管理序列号：[K8UY-K9IO69-O6M243-OL889-F88688]

关于博弈论和纳什均衡你应该知道这些腾讯财经[]2015-05-25 10:05 我要分享 [摘要]纳什在与命运的博弈中找到均衡，纪念大师最好的方式就是尝试了解博弈论。腾讯财经综合报道（风生）奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸，两人均不幸遇难。事发当时，这辆出租车失控撞向栏杆，两人均被抛出车外。约翰-纳什因发表两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即着名的纳什均衡。不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生，曾在麻省理工学院任教，晚年为普林斯顿大学担任数学系教授，死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名，1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。

纳什在数学领域上取得多项突破，但他同时深受精神分裂症困扰，其生平故事在2001年被改编成电影《美丽心灵》，赢得包括最佳电影在内的4项奥斯卡奖项。尽管西维亚-纳萨斯（Sylvia Nasars）广为人知的小说《美丽心灵》（A Beautiful Mind）和改编自该书的、由拉塞尔-克罗（Russell Crowe）主演的同名奥斯卡电影探究了纳什错综复杂的生平，但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界，人们普遍认为，与牛顿和爱因斯坦的数学理论相比，纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题，而纳什的数学却可以应用在生物学和社会学领域。如若不是精神疾病的困扰，纳什今天可能已与那些科学伟人齐名。尽管如此，他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就，他与约翰海萨尼（John Harsanyi）和莱茵哈德-泽尔腾（Reinhard Selten）一起获得了1994年诺贝尔经济学奖。什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争

浅析囚徒困境与纳什均衡

浅析囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子，指反映个人最佳选择并非团体最佳选择。囚徒困境的经典案例这里不再复述，让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境：减轻中小学生过重负担喊了20多年，仅1985年至2000年的15年里，中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效，中小学生课业负担不减反增。又比如近年来炒得火热的楼市——“我没买房，结果房价还是涨了，因为我们无法保证大家都不买房。可是，我错了吗？没有。当初如果我买房了，房价下跌了呢？因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下，房价竟还能且调且涨。可是，我对了吗？没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”：买，难担高房价重负；不买，难受房价节节攀升的煎熬。再看中国的法治之路。虽然法治让所有人都长期受益，甚至执政者自己也不例外，但是一个狭隘理性社会却偏偏无力支撑法治，以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人，不会故意给自己找茬，多数律师也不例外。不过，任何事物都有两面性，“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”：一种行为模式对于个人看起来是很理性的，但是对于个人构成的集体来说却是非理性的，最后对于每个人来说也是非理性的。我们都不敢站出来说话，对每个人来说都是很“理性”的一种行为方式，但最后的结果只能是让整个社会丧失法治。但囚徒困境一定是坏事吗？就以囚徒困境的经典案例来说，作为一个比喻，我们会为囚犯不能合作而遗憾；可是如果它发生在现实中，我们就巴不得他们不能合作。然而如果是多次博弈，人们就有了合作的可能性，囚徒困境就有可能破解，合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解，这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明，要想使合作成为多次博弈的均衡解，博弈的一方（最好是实力更强的一方）必须主动通过可信的承诺，向另一方表示合作的善意，努力把这个善意表达清楚，并传达出去。比如在楼市的囚徒困境中，政府能适当调控房价，给予购房者房价稳定合理的承诺，那么楼市的囚徒困境是有可能破解的。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出

博弈论和纳什均衡

关于博弈论和纳什均衡你应该知道这些美股腾讯财经[微博]2015-05-25 10:05 我要分享 139 [摘要]纳什在与命运的博弈中找到均衡，纪念大师最好的方式就是尝试了解博弈论。腾讯财经综合报道（风生）奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸，两人均不幸遇难。事发当时，这辆出租车失控撞向栏杆，两人均被抛出车外。约翰-纳什因发表两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生，曾在麻省理工学院任教，晚年为普林斯顿大学担任数学系教授，死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名，1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。纳什在数学领域上取得多项突破，但他同时深受精神分裂症困扰，其生平故事在2001年被改编成电影《美丽心灵》，赢得包括最佳电影在内的4项奥斯卡奖项。尽管西维亚-纳萨斯（Sylvia Nasars）广为人知的小说《美丽心灵》（A Beautiful Mind）和改编自该书的、由拉塞尔-克罗（Russell Crowe）主演的

同名奥斯卡电影探究了纳什错综复杂的生平，但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界，人们普遍认为，与牛顿和爱因斯坦的数学理论相比，纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题，而纳什的数学却可以应用在生物学和社会学领域。如若不是精神疾病的困扰，纳什今天可能已与那些科学伟人齐名。尽管如此，他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就，他与约翰海萨尼（John Harsanyi）和莱茵哈德-泽尔腾（Reinhard Selten）一起获得了1994年诺贝尔经济学奖。什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰-纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。近代对于博弈论的研究，开始于策墨咯，波雷尔及冯-诺伊曼。1928年，冯-诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯-诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰-福布斯-纳什利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石，对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。本文首先将博弈划分为不同的类型，并对主要的均衡概念进行了数学描述，最后对不同的均衡概念进行了比较。【关键词】博弈论；纳什均衡；重复博弈博弈论在现代经济学中占据着相当重要的位置，在微观经济学的本科教学环节中，如果将博弈论这一部分排除在外，那么教学内容是不完整的，并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制，对博弈论的内容进行全面深入地讲解难以做到，因此，将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中，最重要的当属博弈均衡的概念，这些概念的掌握有助于学生把握博弈论的整体框架，并对博弈论的后续学习至关重要。因此，本文将主要的博弈均衡概念进行分类和表述，并对不同的博弈概念进行比较，以期对博弈论的教学有所助益。一、博弈的主要类型博弈构成的基本要素包括：1、参与人（1～N）；2、各个参与人各自可选择的行动集合Ai={ai}；3、参与人i的策略Si，给定信息集，该策略决定在博弈的每一阶段他选择的行动；4、参与人的收益Ui （S1，S2…SN）。依据不同的分类标准，博弈可以被划分为不同的类型。 1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈，如猜硬币、投标等，静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择，典型的例子如对弈，动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。重复博弈是指同一个博弈（静态或动态）反复进行所构成的博弈过程，如体育比赛中的多局赛制等。 2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈，不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。 3、完美信息和不完美信息博弈在动态博弈中，一参与人完全了解在自己行为之前的博弈进程，则称此参与人为有完美信息的参与人，如果博弈中所有的参与人都具有完美信息，则称此动态博弈为完美信息的动态博弈。反之，如果在存在具有不完美信息的参与人（参

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中，你不一定满意其他的策略，但你的策略是回馈对手招数的最佳策略。从囚徒困境中我们会发现，作为博弈各方的行动就是针对对方行动而确定的最佳对策，而一旦知道对方在做什么，就没人愿意改变自己的做法。博弈论学把这么一个结果称为均衡。这个概念是有普林斯顿大学数学家约翰·纳什提出的，因此被称为纳什均衡。诺贝尔经济学奖获得者萨缪尔森有句名言，你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词，供给与需求。博弈论专家坎多瑞引申说：“要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是纳什均衡”。 1950年，还是一名研究生的纳什写了一篇论文，题为《n人博弈的均衡问题》，该文只有短短一页纸，可就这短短一页纸成了博弈论的经典文献。纳什的贡献是，他证明了在这一类的竞争中，在很广泛的条件下是有稳定解存在的，只要是别人的行为确定下来，竞争者就可以有最佳的策略。那么，什么纳什均衡呢？简单说，就是一策略组合中，所有的参与者面临这样的一种情况：给定你的策略，我的策略是我最好的策略。给定我的策略，你的策略也是你最好的策略，即双方在对方给定的策略下不愿意调整自己的策略。纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具，所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展，甚至说是一场革命。纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战，按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果，

从纳什均衡引出一个悖论：从利己的目的触发，结果损人不利己。“囚徒困境”就是如此，从这个意义说，纳什均衡提出的悖论实际上动摇了西方经济学的基石。纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。这个法则如下：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。所谓博弈均衡，它是一稳定的博弈结果。均衡是博弈的一结果，但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的，因而是可以预测的。在囚徒困境中存在唯一的纳什均衡点，即两个囚犯均选择“招认”，这是唯一稳定的结果。有些博弈的纳什均衡点不止一个，如下述夫妻博弈中有两个纳什均衡点。丈夫和妻子商量晚上的活动，丈夫喜欢看拳击，而妻子喜欢欣赏歌剧，但两个人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点：要么一同去看歌剧，要么一同去看拳击。在有两个或两个以上纳什均衡点的博弈中，其最后的结果难以预测。在夫妻博弈中，我们无法知道，最后结果是一同欣赏歌剧还是一同看拳击。是不是所有的博弈均存在纳什均衡点呢？不一定存在纯策略纳什均衡点，但至少存在一个混合策略均衡点。这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略，所谓混合策略是指参与者采取的不是唯一的策略，而是其策略空间上的概率分布。我们下面将在警察与小偷的博弈中给出混合策略的说明。在西部片里，我们常能看到这样的故事：某个小镇上只有一名警察，他要负责整个镇的治安，现在我们假定，小镇的一头有一家酒馆，另一头有一家银行，再假定该地有一个小偷，要实施偷盗。因为分身乏术，警察一次只能在一个地方

博弈论与纳什平衡

博弈论与纳什平衡博弈论（game theory）对人的基本假定是：人是理性的（rational，或者说自私的）,理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。纳什（John Nash）编制的博弈论经典故事"囚徒的困境"，说明了非合作博弈及其均衡解的成立，故称"纳什平衡"。所有的博弈问题都会遇到三个要素。在囚徒的故事中，两个囚徒是当事人(players)又称参与者；当事人所做的选择策略(strategies)是承认了杀人事实，最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人，另外一个抵赖，不承认杀人，那么承认者将会得到减刑处理，而抵赖者将会得到最严厉的死刑判决，在纳什故事中两个人都承认了犯罪事实，所以两个囚徒得到的是中间的结果。类似的：我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。在互联网这个原始丛林中：最优策略是如何产生的呢？一、博弈中最优策略的产生艾克斯罗德（Robert Axelrod）在开始研究合作之前，设定了两个前提：一、每个人都是自私的；二、没有权威干预个人决策。也就是说，个人可以完全按照自己利益最大化的企图进行决策。在此前提下，合作要研究的问题是：第一、人为什么要合作；第二、人什么时候是合作的，什么时候又是不合作的；第三、如何使别人与你合作。社会实践中有很多合作的问题。比如国家之间的关税报复，对他国产品提高关税有利于保护本国的经济，但是国家之间互提关税，产品价格就提高了，丧失了竞争力，损害了国际贸易的互补优势。在对策中，由于双方各自追求自己利益的最大化，导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人，他们的选择是完全无差异的。选择C代表合作，选择D代表不合作。如果AB都选择C合作，则两人各得3分；如果一方选C，一方选D，则选C的得零分，选D的得5分；如果AB都选D，双方各得1分。显然，对群体来说最好的结果是双方都选C，各得3分，共得6分。如果一方选C，一方选D，总体得5分。如果两人都选D，总体得2分。对策学界用这个矩阵来描述个体理性与群体理性的冲突：每个人在追求个体利益最大化时，就使群体利益受损，这就是囚徒困境。在矩阵中，对于A来说，当对方选C，他选D得5

博弈论与纳什均衡

第22卷哈尔滨师范大学自然科学学报 Vol .22,No .42006 第4期 NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY 博弈论与纳什均衡郭　鹏 (中国矿业大学) 杨晓琴 (鸡西大学) 【摘要】　纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础. 关键词:博弈论;纳什均衡;非合作博弈收稿日期:2006-02-15 0　引言博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具. 简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(U tility ),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈. 1　博弈论的主要思想一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失. 博弈论模型可以用五个方面来描述:G ={P,A,S,I,U ) P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标. A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.

智猪博弈论与纳什均衡

智猪博弈理论介绍在博弈论（Game Theory）经济学中，“智猪博弈”是一个著名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是7∶3；小猪先到槽边，收益比是6∶4。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”(或称为搭便车)的原因很简单：在大猪选择行动的前提下，小猪也行动的话，小猪可得到1个单位的纯收益(吃到3个单位食品的同时也耗费2个单位的成本，以下纯收益计算相同)，而小猪等待的话，则可以获得4个单位的纯收益，等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。用博弈论中的报酬矩阵可以更清晰的刻画出小猪的选择：

从矩阵中可以看出，当大猪选择行动的时候，小猪如果行动，其收益是1，而小猪等待的话，收益是4，所以小猪选择等待；当大猪选择等待的时候，小猪如果行动的话，其收益是-1，而小猪等待的话，收益是0,所以小猪也选择等待。综合来看，无论大猪是选择行动还是等待，小猪的选择都将是等待，即等待是小猪的占优策略。在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。这时候有所不为才能有所为！高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。博弈与制度由智猪博弈故事得到的启示在这个例子中，对小猪而言，无论大猪是否踩动踏板，不去踩踏板总比踩踏板好。反观大猪，明知小猪不会去踩踏板，但是去踩踏板总比不踩强，所以只好亲历亲为了。这个案例令我们不得不思考—— 【博弈与制度】 “智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。在博弈中，每一方都要想方设法攻击对方、保护自己，最终取得胜利；但同时，对方也是一个与你一样理性的人，他会这么做吗?这时就需要更高明的智慧。博弈其实是一种斗智的竞争。作为一门科学，博弈论就是研究不同主体之间相互影响行为的一种学问。或者准确地说，博弈论是研究决策主体行为发生直接相互作用时的决策以及这种决策的均衡问题的学问，因此也有人把它称为“对策论”。

论博弈论与纳什均衡的影响及局限

论博弈论与纳什均衡的影响及局限摘要：纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。同时，纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础。关键词：纳什均衡、博弈论、影响、局限引言：Nash平衡是指博弈中这样的局面，对于每个参与者来说，只要其他人不改变策略，他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下，Nash平衡一定存在。以两家公司的价格大战为例，Nash 平衡意味着两败俱伤的可能：在对方不改变价格的条件下，既不能提价，否则会进一步丧失市场；也不能降价，因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局，通过谈判寻求新的利益评估分摊方案，也就是Nash平衡。纳什均衡理论正如克瑞普斯①书中所说，?在过去的一二十年内，经济学在方法论以及语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。? 博弈论是研究决策主体的行为发生直接相互作用时候的决

以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。一．博弈论的影响一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论所研究的是理性的决策者之间冲突及合作的理论，可以为实际决策提供理论基础和方向指导。其最终追求结果是使博弈方达到利益最大化的均衡。博弈论不仅仅存在于数学的运筹学中，也正在经济学中占据越来越重要的地位，但如果你认为博弈论的应用领域仅限于此的话，那你就大错了。实际上，博弈论甚至在我们的工作和生活中无处不在！在工作中，你在和上司博弈，也在和下属博弈，你也同样会跟其他相关部门人员博弈；而要开展业务，你更是在和你的客户以及竞争对手博弈。在生活中，博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。诺贝尔经济学奖获得者包罗·萨缪尔逊如是说：要想在现代社会

博弈论复习题及答案

囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

博弈论复习题与答案

博弈论判断题（每小题1分，共15分）囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

博弈论-纳什均衡(非合作博弈均衡)

完全理性：理性指一种行为方式，它适合实现指定目标，而且在给定条件和约束的限度之内。在不同的学科领域，理性所涵盖的内容存在着差异完全理性的内涵具有完全理性的行为人是个无所不知的超人，他具有纵向和横向方面完备的知识。在纵向方面，他可以预测未来；在横向方面，他通晓资源、交易伙伴和环境等情况。具体而言，行为人的完全理性包括以下隐含内容。 (1)不存在不确定性，即使存在不确定性，也可以预知不确定性的概率分布。也就是说，对于具有完全理性的行为人来说，一切信息都是确定的。 (2)行为人具有可以确定的效用函数(消费者的效用函数和厂商的利润函数可以统称为效用函数)，同时行为人具有同质性以及一致性的偏好体系。 (3)选择结果具有描述不变性、程序不变性和前后关系独立性。描述不变性要求行为人选择的先后顺序不应依赖于所描述或显示的选项，也就是说如果行为人经过再三思考，将两种描述视为同一问题的同义表达，那么它们必定导致相同的选择——即这种思考不存在异处；程序不变性要求不同方式的等价学说揭露相同的偏好次序；前后关系独立性指一项选择与其他替代方案互为独立的原则，它要求在给定Z而不提供有关X或Y 的新的信息的情况下，X 与Y的优先权顺序不应该依赖于Z是否有效。 (4)行为人具备完备的计算和推理能力，可以像计算机一样在数秒内从事无穷尽的计算步骤，同时也不存在感性因素对选择的干扰。 (5)选择意味着在各种方案或选择集中进行比较和挑选，因此完全理性的行为人可以设计出所有的被选方案，以及各项方案所产生的全部后果。 (6)一个确定的报酬函数，即行为人可以确定地赋予每项行动结果一个具体的量化价值或效用。 (7)确定性的结果，也就是行为人町以实现效用最大化或最优目标(消费者效用最大化和企业利润最大化)。在上述条件下，建立在完全理性假设的基础上的主流经济学的方法论，即行为人的选择或决策意味着在资源约束的条件下实现效用最大化或利润最大化。行为人在选择过程中，可以遵循确定性原则、极大极小法则、边际原理以及概率法则(也就是主观期望原则)。主流经济学的选择理论建立得如此简洁和完美，使得诸多该领域的学者为之倾倒。并且，这种理论可以使我们不用站起身来实际观察人类行为，便能坐在椅子里预测它们(正确或错误的预见)。正如主流经济学的典型代表弗里德曼的著名论断所述“彻底的‘现实主义’显然无法实现；看一个理论是否‘足够’现实，只能看它就眼下意图而言，是否能做出充分好的预见，或做出比其他理论更好的预见”。主流经济学的完全理性假设致使其形成令人称赞的完美体系和预测能力，但是这种完美只是抽象上的理想模式和方法，不仅经不起经济学内部的逻辑推敲，也经不起实践和现实的考验。完全信息（Complete Information）完全信息（Complete Information），是指市场参与者拥有的对于某种经济环境状态的全部知识。在现实经济中，没有人能够拥有各个方面经济环境状态的全部知识，完全信息博弈完全信息博弈是指每一参与者都拥有所有其他参与者的特征、策略集及得益函数等方面的准确信息的博弈。

博弈论(整理过名词解释和简答)

一、名词解释： 1、博弈：一些个人、团体或其他组织，在一定的规则约束下，依据所掌握的信息，同时或者先后，一次或者多次从允许选择的行为或战略进行选择并加以实施，并从中各自取得相应结果或收益的过程。 2、囚徒困境：从博弈中的两个利益主体出发选择行为，结果是既没有实现两人总体的最大利益，也没有真正实现自身的个体最大利益，比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈：人们行为相互作用时，当事人能达成一个具有约束力的协议，也就是合作博弈，反之，就是非合作博弈。 4、常和博弈：是指博弈双方的得益总和为非零的常数变和博弈：是指在不同的策略组合或者结果下，所有博弈方的得益总和一般是不相同的零和博弈：是指在博弈中，一方的得益就是另一方的损失，所有博弈方的得益总和为零5、博弈论：研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中，博弈论是研究经济主体的决策相互影响

6、战略：参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡：所有参与人的最优战略组合。 8、均衡路径：如果一个博弈有几个子博弈，一个特定的纳什均衡决定了原博弈树上唯一的一条路径，或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡：无论其他参与人选择什么战略，参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡：首先找到某个参与人的劣战略（假定存在），把这个劣战略删除掉，重新构造一个不包含已删除的劣战略的新的博弈，然后再删除这个新的博弈中的某个参与人的劣战略，一直重复这个过程，直到只剩下唯一的战略组合为止。 11、纳什均衡：给定你的策略，我的策略是最好的策略；给定我的策略，你的策略也是最好的策略，即双方在给定的战略上不愿意改变自己的策略。 12、混合战略：如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为，我们称该战略为混合战略。

浅析囚徒困境与纳什均衡

浅析囚徒困境欧阳学文囚徒困境是博弈论的非零和博弈中具代表性的例子，指反映个人最佳选择并非团体最佳选择。囚徒困境的经典案例这里不再复述，让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境：减轻中小学生过重负担喊了20多年，仅1985年至2000年的15年里，中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效，中小学生课业负担不减反增。又比如近年来炒得火热的楼市——“我没买房，结果房价还是涨了，因为我们无法保证大家都不买房。可是，

我错了吗？没有。当初如果我买房了，房价下跌了呢？因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下，房价竟还能且调且涨。可是，我对了吗？没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”：买，难担高房价重负；不买，难受房价节节攀升的煎熬。再看中国的法治之路。虽然法治让所有人都长期受益，甚至执政者自己也不例外，但是一个狭隘理性社会却偏偏无力支撑法治，以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人，不会故意给自己找茬，多数律师也不例外。不过，任何事物都有两面性，“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”：一种行为模式对于个人看起来是很理性的，但是对于个人构成的集体来说却是非理性的，最后对于每个人来说也是非理性的。我们都不敢站出来说话，对每个人来说都是很“理性”的一种行为方式，但最后的结果只能是让整个社会丧失法

《博弈论与纳什均衡读书笔记》

《博弈论与纳什均衡》纳什确立的非合作博弈理论已发展成为了一种有效衡量动机的算法，能够帮我们更好的了解无论在任何社会政治或是经济背景下的冲突和合作的背景。了解稳态是一种掌握事物发展方向的途径。在社会化的环境中，稳态指每个人都满足于现状，你不一定喜欢当前的状态，但是改变现状只会让事情变得更糟，因此没有改变的动力，就像山里的石头，达到了一个平衡点。个人利益驱动下的稳定的策略组合产生了一个更差的总体收益组合。囚徒困境情况下合作时，纳什的数学方法告诉我们这种合作因为不是一种均衡，所以不稳定，以致很难维持下去。虽是现实生活的简化，但是也确实体现了诸多社会交互的本质。流言是博弈论行为研究的一个重要结果，因为他是了解人类社会行为的核心，使得通过利己的斗争在丛林中生存下来，从而建立起人类文明成为可能得自然法则。最优策略的选择不是立即知晓的。旁观者的出席激励暴力的现象，今天观察暴力旁观者有极大的优势成为明天的战斗者，即一个偷听者的好处就是帮助他避免高风险的战斗，同时也会促使在社会整体中出现高水平高风险的斗争趋势。博弈论描述的是使合作和交流成为种族成员之间相处的稳定策略的环境是如何产生的，在没有博弈论时，合作性的人类社交行为很难被理解。意识到不断变化的进化地景是解释合作性行为产生的关键，名誉的重要性解释了为什么人类的语言变得很重要，所以喜欢谈论闲话，闲话传播人的名誉使得利他主义的行为更可能根据名誉来实现。在不同的文化背景下，生活形态是各异的并且经济行为恰恰反映了文化生活中的这种差异。博弈论阐述了文化与经济行为的相互影响，说明人类的思维方式不是放之四海而皆准的，人

类文化不是单一的，而更像博弈论中的综合策略。关于思想的适应性建筑是大量模块化的假设。个体基因的组成的多样性是导致人和文化中所显现的行为趋势的多样。你在这个世界上的经验，常常深刻的改变着你大脑的构造，化学反应和基因表达贯穿着你的一生。——《说谎者恋人英雄》博弈论的规则是利用策略的多样性，促使不同物种的生物尝试了各种不同的行为。博弈论可以看成是对“正在世界上发生的事情进行X光的拍摄，”即一个用来诠释人类行为复杂性以及理解无数推进人类历史前进的交互作用的工具，不管现实中的人多么的变幻莫测，他的行为总是造就了某有序体系的一部分，“平均人”的概念来分析社会问题，“平均人”并不存在。但通过对众人各方面的平均却能更深入的认识社会。人类无常的行为看起来复杂的不可琢磨，但当考察大量的行为时，却呈现出规律性，在特定的社会状态下，特定的影响因素产生特定的效果，这些效果围绕固定的均值波动，不会大起大落。虽然历史趋势和历史事件显得混乱，但有关测量误差的统计规律却将从中找出可预测的范式。对于一模一样的博弈，作为一个局外人，你的决策如何去预测将取决于你的损失函数。加入有关真实人的知识到公式中后，就降低了无知度，而正是依靠无知度，我们才能得到原始概率分布，即将博弈论与心理学结合起来，用来处理激励和效用函数及回报的模型，来定量单个个人的行为。现代博弈论：明白他人所想，然后推断他们会怎样做。信息是连接外部世界和他的科学描述的纽带。博弈论提供一个框架来解释世界上的多样性，个体行为和个性的混合和合作，战争和和平的共存，解释了基因和环境遗传和文化之间的相互影响，通过调解进化改变和稳态之间的紧张