当前位置：文档库 › 博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较

【摘要】均衡概念是构成整个博弈论的基石，对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。本文首先将博弈划分为不同的类型，并对主要的均衡概念进行了数学描述，最后对不同的均衡概念进行了比较。

【关键词】博弈论；纳什均衡；重复博弈

博弈论在现代经济学中占据着相当重要的位置，在微观经济学的本科教学环节中，如果将博弈论这一部分排除在外，那么教学内容是不完整的，并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制，对博弈论的内容进行全面深入地讲解难以做到，因此，将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中，最重要的当属博弈均衡的概念，这些概念的掌握有助于学生把握博弈论的整体框架，并对博弈论的后续学习至关重要。因此，本文将主要的博弈均衡概念进行分类和表述，并对不同的博弈概念进行比较，以期对博弈论的教学有所助益。

一、博弈的主要类型

博弈构成的基本要素包括：1、参与人（1～N）；2、各个参与人各自可选择的行动集合Ai={ai}；3、参与人i的策略Si，给定信息集，该策略决定在博弈的每一阶段他选择的行动；4、参与人的收益Ui （S1，S2…SN）。依据不同的分类标准，博弈可以被划分为不同的类型。

1、静态博弈、动态博弈和重复博弈

博弈各方同时选择策略的博弈称为静态博弈，如猜硬币、投标等，静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择，典型的例子如对弈，动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。重复博弈是指同一个博弈（静态或动态）反复进行所构成的博弈过程，如体育比赛中的多局赛制等。

2、完全信息和不完全信息博弈

完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈，不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。

3、完美信息和不完美信息博弈

在动态博弈中，一参与人完全了解在自己行为之前的博弈进程，则称此参与人为有完美信息的参与人，如果博弈中所有的参与人都具有完美信息，则称此动态博弈为完美信息的动态博弈。反之，如果在存在具有不完美信息的参与人（参

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P ,I)，其中P 为市场价格，I 为消费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论的基概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之，我国古代的《孙子兵法》就不仅是一部军事著作，而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题，人们对博弈局势的把握只停留在经验上,没有向理论化发展，正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者：参与者是指一个博弈中的决策主体，通常又称为参与人或局中人。参与人的目的是通过合理悬着自己的行动，以便取得最大化的收益。参与者可以是自然人，也可以是团体。 ?信息：信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要，每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略：策略是参与者如何对其他参与者的行动作出反应的行动规则，它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略，用S i表示参与者i的所有可选择的策略的集合（又成为而i的策略空间）。如果n个参与者没人选择一个策略，那么s=（s1，s2，…，s n）称为一个策略组合。 ?收益：收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益，它是策略组合的函数。 ?均衡：均衡是所有参与者的最优策略组合，记为s*。几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕，并受到指控。除非至少一人认罪，否则警方无充分证据将他们按最论刑。警方把他们隔离审讯，并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度，因警方证据不足，两人将均被判为轻度犯罪入狱一个月；如果双方都坦白，根据案情两人将被判入狱六个月；如果一个招认而另一个拒不坦白，招认者因由主动认罪立功的表现将立即释放，而另一人将被判入狱九个月。

博弈论和纳什均衡

博弈论和纳什均衡文件管理序列号：[K8UY-K9IO69-O6M243-OL889-F88688]

关于博弈论和纳什均衡你应该知道这些腾讯财经[]2015-05-25 10:05 我要分享 [摘要]纳什在与命运的博弈中找到均衡，纪念大师最好的方式就是尝试了解博弈论。腾讯财经综合报道（风生）奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸，两人均不幸遇难。事发当时，这辆出租车失控撞向栏杆，两人均被抛出车外。约翰-纳什因发表两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即着名的纳什均衡。不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生，曾在麻省理工学院任教，晚年为普林斯顿大学担任数学系教授，死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名，1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。

纳什在数学领域上取得多项突破，但他同时深受精神分裂症困扰，其生平故事在2001年被改编成电影《美丽心灵》，赢得包括最佳电影在内的4项奥斯卡奖项。尽管西维亚-纳萨斯（Sylvia Nasars）广为人知的小说《美丽心灵》（A Beautiful Mind）和改编自该书的、由拉塞尔-克罗（Russell Crowe）主演的同名奥斯卡电影探究了纳什错综复杂的生平，但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界，人们普遍认为，与牛顿和爱因斯坦的数学理论相比，纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题，而纳什的数学却可以应用在生物学和社会学领域。如若不是精神疾病的困扰，纳什今天可能已与那些科学伟人齐名。尽管如此，他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就，他与约翰海萨尼（John Harsanyi）和莱茵哈德-泽尔腾（Reinhard Selten）一起获得了1994年诺贝尔经济学奖。什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争

浅析囚徒困境与纳什均衡

浅析囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子，指反映个人最佳选择并非团体最佳选择。囚徒困境的经典案例这里不再复述，让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境：减轻中小学生过重负担喊了20多年，仅1985年至2000年的15年里，中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效，中小学生课业负担不减反增。又比如近年来炒得火热的楼市——“我没买房，结果房价还是涨了，因为我们无法保证大家都不买房。可是，我错了吗？没有。当初如果我买房了，房价下跌了呢？因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下，房价竟还能且调且涨。可是，我对了吗？没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”：买，难担高房价重负；不买，难受房价节节攀升的煎熬。再看中国的法治之路。虽然法治让所有人都长期受益，甚至执政者自己也不例外，但是一个狭隘理性社会却偏偏无力支撑法治，以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人，不会故意给自己找茬，多数律师也不例外。不过，任何事物都有两面性，“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”：一种行为模式对于个人看起来是很理性的，但是对于个人构成的集体来说却是非理性的，最后对于每个人来说也是非理性的。我们都不敢站出来说话，对每个人来说都是很“理性”的一种行为方式，但最后的结果只能是让整个社会丧失法治。但囚徒困境一定是坏事吗？就以囚徒困境的经典案例来说，作为一个比喻，我们会为囚犯不能合作而遗憾；可是如果它发生在现实中，我们就巴不得他们不能合作。然而如果是多次博弈，人们就有了合作的可能性，囚徒困境就有可能破解，合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解，这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明，要想使合作成为多次博弈的均衡解，博弈的一方（最好是实力更强的一方）必须主动通过可信的承诺，向另一方表示合作的善意，努力把这个善意表达清楚，并传达出去。比如在楼市的囚徒困境中，政府能适当调控房价，给予购房者房价稳定合理的承诺，那么楼市的囚徒困境是有可能破解的。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出

博弈论与纳什均衡

《博弈论与纳什均衡理论》姓名张贺祺学号 2010010404 专业政治经济学指导老师张秉云

摘要博弈论是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法，也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。关键字：博弈论；纳什均衡；合作博弈；非合作博弈

目录摘要 (2) 关键字 (2) 一、引言 (4) 二、博弈论与纳什均衡的主要内容 (4) （一）博弈论的主要思想 (4) （二）博弈论的分类 (5) 三、经典案例 (7) （一）博弈论的经典案例 (7) （二）纳什均衡经典案例 (7) 四、博弈论和纳什均衡的重要影响 (8) （一）博弈论的重要影响 (8) （二）纳什均衡的重要影响 (8) 参考文献 (9)

博弈论与纳什均衡理论一、引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）及冯·诺伊曼（von Neumann）。 1928年，冯·诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。博弈论（Game Theory）:亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：（Nash equilibrium）又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰·纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合（Strategy Profile）。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。二、博弈论与纳什均衡的主要内容（一）博弈论的主要思想一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论模型可以用五个方面来描述:G = {P, A S, I, U) P：为局中人，博弈的参与者，也称为博弈方，局中人是能够独立决策，独立承担责任的个人或组织，局中人以最终实现自身利益最大化为目标。决策人：在博弈中率先做出决策的一方，这一方往往依据自身的感受、经验和表面状态优先采取一种有方向性的行动。对抗者：在博弈二人对局中行动滞后的那个人，与决策人要做出基本反面的决定，并且他的动作是滞后的、默认的、被动的，但最终占优。他的策略可能依赖于决策人劣势的策略选择，因此对

博弈论知识点总结

1、

2、既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论66个经典例子(9)不会令人后悔的纳什均衡

不会令人后悔的均衡在纳什均衡中，你不一定满意其他的策略，但你的策略是回馈对手招数的最佳策略。从囚徒困境中我们会发现，作为博弈各方的行动就是针对对方行动而确定的最佳对策，而一旦知道对方在做什么，就没人愿意改变自己的做法。博弈论学把这么一个结果称为均衡。这个概念是有普林斯顿大学数学家约翰·纳什提出的，因此被称为纳什均衡。诺贝尔经济学奖获得者萨缪尔森有句名言，你可以将一只鹦鹉训练成经济学家，因为它所需要学习的只有两个词，供给与需求。博弈论专家坎多瑞引申说：“要成为现代经济学家，这只鹦鹉必须再多学一个词，这个词就是纳什均衡”。 1950年，还是一名研究生的纳什写了一篇论文，题为《n人博弈的均衡问题》，该文只有短短一页纸，可就这短短一页纸成了博弈论的经典文献。纳什的贡献是，他证明了在这一类的竞争中，在很广泛的条件下是有稳定解存在的，只要是别人的行为确定下来，竞争者就可以有最佳的策略。那么，什么纳什均衡呢？简单说，就是一策略组合中，所有的参与者面临这样的一种情况：给定你的策略，我的策略是我最好的策略。给定我的策略，你的策略也是你最好的策略，即双方在对方给定的策略下不愿意调整自己的策略。纳什均衡从此成为经济学家用来分析商业竞争到贸易谈判现象的有力工具，所以纳什均衡是对冯诺依曼和摩根斯坦的合作博弈论的重大发展，甚至说是一场革命。纳什均衡首先对亚当斯密“看不见的手”的原理提出挑战，按照斯密的理论，在市场经济中，每一个人都从利己的目的出发，而最终全社会达到利他的效果，

从纳什均衡引出一个悖论：从利己的目的触发，结果损人不利己。“囚徒困境”就是如此，从这个意义说，纳什均衡提出的悖论实际上动摇了西方经济学的基石。纳什的想法成为我们指导“同时行动博弈”的最后一个法则的基础。这个法则如下：走完寻找优势策略和剔除劣势策略的捷径之后，下一步就是寻找这个博弈的均衡。所谓博弈均衡，它是一稳定的博弈结果。均衡是博弈的一结果，但不是说博弈的结果都能成为均衡。博弈的均衡是稳定的，因而是可以预测的。在囚徒困境中存在唯一的纳什均衡点，即两个囚犯均选择“招认”，这是唯一稳定的结果。有些博弈的纳什均衡点不止一个，如下述夫妻博弈中有两个纳什均衡点。丈夫和妻子商量晚上的活动，丈夫喜欢看拳击，而妻子喜欢欣赏歌剧，但两个人都希望在一起度过夜晚。在这个夫妻博弈中有两个纳什均衡点：要么一同去看歌剧，要么一同去看拳击。在有两个或两个以上纳什均衡点的博弈中，其最后的结果难以预测。在夫妻博弈中，我们无法知道，最后结果是一同欣赏歌剧还是一同看拳击。是不是所有的博弈均存在纳什均衡点呢？不一定存在纯策略纳什均衡点，但至少存在一个混合策略均衡点。这里所谓纯策略是指参与者在他的策略空间中选取唯一确定的策略，所谓混合策略是指参与者采取的不是唯一的策略，而是其策略空间上的概率分布。我们下面将在警察与小偷的博弈中给出混合策略的说明。在西部片里，我们常能看到这样的故事：某个小镇上只有一名警察，他要负责整个镇的治安，现在我们假定，小镇的一头有一家酒馆，另一头有一家银行，再假定该地有一个小偷，要实施偷盗。因为分身乏术，警察一次只能在一个地方

博弈论与纳什平衡

博弈论与纳什平衡博弈论（game theory）对人的基本假定是：人是理性的（rational，或者说自私的）,理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。纳什（John Nash）编制的博弈论经典故事"囚徒的困境"，说明了非合作博弈及其均衡解的成立，故称"纳什平衡"。所有的博弈问题都会遇到三个要素。在囚徒的故事中，两个囚徒是当事人(players)又称参与者；当事人所做的选择策略(strategies)是承认了杀人事实，最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认杀人，另外一个抵赖，不承认杀人，那么承认者将会得到减刑处理，而抵赖者将会得到最严厉的死刑判决，在纳什故事中两个人都承认了犯罪事实，所以两个囚徒得到的是中间的结果。类似的：我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。在互联网这个原始丛林中：最优策略是如何产生的呢？一、博弈中最优策略的产生艾克斯罗德（Robert Axelrod）在开始研究合作之前，设定了两个前提：一、每个人都是自私的；二、没有权威干预个人决策。也就是说，个人可以完全按照自己利益最大化的企图进行决策。在此前提下，合作要研究的问题是：第一、人为什么要合作；第二、人什么时候是合作的，什么时候又是不合作的；第三、如何使别人与你合作。社会实践中有很多合作的问题。比如国家之间的关税报复，对他国产品提高关税有利于保护本国的经济，但是国家之间互提关税，产品价格就提高了，丧失了竞争力，损害了国际贸易的互补优势。在对策中，由于双方各自追求自己利益的最大化，导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。 A和B各表示一个人，他们的选择是完全无差异的。选择C代表合作，选择D代表不合作。如果AB都选择C合作，则两人各得3分；如果一方选C，一方选D，则选C的得零分，选D的得5分；如果AB都选D，双方各得1分。显然，对群体来说最好的结果是双方都选C，各得3分，共得6分。如果一方选C，一方选D，总体得5分。如果两人都选D，总体得2分。对策学界用这个矩阵来描述个体理性与群体理性的冲突：每个人在追求个体利益最大化时，就使群体利益受损，这就是囚徒困境。在矩阵中，对于A来说，当对方选C，他选D得5

博弈论和纳什均衡

关于博弈论和纳什均衡你应该知道这些美股腾讯财经[微博]2015-05-25 10:05 我要分享 139 [摘要]纳什在与命运的博弈中找到均衡，纪念大师最好的方式就是尝试了解博弈论。腾讯财经综合报道（风生）奥斯卡获奖电影《美丽心灵》主角原型、诺贝尔奖得主、美国数学家约翰-纳什日前与妻子在美国新泽西州乘搭的士时遇上车祸，两人均不幸遇难。事发当时，这辆出租车失控撞向栏杆，两人均被抛出车外。约翰-纳什因发表两篇关于非合作博弈论的重要论文，彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解，并证明了均衡解的存在性，即著名的纳什均衡。不均衡人生中孕育出均衡论纳什于1928年在美国西弗吉尼亚州出生，曾在麻省理工学院任教，晚年为普林斯顿大学担任数学系教授，死前与82岁妻子艾丽西亚在普林斯顿居住。纳什以研究博弈论闻名，1994年获颁诺贝尔经济学奖。他的理论被运用在市场经济、计算、演化生物学、人工智能、会计、政策和军事理论等多个领域。纳什在数学领域上取得多项突破，但他同时深受精神分裂症困扰，其生平故事在2001年被改编成电影《美丽心灵》，赢得包括最佳电影在内的4项奥斯卡奖项。尽管西维亚-纳萨斯（Sylvia Nasars）广为人知的小说《美丽心灵》（A Beautiful Mind）和改编自该书的、由拉塞尔-克罗（Russell Crowe）主演的

同名奥斯卡电影探究了纳什错综复杂的生平，但都没有深入挖掘他的数学思想。他的数学成果依然不被大众所熟知。在当今科学界，人们普遍认为，与牛顿和爱因斯坦的数学理论相比，纳什的数学理论触及到的学科更多。牛顿和爱因斯坦的数学旨在处理物理问题，而纳什的数学却可以应用在生物学和社会学领域。如若不是精神疾病的困扰，纳什今天可能已与那些科学伟人齐名。尽管如此，他在几个数学领域的重要贡献大家有目共睹。他最大的成就来自于经济学方面。由于他在博弈论上的开创性成就，他与约翰海萨尼（John Harsanyi）和莱茵哈德-泽尔腾（Reinhard Selten）一起获得了1994年诺贝尔经济学奖。什么是博弈论与纳什均衡博弈论 :亦名“对策论”、“赛局理论”，属应用数学的一个分支，主要研究公式化了的激励结构间的相互作用。是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。纳什均衡：又称为非合作博弈均衡，是博弈论的一个重要术语，以约翰-纳什命名。假设有n人局中人参与博弈，给定其他人策略的条件下，每个局中人选择自己的最优策略（个人最优策略可能依赖于也可能不依赖于他人的战略），从而使自己利益最大化。所有局中人策略构成一个策略组合。纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。近代对于博弈论的研究，开始于策墨咯，波雷尔及冯-诺伊曼。1928年，冯-诺依曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯-诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学科的基础和理论体系。1950～1951年，约翰-福布斯-纳什利用不动点定理证明了均衡点的存在，为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均

博弈论中的几个经典问题

几个博弈论中的经典问题博弈论（Game Theory），亦名“对策论”、“赛局理论”，属应用数学的一个分支，博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。几个重要的概念 1、策略(strategies)：一局博弈中，每个局中人都有选择实际可行的完整的行动方案，即方案不是某阶段的行动方案，而是指导整个行动的一个方案，一个局中人的一个可行的自始至终全局筹划的一个行动方案，称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略，则称为“有限博弈”，否则称为“无限博弈”。 2、得失(payoffs)：一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时的得失，不仅与该局中人自身所选择的策略有关，而且与全局中人所取定的一组策略有关。所以，一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数，通常称为支付（payoff）函数。 3、次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。 4、博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a，那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。

博弈论中的相关概念

新古典经济学前提：理性选择——减少不确定； ——经济系统效用最大化。理性——新古典经济学与博弈论的纽带博弈论决策前提：理性的战略选择。博弈论决策基础：最优反应，即带来最大收益的战略。但是，在博弈论中最优反应不是理性的唯一表现，也不总是假定人是理性的。新古典经济学决策的背景：理性的个体面临特定的制度环境（产权、货币、高度竞争的市场），在此基础上以获取利益最大化为目的。隐含的基础：只需考虑自身情况和市场条件，而不考虑他人行为。弊端： ——限制了理论的使用范围，现实中竞争并不完全； ——无法解决货币经济以外的决策难题。博弈论的优势： ——不仅考虑自身条件和市场环境，最重要的是还需考虑他人的行为。游戏规则：两个选手，轮流取币；每次至少取一枚硬币；只能从一行中取任意数量的硬币，不许从两行中选取；取走最后一枚硬币的为胜者囚徒困境的启示：囚徒困境仅仅是二人博弈，多人博弈在现实中更多；如果囚犯可以交流，结果显著不同；如果多轮博弈，结果也有不同；导致困境结论的分析过程令人注目，但最后结论并非理性。通常假设参与者将采取最优反应战略而理性行事，最大化利润、力争在游戏中获胜、达到主观收益最大化，或者惩罚最小化，皆属于理性行为。最优反应战略是在其他参与者战略已知或可预测条件下，给某参与者带来最大化收益的战略。博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。依据新古典经济学，我们把一个参与者的最优反应（best response）定义为，在其他参与者已经选定战略，或者可以预计到他们将选择何种战略时，能够给该参与者带来的最大收益的战略。标准式——数字矩阵；扩展式——树形图不确定事件（contingency）：相机战略（contingent strategy）：仅在不确定事件发生时才会采取的战略信息集（information set）：节点2包含了决策者掌握的所有信息，因此也称为信息集。扩展式的优势： ——展示了每一阶段掌握的信息； ——展示了参与者掌握信息的不完全所有博弈问题均可用标准式描述，即绘制一个表格，边缘列出参与者的战略，里面列出参与者的收益；

论博弈论与纳什均衡的影响及局限

论博弈论与纳什均衡的影响及局限摘要：纳什均衡指的是这样一种战略组合，这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下，没有人有足够理由打破这种均衡。纳什均衡，从实质上说，是一种非合作博弈状态。同时，纳什均衡理论奠定了现代主流博弈理论和经济理论的根本基础。关键词：纳什均衡、博弈论、影响、局限引言：Nash平衡是指博弈中这样的局面，对于每个参与者来说，只要其他人不改变策略，他就无法改善自己的状况。Nash在证明了在每个参与者都只有有限种策略选择、并允许混合策略的前提下，Nash平衡一定存在。以两家公司的价格大战为例，Nash 平衡意味着两败俱伤的可能：在对方不改变价格的条件下，既不能提价，否则会进一步丧失市场；也不能降价，因为会出现赔本甩卖。于是两家公司可以改变原先的利益格局，通过谈判寻求新的利益评估分摊方案，也就是Nash平衡。纳什均衡理论正如克瑞普斯①书中所说，?在过去的一二十年内，经济学在方法论以及语言、概念等方面，经历了一场温和的革命，非合作博弈理论已经成为范式的中心……在经济学或者与经济学原理相关的金融、会计、营销和政治科学等学科中，现在人们已经很难找到不懂纳什均衡能够‘消费’近期文献的领域。? 博弈论是研究决策主体的行为发生直接相互作用时候的决

以及这种决策的均衡问题，具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为，并研究它们的优化策略。一．博弈论的影响一个完整的博弈应当包括五个方面的内容：第一，博弈的参加者，即博弈过程中独立决策、独立承担后果的个人和组织；第二，博弈信息，即博弈者所掌握的对选择策略有帮助的情报资料；第三，博弈方可选择的全部行为或策略的集合；第四，博弈的次序，即博弈参加者做出策略选择的先后；第五，博弈方的收益，即各博弈方做出决策选择后的所得和所失。博弈论所研究的是理性的决策者之间冲突及合作的理论，可以为实际决策提供理论基础和方向指导。其最终追求结果是使博弈方达到利益最大化的均衡。博弈论不仅仅存在于数学的运筹学中，也正在经济学中占据越来越重要的地位，但如果你认为博弈论的应用领域仅限于此的话，那你就大错了。实际上，博弈论甚至在我们的工作和生活中无处不在！在工作中，你在和上司博弈，也在和下属博弈，你也同样会跟其他相关部门人员博弈；而要开展业务，你更是在和你的客户以及竞争对手博弈。在生活中，博弈仍然无处不在。博弈论代表着一种全新的分析方法和全新的思想。诺贝尔经济学奖获得者包罗·萨缪尔逊如是说：要想在现代社会

博弈论的主要均衡概念及其比较

博弈论的主要均衡概念及其比较【摘要】均衡概念是构成整个博弈论的基石，对博弈论均衡概念的透彻理解将对博弈论的学习打下良好的基础。本文首先将博弈划分为不同的类型，并对主要的均衡概念进行了数学描述，最后对不同的均衡概念进行了比较。【关键词】博弈论；纳什均衡；重复博弈博弈论在现代经济学中占据着相当重要的位置，在微观经济学的本科教学环节中，如果将博弈论这一部分排除在外，那么教学内容是不完整的，并且和现代微观经济学的发展严重脱节。但是由于课时以及学生接受能力的限制，对博弈论的内容进行全面深入地讲解难以做到，因此，将博弈论的基本概念和方法清晰地向本科学生进行展示就显得十分重要了。在博弈论的基本概念当中，最重要的当属博弈均衡的概念，这些概念的掌握有助于学生把握博弈论的整体框架，并对博弈论的后续学习至关重要。因此，本文将主要的博弈均衡概念进行分类和表述，并对不同的博弈概念进行比较，以期对博弈论的教学有所助益。一、博弈的主要类型博弈构成的基本要素包括：1、参与人（1～N）；2、各个参与人各自可选择的行动集合Ai={ai}；3、参与人i的策略Si，给定信息集，该策略决定在博弈的每一阶段他选择的行动；4、参与人的收益Ui （S1，S2…SN）。依据不同的分类标准，博弈可以被划分为不同的类型。 1、静态博弈、动态博弈和重复博弈博弈各方同时选择策略的博弈称为静态博弈，如猜硬币、投标等，静态博弈一般可以用支付矩阵来表达。动态博弈是指博弈各方按照一定的先后次序进行策略的选择，典型的例子如对弈，动态博弈一般可以用“博弈树”来表达。Game Theory 中文翻译为博弈论也是分别用静态和动态博弈的典型代表博彩和对弈的简称而来。重复博弈是指同一个博弈（静态或动态）反复进行所构成的博弈过程，如体育比赛中的多局赛制等。 2、完全信息和不完全信息博弈完全信息博弈是指每个参与人都了解其他参与人的收益函数的博弈，不完全信息博弈是指参与人并不完全了解其他参与人收益函数的博弈。 3、完美信息和不完美信息博弈在动态博弈中，一参与人完全了解在自己行为之前的博弈进程，则称此参与人为有完美信息的参与人，如果博弈中所有的参与人都具有完美信息，则称此动态博弈为完美信息的动态博弈。反之，如果在存在具有不完美信息的参与人（参

博弈论与纳什均衡

第22卷哈尔滨师范大学自然科学学报 Vol .22,No .42006 第4期 NAT URAL SC I E NCES JOURNAL OF HARB I N NOR MAL UN I V ERSI TY 博弈论与纳什均衡郭　鹏 (中国矿业大学) 杨晓琴 (鸡西大学) 【摘要】　纳什均衡的提出和不断完善,为博弈论广泛应用于经济学、管理学、社会学、政治学、军事科学等领域奠定了坚实的理论基础. 关键词:博弈论;纳什均衡;非合作博弈收稿日期:2006-02-15 0　引言博弈论又称对策论,是使用严谨的数学模型研究现实世界中冲突对抗条件下最优决策问题的理论.两千多年前,孙膑利用博弈论原理帮助田忌赛马取胜,就是早期博弈论的萌芽.作为一门正式学科,博弈论是在20世纪40年代形成并发展起来的,合作型博弈在20世纪50年代达到了巅峰期.然而,它过于抽象,实用性不强,其局限性日益暴露出来.50年代以来,纳什(Nash )、泽尔腾(Selten )、海萨尼(Harsanyi )等人使博弈论成熟并最终进入实用.最近三四十年,经济学经历了一场“博弈论革命”,引入博弈论的概念和方法改造经济学的思维,推进经济学的研究.1994年诺贝尔经济学奖授予3位博弈论专家纳什、泽尔腾和海萨尼,可以看作是一个标志,这也激发了人们了解博弈论的热情.博弈论作为现代经济学的前沿领域,已成为占据主流地位的基本分析工具. 简单地说,博弈论研究决策主体在给定信息结构下如何决策以最大化自己的效用,以及不同决策主体之间决策的均衡.博弈论由3个基本要素组成:一是决策主体(Player ),又可以译为参与人或局中人;二是给定的信息结构,可以理解为参与人可选择的策略和行动空间,又叫策略集;三是效用(U tility ),是可以定义或量化的参与人的利益,也是所有参与人真正关心的东西,又称偏好或支付函数.参与人、策略集和效用构成了一个基本的博弈. 1　博弈论的主要思想一个完整的博弈应当包括五个方面的内容:第一,博弈的参加者,即博弈过程中独立决策、独立承担后果的个人和组织:第二,博弈信息,即博弈者所掌握的对选择策略有帮助的情报资料;第三,博弈方可选择的全部行为或策略的集合;第四,博弈的次序,即博弈参加者做出策略选择的先后;第五,博弈方的收益,即各博弈方做出决策选择后的所得和所失. 博弈论模型可以用五个方面来描述:G ={P,A,S,I,U ) P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标. A:为各局中人的所有可能的策略或行动的集合.根据该集合是有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策、重复博弈和微分对策等.

博弈论复习题与答案

博弈论判断题（每小题1分，共15分）囚徒困境说明个人的理性选择不一定是集体的理性选择。（√）子博弈精炼纳什均衡不是一个纳什均衡。（×）若一个博弈出现了皆大欢喜的结局，说明该博弈是一个合作的正和博弈。（）博弈中知道越多的一方越有利。（×）纳什均衡一定是上策均衡。（×）上策均衡一定是纳什均衡。（√）在一个博弈中只可能存在一个纳什均衡。（×）在一个博弈中博弈方可以有很多个。（√）在一个博弈中如果存在多个纳什均衡则不存在上策均衡。（√）在博弈中纳什均衡是博弈双方能获得的最好结果。（×）在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。（×）上策均衡是帕累托最优的均衡。（×）因为零和博弈中博弈方之间关系都是竞争性的、对立的，因此零和博弈就是非合作博弈。（×）在动态博弈中，因为后行动的博弈方可以先观察对方行为后再选择行为，因此总是有利的。（×）在博弈中存在着先动优势和后动优势，所以后行动的人不一定总有利，例如：在斯塔克伯格模型中，企业就可能具有先动优势。囚徒的困境博弈中两个囚徒之所以会处于困境，无法得到较理想的结果，是因为两囚徒都不在乎坐牢时间长短本身，只在乎不能比对方坐牢的时间更长。（×）纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。（√）不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡，作为原博弈构成的有限次重复博弈，共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。（√）多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径：两阶段都采用原博弈同一个纯战略纳什均衡，或者轮流采用不同纯战略纳什均衡，或者两次都采用混合战略纳什均衡，或者混合战略和纯战略轮流采用。（√）如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但不必）存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的t

博弈论中的几个经典问题精编版

博弈论中的几个经典问题集团企业公司编码：（LL3698-KKI1269-TM2483-LUI12689-ITT289-

3、次序（orders）：各博弈方的决策有先后之分，且一个博弈方要作不止一次的决策选择，就出现了次序问题；其他要素相同次序不同，博弈就不同。 4、博弈涉及到均衡：均衡是平衡的意思，在经济学中，均衡意即相关量处于稳定值。在供求关系中，某一商品市场如果在某一价格下，想以此价格买此商品的人均能买到，而想卖的人均能卖出，此时我们就说，该商品的供求达到了均衡。 5、纳什均衡(NashEquilibrium)：在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*,局中人B 也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因