当前位置：文档库 › 14 序贯博弈

14 序贯博弈

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期课程名称：博弈论班级：10物流治理（采购与供应链1班）学号：1040407122 姓名：曾维乐

二〇一一年十二月十八日价格战中的博弈论浅析摘要：博弈论研究互动决策行为，大多数时候是研究对抗性行为，但并不是所有的对抗行为。博弈论是运筹学的一个重要分支，类型众多。本文在简要介绍了博弈论相关内容的基础上，重点介绍了纳什均衡。通过案例，充分运用囚徒困境、智猪博弈、反向归纳法等进行分析，从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上，结合博弈论相关知识，分析解决经济生活中的一些实际问题。如：针对商家的价格战问题。

关键词：囚徒困境懦夫博弈安全博弈纳什均衡一、理论介绍 1、博弈论简介博弈论(game theory),也称对策论，它是运筹学的一个重要分支，是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题，简单讲来确实是一些个人或其他组织，面对一定的环境条件，在一定的规则下，同时或先后，一次或多次，从各自同意选择的行为或策略中进行选择并加以实施，各自取得相应结果的过程。从上述定义中能够看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益（得益矩阵）、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人，也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用，一般

七种常见的经济学博弈(game)精编版

冯·诺依曼（von Neumann）和摩根斯坦（Morgenstern）于1944年出版《博弈论与经济行为》一书，标志博弈论诞生。 1、囚徒困境(Prisoner's dilemma) 普林斯顿大学教授塔克（Tucker）于1950年第一次描述了囚徒困境。囚徒困境是最常见也最为公众熟知的经济学博弈。两个罪犯被关入监狱，相互不能沟通。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年。若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱五年。若互相揭发，则因证据确实，二者都判刑两年。其效用矩阵如下：合作揭发合作（-1，-1）（-5，0）揭发（0，-5）（-2，-2）囚徒困境有一个变式叫智猪博弈（boxed pig game），大同小异就不介绍了。 2、最后通牒博弈（ultimatum game）由德国柏林洪堡大学经济学教授古斯（Guth）提出。在这一博弈中，两名参与者按实验要求分配一笔金钱，其中一名作为提议方(proposer)有主动选择提案的权利，也就是分多少钱给对手。另一参与者作为回应方(responder)能决定是接受还是拒绝。如果接受则该笔钱按提议方的建议进行实际分配；如果拒绝那么双方一无所有。举个例子：两个人要求分100元，一个人很贪婪打算分给自己80元，分给对手20元。对手看到如此不公平的分配，十分生气。于是他拒绝了分配，结果竹篮打水一场空，两个人都一分不得。

再来个例子：两个人要求分100元，一个人相当正义，他打算分给自己和对手各50元。对手表示很满意。于是他接受了分配，最后双方各得50元。 3、独裁者博弈（dictator game）不好说谁提出来的，很多研究者不约而同地做了改进。是基于最后通牒博弈的变式，类似最后通牒博弈，但在这一博弈中回应者没有权利拒绝。也就是提议者拥有绝对权力，他提出的任何一个分配方案，回应者都得接受。 4、免惩罚博弈（impunity game）一个日本人在2009年改进的，Yamagishi，还真不知道该怎么翻译。也是最后通牒博弈的变式，在这一博弈中，回应者拒绝只会引起自己的收益为0，而不会对提议者的收益造成任何影响。 5、公共物品博弈（public good game）没有讲明增值条件，经@wanglin406提醒，补上。事实上，不是所有公共物品博弈都需要增值。在公共物品博弈中，多个参与者每人拥有一定数额的初始金钱，他们可以给一个公共的账户进行投资，每个人可以投资任意金额。当公共账户中的金额积累到一定数量后，它会乘上一定系数(可以为1)实现投资增值，然后总收益平均分配给每一名参与投资该账户的人。参与人投资得越多, 公共账户中积累的金额也就越多，个人收益相应越多。若是参与人都不投资，那么公共账户中一分没有，大家也就一无所有。举个例子：有三个参加一个项目，每个人都有初始资金100元。其中A很小气，还想搭个便车于是他投资0元；B有点担心这是个骗局，于是他投资80元；C十分相信这个项目，他投资了全部资金100元。那么公共账户就有180元，接下来180元增值成为360元，再平均分成三份，ABC每人都得120元。最后A有220元，B有140元，C有120元。看来搭便车才是利益最大化的选项。

博弈论在多个领域中应用广泛

博弈论在多个领域中应用广泛，在管理中的以下方面受到了广泛关注。 (1>博弈论在区域创新中的应用研究对象主要包括企业之间的博弈，企业与政府之间的博弈，政府之间的博弈。易余1}L运用演化博弈理论研究企业自主创新行为、模仿创新行为与市场结构的演化，研究表明，在满足一定的条件下，市场中进行自主创新投资的企业的比例以及市场结构将演化稳定。政府的宏观调控对于企业自主创新行为以及市场结构的演化起着至关重要的作用。刘义建立博弈模型，通过研究区域创新系统内各个参与者的博弈，分析参与者共享隐性知识的可能性以及隐性知识应该怎样在这个系统内转移，对怎样才能更好地实现隐性知识在区域创新系统内共享提出对策。郭朝阳从技术创新成本的角度，建立了国内企业与国外企业技术创新竞争的静态博弈模型，根据模型，当国外企业以规模扩张为竞争目标时，我国企业只能选择渐进式的技术创新战略。技术创新是经济发展的动力和源泉，企业是技术创新的主体，但政府也应通过创新政策的介入来鼓励和促进企业的创新。由于企业和政府各自效用不同，从而对技术创新的投入战略不同，双方对技术创新投资时都本着自己效用最大化的原则，使其在投资决策中二者相互博弈，赵惠芳通过一个静态博弈模型分析并试解释某些现实经济现象。 (2>博弈论在人力资源管理中的应用由于人力资源管理面对的对象主要涉及人与人之间的互动关系，所以用博弈论来研究人力资源管理中的一些问题能够较真实的模拟出管理情境，得出比较实际实用的结论。贾蔚使用博弈论的有关模型，对企业在人力资源管理过程中企业与其雇员之间的行为进行分析。张向前应用博弈论分析方法，在强调个人理性和政府、社会、企业理性矛盾基础上，研究分析人力资源管理中的公共资源等有关人力资源的若干问题，建立相应的分析模型，提出了解决问题的建议。涂锦分析了高校教师绩效的现状，在相关经济利益主体行为特征基础上建立高校人力资源

用博弈论分析生活中的现象

上海第二工业大学 2012-2013学年第二学期用博弈论分析生活现象论文

博弈论分析生活中现象博弈论它较好地解决了对竞争等问题的可操作性分析，成为经济学中激荡人心的一个研究领域，主要是研究各相关行为主体的决策行为相互影响、相互作用的假定条件下，博弈论就是分析博弈行为和博弈决策的一门科学。其实博弈现象不只现身于经济领域对于我们日常生活中也是处处可见的，所以博弈论的思想不仅仅能够用来分析经济从而获得最大的盈利，我们也可以尝试将博弈论的思想运用到生活实践中从而获得最优的策略。比如某一天你觉得应该是你女朋友的生日，但又不能肯定，如果是女朋友的生日的话，你可以送一束花，女朋友会特别高兴，你不送花，女朋友会埋怨你忘了她的生日如果不是女朋友的生日的话，你可以送女朋友一束花女朋友感到意外的惊喜，你不送花结果生活同往常一样。生日非生日买花 1 ，1 2 ，1 不买花-1，-1 0 ，0 确定今天是女朋友的生日或确定今天不是女朋友的生日，但你的最好行动都是买花。谈到博弈论我们不得不说到囚徒困境，其内容大致为两名罪犯A 和B隔离审讯。如果两个都不招，因为证据不充分，两人都只能判1年。如果一方招了，属立功表现，功罪相抵，无罪释放；而另一方则属抗拒从严，判10年刑但如果两人都招了，则各判 5 年。结果大家都知道：两个人争先恐后地招了，结结实实地各判了5年。两个犯

人陷入的就是囚徒困境， A B 招不招招 5 ，5 无罪释放，10 不招10，无罪释放 1 ，1 其结果就是A和B都招，判5年刑。如果两人协商后选择不招，但如果A或B其中一人招了，另一人就会判10年，而招的一人就会无罪释放，这样的诱惑足以让两名罪犯违背两人协议。而选择招。这样最有可能就是俩人都招。人际交往中的博弈人与人之间的相互矛盾和相互冲突的关系实际上就是一种博弈关系。矛盾冲突的结果也有三种情况负和游戏、零和游戏和正和游戏。“负和游戏”是一种两败俱伤的游戏故也称为双输博弈。在人与人的交往时由于相互的冲突和矛盾不能达到统一交际双方都不让步，最后使交际活动不能展开，结果是交际的双方都从中受损两败俱伤。如果是朋友，也会因不断发生“负和游戏”而逐渐疏远，夫妻间经常出现“负和”现象感情自然会受到影响。交际中之所以经常会发生“负和博弈”现象，大多是因为心胸狭窄，遇事爱使性负气，必然会出现“负和”局面。如果不使性负气，而是互相谅解，与人交往采取合作态度，便能使有矛盾和冲突的交际活动朝好的方向发展。在交际中如果遇到了和交际对象发生冲突的时候能够想着退一步海阔天高，采取一种和对方合作的态度就一定能避免交际中“负和游戏”的发生。至于“零和游戏”这种简单的“你输我赢”的思考方式往往会给人们带来更大的麻烦。其实在人与人之间的交往中双方的关系并不是简单

(完整版)博弈论知识点总结

博弈论知识总结博弈论概述： 1、博弈论概念：博弈论：就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。博弈论研究的假设： 1、决策主体是理性的，最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念与预期 2、和博弈有关的变量：博弈参与人：博弈中选择行动以最大化自己受益的决策主体。行动：参与人的决策选择战略：参与人的行动规则，即事件与决策主体行动之间的映射，也是参与人行动的规则。信息：参与人在博弈中的知识，尤其是其他决策主体的战略、收益、类型（不完全信息）等的信息。完全信息：每个参与人对其他参与人的支付函数有准确的了解；完美信息：在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动，否则为不完美信息。不完全信息：参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息，即存在着有关其他参与人的不确定性因素。支付：决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。从经济学的角度讲，博弈是决策主体之间的相互作用，因此和传统个人决策存在着区别： 3、博弈论与传统决策的区别： 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下，最大化自己效用，研究工具是无差异曲线。可表示为：maxU(P,I)，其中P为市场价格，I为消

费者可支配收入。 2、其他消费者对个人的综合影响表示为一个参数——市场价格，所以在市场价格既定下，消费者效用只依赖于自己的收入和偏好，不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式：战略式博弈和扩展式博弈战略式博弈：是博弈问题的一种规范性描述，有时亦称标准式博弈。战略式博弈是一种假设每个参与人仅选择一次行动或战略，并且参与人同时进行选择的决策模型，因此，从本质上来讲战略式博弈是一种静态模型，一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合： 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合上的效用函数Ui(s1,s2,…,sn). 扩展式博弈：是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比，扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。包含要素： 1、参与人集合 2、参与人的行动顺序，即每个参与人在何时行动； 3、序列结构：每个参与人行动时面临的决策问题，包括参与人行动时可供选择的行动方案、所了解的信息； 4、参与人的支付函数。比较： 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

战略风险投资博弈模型分析

战略风险投资博弈模型分析本文此处将通过对风险投资公司投资处于成长阶段创新企业的活动的分析和研究，提出信号传递博弈模型的企业价值评估方法。通过信号传递博弈模型来分析企业向风险投资公司传递信号(企划书)对价值评估结果的影响，给风险投资公司进一步量化风险和预期投资收益提供思路和参考。 4.1 如何对风险投资目标企业进行价值评估目前国际上对一个成熟的企业的价值评估一般分为以下五个步骤：分析历史绩效、预测绩效、资本成本评估、连续价值评估、计算并解释结果。这几个步骤有些因为创新企业还远未成熟而无法进行，比如历史绩效分析时很可能财务数据不健全，目标市场价值权数选取时也因为主观预测成分很大而具有很大风险性；最重要一点，由于创新企业急需要注入大笔资金才能继续生存和发展，风险投资公司必须在尽量短的时间内作完考查工作，因为时间价值可谓创新企业的生命价值，错过发展时机肯定是要牺牲的。在这尽量短的时间内，创新企业需要一定的融资技巧，而且有很强的信息优势，风险投资公司除应在投资合约中对其进行约束之外，也要根据自己的观察结果给企业定价，以作为谈判和投资的基础。本文拟引入信息经济学中信号传递博弈模型的企业价值评估方法，风险投资公司结合以往投资经验和统计结果对相应估计结果进行调整，以便客观评估企业的价值及是否值得投资。作为创新企业经营者一方面应利用信息优势影响评价结果，另外对企业有初步的估价以免在价格谈判中贱卖了企业，所以该模型对谈判双方都具有一定的实际价值。 4.2 信号传递博弈模型介绍信号传递模型(Signaling Games)是一种比较简单但有广泛应用意义的不完全信息动态博弈。在这类博弈中，有两个参与人，i= 1，2，参与人1称信号发送者，参与人2为信号接受者；参与人1的类型是私人信息，参与人2的类型是公共信息。博弈顺序如下： (1)“自然”首先选择参与人1的类型θ∈Ω，此处Ω={θ1，…，θK}是参与人1的类型空间，参与人1知道θ，但参与人2不知道，只知道参与人1属于θ的先

博弈论与社会科学方法论(潘天群)

通识课课程中文名称：博弈论与社会科学方法论课程英文名称：Game Theory and Methodology of Social Sciences 课程代号：开课学期：第一学期（秋学期）主讲教师：潘天群职称：教授、博导研究专长：博弈论、逻辑学、科学方法论所在院系：哲学联系电邮：tqpan@https://www.wendangku.net/doc/ea9512144.html, 授课对象：全校二、三年级本科生（不限专业）一、主讲教师简介：潘天群，哲学博士，现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才（2006）。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。主要研究领域为：逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部：《行动科学方法论》，《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》，自2002年出版以来深受读者欢迎，为畅销书与长销书，已出版第三版。主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”（2009）。二、课程简介由于“他人”与“我”是既合作又竞争的关系，研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来，对社会现象表现出强大的解释力，已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖，许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学（如生物学、人工智能）之中。本课程突破数理博弈论的框架，结合主讲教师十年来的研究工作，构建适合

博弈论经典模型全解析

博弈论经典模型全解析（入门级） 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境，非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事，结果被警察发现抓了起来，分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下，两个囚犯都可以做出自己的选择：或者供出他的同伙(即与警察合作，从而背叛他的同伙)，或者保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不

会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中，我们不可避免地也会遇到类似的两难境地，这个时候需要相互之间有足够的了解与信任，没有起码的信任做基础，切不可贸然合作。在对对方有了足够的信任之后，诚意也是必不可少的，如果没有诚意或者太过贪婪，就可能闹到双方都没有好处的糟糕情况，造成企业之间的双输。 2. 智猪博弈在博弈论（Game Theory）经济学中，“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是9∶1；同时到槽边，收益比是

博弈模型分析

1．3 管理型医疗概念研究 - 概念提出 - 博弈关系杨燕绥/王瑶平 - 分析模型岳公正管理型医疗中的博弈关系：模型分析（暂题）概括地讲，管理型医疗是一种主要由医院（或者医生）、患者（或者受益人）、医疗保险管理机构（或者医疗保险经办机构）、政府四方参与的管理过程，是建立在互惠基础上的进行多方合作的医疗社会管理机制。由于经济发展水平、人文环境、行政管理具体情况等的不同，各个国家和地区的管理型医疗的结构和内容应当有其特点，具体操作方式和方法也很自然地存在差异。但是，从逻辑实质看，各个国家和地区存在着诸多差异的管理型医疗在本质上都是一个由医院、患者、医疗保险管理机构、政府四方围绕医疗服务定价、服务标准和成本控制等问题进行协商、规范和监督的管理过程。本节的研究内容：1、对于管理型医疗中的博弈关系进行划分；2、对于管理型医疗中主要的博弈关系进行分析。 1 管理型医疗中博弈关系的划分一般分析，医疗保险涉及的主体主要由医院、患者、医疗保险管理机构、政府四方组成。但是，在通常情况下，医疗保险在实际操作上涉及的主体还包括参保人、缴费人、受益人、基金管理公司、基金托管机构、医疗服务机构（营利和非营利）、药店、类似医生协会和药品协会的NGO组织、社会保障部门和卫生部门、监督评价机构等等。如何将这些组织和机构协调起来，从而降低医疗费用，提高医疗服务的质量是管理型医疗的主要内容。

图1－3—1 医疗保险的运行关系1 依据图1－3—1分析，医疗保险的运行中，包括了多元主体（医院、医疗保险经办机构、雇主、雇员、药店等）之间复杂的多维的相互制约与相互影响的关系。 1、医院和医疗保险经办机构的关系； 2、医院和受益人的关系； 3、医疗保险经办机构和受益人的关系； 4、医疗保险经办机构和药店的关系； 5、受益人和药店的关系； 6、医疗保险经办机构和政府的关系； 7、医疗保险经办机构和雇主（企业）的关系； 8、医疗保险经办机构和雇员（患者、投保人）的关系； 9、雇主和雇员的关系； 1杨燕绥著：《劳动与社会保障立法国际比较研究》，第239页，中国劳动社会保障出版社，2001年

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征： 1. 研究对象的普遍性和应用范围的广泛性人们的行为之间存在相互作用与相互依赖，不同的行为主体及其不同的行为方式所形成的利益冲突与合作，已成为一种普遍现象，这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实，使博弈论的研究内容和应用范围十分广泛，涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域，在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性一是运用数学模型来描述所研究的问题，使博弈论的分析更为精确。二是研究方法具有抽象化的特征，由于博弈论分析大量使用了现代数学，使它所描述和分析的过程及所揭示的结论都带有抽象、一般化的特点。三是博弈论分析方法所体现的模式化特征，博弈论为人们提供了一个统一的分析框架或基本范式，从而使博弈论能够分析和处理其它数学工具难以处理的复杂行为，成为对行为主体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中，不仅要应用现代数学的大量知识，还涉及到经济学、管理学、心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性博弈论中的最佳策略是经济学意义上的最优化，它只回答是什么导致博弈均衡，均衡的结果是什么，所遵循的基本原则是科学结论的客观性和普遍性。从实践上看，博弈论突破了传统的完全竞争、完全信息假定，更加强调决策者的个人理性，强调不完全信息、不完全竞争条件下的经济分析，强调决策个体之间的相互影响和相互作用等外部性，强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致，等等。作为一门方法论科学，除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外，还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说，博弈论方法具有实证的特征，使研究结果更具有真实性。

(完整word版)经典的博弈论分析案例——“海盗分金”问题

经典的博弈论分析案例——“海盗分金”问题 5个海盗抢得100枚金币，他们按抽签的顺序依次提方案：首先由1号提出分配方案，然后5人表决，超过半数同意方案才被通过，否则他将被扔入大海喂鲨鱼，依此类推。 “海盗分金”其实是一个高度简化和抽象的模型，体现了博弈的思想。在“海盗分金”模型中，任何“分配者”想让自己的方案获得通过的关键是事先考虑清楚“挑战者”的分配方案是什么，并用最小的代价获取最大收益，拉拢“挑战者”分配方案中最不得意的人们。假设前提假定“每个海盗都是绝顶聪明且很理智”，那么“第一个海盗提出怎样的分配方案才能够使自己的收益最大化？” 推理过程从后向前推，如果1至3号强盗都喂了鲨鱼，只剩4号和5号的话，5号一定投反对票让4号喂鲨鱼，以独吞全部金币。所以，4号惟有支持3号才能保命。 3号知道这一点，就会提出（100，0，0）的分配方案，对4号、5号一毛不拔而将全部金币归为已有，因为他知道4号一无所获但还是会投赞成票，再加上自己一票，他的方案即可通过。不过，2号推知3号的方案，就会提出（98，0，1，1）的方案，即放弃3号，而给予4号和5号各一枚金币。由于该方案对于4号和5号来说比在3号分配时更为有利，他们将支持他而不希望他出局而由3号来分配。这样，2号将拿走98枚金币。同样，2号的方案也会被1号所洞悉，1号并将提出（97，0，1，2，0）或（97，0，1，0，2）的方案，即放弃2号，而给3号一枚金币，同时给4号（或5号）2枚金币。由于1号的这一方案对于3号和4号（或5号）来说，相比2号分配时更优，他们将投1号的赞成票，再加上1号自己的票，1号的方案可获通过，97枚金币可轻松落入囊中。这无疑是1号能够获取最大收益的方案了！答案是：1号强盗分给3号1枚金币，分给4号或5号强盗2枚，自己独得97枚。分配方案可写成（97，0，1，2，0）或（97，0，1，0，2）。分析 1号看起来最有可能喂鲨鱼，但他牢牢地把握住先发优势，结果不但消除了死亡威胁，还收益最大。这不正是全球化过程中先进国家的先发优势吗？而5号，看起来最安全，没有死亡的威胁，甚至还能坐收渔人之利，却因不得不看别人脸色行事而只能分得一小杯羹。不过，模型任意改变一个假设条件，最终结果都不一样。而现实世界远比模型复杂。首先，现实中肯定不会是人人都“绝对理性”。回到“海盗分金”的模型中，只要3号、4号或5号中有一个人偏离了绝对聪明的假设，海盗1号无论怎么分都可能会被扔到海里去了。所以，1号首先要考虑的就是他的海盗兄弟们的聪明和理性究竟靠得住靠不住，否则先分者倒霉。如果某人偏好看同伙被扔进海里喂鲨鱼。果真如此，1号自以为得意的方案岂不成了自掘坟墓！再就是俗话所说的“人心隔肚皮”。由于信息不对称，谎言和虚假承诺就大有用武之地，而阴谋也会像杂草般疯长，并借机获益。如果2号对3、4、5

历史的制度分析：博弈论分析方法

历史的制度分析：博弈论分析方法把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究，目前主要有两种方法。一种是“进化博弈论方法”（evolutionary game approach）。经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。它将人类的经济活动和竞争性经济行为同生物的进化相类比，研究人类经济行为中的策略和行为方式的均衡，以及向均衡状态调整、收敛的过程与性质。采用这一方法的研究者认为，社会制度并不是由什么人有意设计出来的，而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。这就是所谓的“适应性进化”过程。进化博弈论的引入，就是为了分析和说明社会制度的这一适应性进化过程。进化博弈论之所以在制度变迁理论中受到重视，主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程，从而在纳什均衡的理性主义解释遇到理论困难时，显示出了通过进化机制实现纳什均衡的可能性。应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”（repeated game approach），它运用更精细的均衡概念，如“子博弈精炼均衡”（subgame perfect equilibrium）来分析历史与现实中的制度选择与变迁过程。其中最具代表性的，就是格瑞夫进行的“历史的比较制度分析”。所谓的重复博弈，实际上是指同样结构的博弈重复地进行多次。与一次性博弈不同，它是由若干个阶段博弈（stage game）构成的一个完整的和相对长期的博弈过程。因此，在重复博弈中，各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益，而是他们在整个博弈过程中的总体利益和长期利益。当各博弈方面对不同的策略选择时，他必须考察到其在当前阶段的博弈中所采取的策略，不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。也就是说，他不能像在一次性博弈中那样，毫不顾及其他博弈方的利益。有时，一方若作出一种合作姿态，可能会使其他博弈方在随后的阶段中也采取合作态度，从而实现共同的长远利益。这样，在重复博弈中就存在着比一次性博弈更大的合作的可能性，也有可能实现比一次性博弈更有效率的均衡。重复博弈论的这一特征，为它说明人类之间的合作行为，特别是说明历史与现实社会中体制与制度的演变过程，提供了强有力的支持。在历史的比较制度分析那里，制度被定义为本身是“自我实施的对行为的非技术决定的约束” ，即所谓的自我实施制度（self-enforcing institution ）。自我实施制度的一个最基本的特征，就是它的自发产生和自我实施的性质。与那些由国家和法律强制实施的制度不同，自我实施制度必须是参与人各方经过协商、谈判、讨价还价后自愿达成一致的结果。因此，历史的比较制度分析将自我实施制度视为特定历史条件下制度博弈的一种均衡状态或均衡结果。自我实施制度产生的过程，也就是制度博弈各方在特定的战略局势中，根据自己不同的目标自主地选择各自的最优策略与对手进行博弈，最后求得制度均衡的过程。而所谓的“子博弈精炼均衡”，恰恰是指在构成动态博弈的所有子博弈阶段上都实现了纳什均衡。这就是说，一个子博弈精炼均衡，必须是各博弈方在整个博弈的每个阶段（子博弈）都选择了不愿单独改变的策略（纳什均衡）的最终结果。如果我们从博弈论的角度来观察自我实施制度，就会发现自我实施制度与子博弈精炼均衡之间的内在联系。简单地说，自我实施制度所具有的自发产生和自我实施的基本属性，说明了它必定是制度博弈各方在每个子博弈中都选择了不愿单独改变的最优策略的结果，也即实现子博弈精炼均衡的结果。更直接地说，自我实施制度的产生，必定是一个制度博弈实现了子博弈精炼均衡的结果。反过来说，如果一个制度博弈实现了子博弈精炼均衡的结果，那它也应该是自我实施的。

最后通牒博弈中提议者的公平行为

最后通牒博弈中提议者的公平行为 1最后通牒博弈范式最后通牒博弈范式（ultimatum game，简称UG）最早由Güth提出，其基本形式是两人搭配为一组分配一笔固定数目的金钱，其中一人是提议者，负责分配金钱并提出出价（offer），另一人是回应者，负责接受或拒绝出价。若回应者接受则按照提议者的方案分配；若拒绝则两个人均什么也得不到。标准的博弈理论认为，提议者会尽可能地给回应者最小单位的份额，而回应者最合理的策略是接受任何大于0的出价，因为少总比没有好。然而，实验结果发现，提议者很少给出低于20%的出价，甚至愿意与回应者平均分配，而回应者则不愿接受低于20%的出价（Camerer，2003）。 2 提议者的公平行为 2.1 提议者公平行为的本质：策略考虑还是公平偏好 UG中尽管提议者作为优势主动方，却表现出了公平行为，其行为本质是什么，这一点引起了研究者的兴趣。有研究者认为，该行为可完全由策略动机来解释，即提议者考虑了回应者拒绝出价的可能性，为实现收益最大化而提出公平的出价。Paul等（1995）操纵了回应者的信息可得性，发现：当回应者不知道分配总额时，提议者所给的出价显著低于回应者知道分配总额时的出价。研究者认为：公平考虑不能解释提议者的出价行为。但有研究者认为，不能完全否定公平考虑的作用，提议者的一些高出价很有可能是以策略和公平为基础的动机整合的结果（Camerer，2003）。对此，有研究者则提供了直接证据来研究提议者的出价动机（Jordan & David，2013）。实验设置了三种处理：基线处理、公平处理和策略处理。基线处理即为标准的UG范式，当提议者的出价低于回应者的最小可接受出价时，则为拒绝，两人什么都得不到；反之，则为接受，按照提议者的出价进行分配；公平处理与UG范式的不同之处是，回应者没有否决权，只能接受提议者给出的任何出价，此时提议者给出任何大于0的出价均为公平偏好所致；而策略处理与基线处理的区别是，回应者在任何情况下都可得到全部金钱，但如果提议者的出价低于回应者的最小可接受出价，提议者则什么都得不到，该情境下提议者给出任何大于0的出价均被认为是基于策略推理的考虑。结果发现，只有策略处理与基线处理下的出价无差异，由此认为：潜在的拒绝威胁足以使提议者做出高出价，以理性自利为基础的策略推理可单独解释公平出价，不应过度分析公平偏好的作用。 2.2影响因素基于提议者策略考虑的事实，一些研究者探讨了回应者权力的大小对提议者

论文-博弈论方法在经济学中

经济生活中的博弈论应用摘要：博弈，这个原来只是在学术圈出现的名词，如今已经越来越多地走进了我们的生活。博弈论是运筹学的一个重要分支，其中，非合作博弈（non- cooperative game）是现代博弈理论中的核心内容和重要基础，下面通过对经典案例囚徒困境和智猪博弈的分析，对纳什均衡相关定义的研究，得到了在经济决策中行为人如何决定最优决策的方法。在此基础上，以纳什均衡作为理论支撑点，结合得益矩阵分析解决了经济生活中商家价格战的一些实际问题。关键词：博弈论；均衡点；得益矩阵；纳什均衡

目录一.引言 (3) 二．博弈论与纳什均衡的主要内容 (3) 2.1博弈论的主要思想 (3) 2.2博弈论的分类 (4) 2.3纳什均衡 (4) 2.4 纳什均衡的分类 (4) 三．案例分析 (5) 3.1 囚徒困境（1950年，图克） (5) 3.1.1案例分析 (5) 3.1.2案例应用 (6) 3.2 智猪博弈（1950年，约翰.纳什） (6) 3.1.1 案例分析 (7) 3.1.2 案例应用 (7) 四．价格战博弈 (8)

一.引言近代对于博弈论的研究，开始于策墨咯（Zermelo），波雷尔（Borel）以及冯·诺伊曼（V on·Neumann）。1928年冯·诺伊曼证明了博弈论的基本原理，从而宣告了博弈论的正式诞生。1944年，冯·诺伊曼和摩根斯坦共同撰写了时代巨著《博弈论与经济行为》并将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域，从而奠定了这一学期的基础和理论体系。1950-1951，约翰·福布斯·纳什（John Forbes Nash Jr）利用不动点定理证明了均衡点的存在，以此为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》（1950），《非合作博弈》（1951）等等，给出了纳什均衡的概念和均衡存在定理。此外，塞尔顿、哈桑尼等人的研究也对博弈论的发展起到了不小的推动作用。二．博弈论与纳什均衡的主要内容 2.1博弈论的主要思想书上是这样定义的：博弈是指一些个人或者组织面对一定的环境条件，在一定的规则下同时或者先后一次或者多次从各自允许选择的行为或策略中进行选择并加以实施，进而各自取得相应结果的结果。现代科学将这种“对策论”、“对局理论”称之为博弈论，主要研究公式化了的激励结构间的相互作用。从上述定义中可以看出，一个完整的博弈一般由以下几个要素组成：博弈的参加者，各博弈方各自选择的全部策略或行为的集合、博弈方的得益（得益矩阵）、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人，也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则，即在博弈进程中，什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用，一般是所有参与人的

博弈模型

有趣味的博弈论模型按语：本文已经发表在“百科知识”2009年6月下半月总第413期第14-15页；在今年2月下半月总第405期第11-13页上发表了“网络科学三大里程碑”；2005年11月上半月总第326期第21-22页发表了“网络科学的三大发现”。令我意外的是去年在网上偶然发现“共检索到 10 条读者推荐文章”（请看最后附录），这篇科普文章名列首位，我们还有一篇文章名列第七。如果读者有兴趣可以去看看，或等我有时间找出来。我觉得，把新兴科学应用通俗易懂的语言写出来，有利于科学知识普及。这也应该是一个科学工作者的责任。在自然界和人类社会经济等领域中广泛存在合作与竞争，而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论（Game Theory），也称对策论，它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论，研究个体之间行为的相互影响和相互作用规律，它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是，有三次诺贝尔获奖者是博弈论的杰出科学家，他们是1985年获得诺贝尔奖的公共选择学派的领导者布坎南，1994年经济学诺贝尔奖颁发给美国普林斯顿大学的纳什博士、塞尔屯、哈桑尼3位博弈论专家，1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末，随着复杂网络科学的一些新的发现，博弈论也成为网络时代人们的一种思维方式、竞争与合作的模式。博弈论对人有一个最基本假定：人是理性的，人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的，因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究，并获得了丰富多彩的结果，利用博弈论可以解读人类的社会行动或集体行动，更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响，人们已经提出和研究了许多博弈模型，比较著名的有三个模型：囚徒困境、“雪堆”博弈和“少数者”博弈，下面笔者通过对这三个模型进行简单而通俗的介绍，让大家了解博弈论及其应用概况。 “囚徒困境”模型囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕，分别关在不同的屋子里，如果双方都拒绝承认同伴的罪行，则由于证据不足两人都会被轻判（收益为）；为此，警方设计了一个机制：如果一方出卖同伴，而另一方保持忠诚，则背叛者将无罪释放（收益为T ）；坚持忠诚的一方将被重判（收益为）；如果双方都背叛了对方，则双方都会被判刑（收益为R S P ）。这里假设上述收益参数满足下面的条件：。对每个参与者来说，如果对手坚持忠诚，则他也选择忠诚得到的收益T R P S >>>R 小于他选择背叛得到的收益T ；如果对手选择背叛，则他选择忠诚得到的收益仍小于他选择背叛得到的收益。 S P 可见，无论对手采取哪种策略，自己的最佳策略就是背叛，双方都选择背叛称为囚徒困境的唯一“纳什均衡”（纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔获得经济学奖）；同时选择背叛所取得的平均收益要低于两个人同时选择合作取得的平均收益。在这种情况下，理性参与者面临着两难的困境。自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为

(完整版)完全信息静态博弈及其纳什均衡解

1 第四章完全信息动态博弈及其均衡解 1.完全且完美信息动态博弈完全信息博弈指的是参与者的收益是共同知识。完全且完美信息动态博弈指的是：博弈中的每一步中参与人都知道这一步之前博弈进行的整个过程。因此，我完全且完美信息动态博弈的特点：（1）行动是顺序发生的；（2）下一步行动选择之前所有以前的行动都可以被观察到；（3）每一可能的行动组合下的参与人的收益都是公共知识。而不完美信息博弈指的是，在某一步参与人不知道以往博弈所进行的历史或者没有观察到以往的所有行动。例4.1．我们来考虑这样一个动态博弈: 假定甲在开采一个价值4万元的金矿时需要1万元资金，乙有1万元资金。甲向乙借钱来开金矿。在这个博弈的第一阶段，甲向乙承诺: 如果乙借钱给他的话，那么他就会将采到的金子与乙对半分成，即(2，3)——乙得到2万元的金子，同时收回自己的1万元投资。对于甲的承诺，乙如果不借钱给甲的话，那么博弈到此为止，双方收益为(0，1)。如果乙借钱给甲的话，那么博弈进入第二个阶段。在第二阶段中，若甲遵守他的承诺，分给乙一半的金子，这样两人的收益为(2，3)，其中1万元为投资成本。〖JP3〗然而，若甲违背自己的承诺，博弈就会进入到第三个阶段: 如果乙同甲打官司，那么由于打官司费时费力，两个人的收益为(0，1)；若乙不打官司，那么两个人的收益就为(5，0)。参见图1。乙借不借甲分不分（0，1）乙乙（2，3）打官司不打官司（1，2）（5，0）图1. 借钱博弈的博弈树 2.逆向归纳法与子博弈纳什均衡解逆向归纳法（Backward induction ）又称逆推法，是指这样一种动态博弈求解方法：从博弈的最后一步开始，计算最后一步的参与人的最优行动，逐步逆推到博弈开始时进行第一步的参与人的最优行动，从而确定每个参与人的最优行动。在动态博弈中逆向归纳法能够进行的前提：参与人是理性的——任何一步参与人都选择甲乙

博弈论知识点总结完整版

博弈论（一）：基本知识 1.1定义:博弈论，又称对策论，是使用严谨的数学模型研究冲突对抗条件下最优决策问题的理论，是研究竞争的逻辑和规律的数学分支。即，博弈论是研究决策主体在给定信息结构下如何决策以最大化自己的效用，以及不同决策主体之间的均衡。 1.2基本要素：参与人、各参与人的策略集、各参与人的收益函数，是博弈最重要的基本要素。 1.3博弈的分类：博弈论根据其所采用的假设不同而分为合作博弈理论和非合作博弈理论。两者的区别在于参与人在博弈过程中是否能够达成一个具有约束力的协议（binding agreement）。倘若不能，则称非合作博弈（Non-cooperative game）。合作博弈强调的是集体主义，团体理性，是效率、公平、公正；而非合作博弈则主要研究人们在利益相互影响的局势中如何选择策略使得自己的收益最大，强调个人理性、个人最优决策，其结果有时有效率，有时则不然。目前经济学家谈到博弈论主要指的是非合作博弈，也就是各方在给定的约束条件下如何追求各自利益的最大化，最后达到力量均衡。博弈的划分可以从参与人行动的次序和参与人对其他参与人的特征、战略空间和支付的知识、信息，是否了解两个角度进行。把两个角度结合就得到了4种博弈： a、完全信息静态博弈，纳什均衡，Nash(1950) b、完全信息动态博弈，子博弈精炼纳什均衡，泽尔腾（1965） c、不完全信息静态博弈，贝叶斯纳什均衡，海萨尼（1967-1968） d、不完全信息动态博弈，精炼贝叶斯纳什均衡，泽尔腾（1975）Kreps, Wilson(1982) Fudenberg, Tirole(1991) 1.4课程主要内容：完全信息静态博弈完全信息动态博弈不完全信息静态博弈机制设计合作博弈 1.5博弈模型的两种表示形式：策略式表述(Strategic form), 扩展式表述（Extensive form） 1.6占优均衡： a、占优策略：在博弈中如果不管其他参与人选择什么策略，一个参与人的某个策略给他带来的支付值始终高于其他策略，或至少不劣于其他策略，则称该策略为该参与人的严格占优策略或占优策略。对于所有的s-i，si*称为参与人 i的严格占优战略，如果满足： ui(si*,s-i)>ui(si',s-i) ?s-i, ?si' ?si* b、占优均衡：一个博弈的某个策略组合中，如果对应的所有策略都是各参与人的占优策略，则称该策略组合为该博弈的一个占优均衡。 1.7重复剔除严劣策略均衡： a、“严劣”和“弱劣”的含义：设s i’和s i’’是参与人i可选择的两个策略，若对其他参与人的任意策略组合s-i, 均成立 u i(s i’, s-i) < u i(s i’’, s-i), 则说策略s i’严劣于策略s i’’。上面式子中，若将“<”改为“≤”，则说策略s i’弱劣于策略s i’’。 b、定义：重复剔除严格策略就是各参与人在其各自策略集中，不断剔除严劣策略…如果最终各参与人仅剩下一个策略，则该策略组合就被称为重复剔除严劣策略均衡。（二）：纳什均衡（Nash Equilibrium） 2.1纳什均衡定义：对于一个策略式表述的博弈G={N,S i, u i,i∈N}，称策略组合s*=(s1, …s i, …, s n)是一个纳什均衡，如果对于每一个i ∈N, s i*是给定其他参与人选择s-i*={s1*, … ,s i-1*, s i+1*, … ,s n*} 情况下参与人i 的最优策略（经济理性策略），即：u i(s i*, s-i*)