文档库 最新最全的文档下载
当前位置:文档库 › 博弈论试题及答案

博弈论试题及答案

博弈论试题及答案
博弈论试题及答案

诚信考试沉着应考杜绝违纪

《博弈论》试卷

课堂周四(7/8)

院系专业万方电气系通信工程

学号

余数 0

姓名

河南理工大学2010–2011学年第1学期

《博弈论》课程期末考试试卷

开课学院:经济管理学院,考试形式:开卷,允许带___________入场

考试时间:2010年12月25日-12月25日, 所需时间:周

考生姓名:学号:专业:

题序一二三四五六七八总分得分

评卷人

1、第一题:(10分)

(1)举一个你所经历情侣博弈的情形,在实际博弈中你采取什么行动让自己收益最大;

答:作为一个男生,我想很多机会都是把握在自己手中的,情侣博弈有二个“纳什均衡”,一次博弈的结局究竟落到哪一个“纳什均衡”,关键就是要看遇事时自己如何去选择了。

例如:周末和女朋友去逛商场,应该客观地按照需求去采购,在了解女朋友的爱好的前提下,想办法引导她去看性价比最高的商品,并给予一定建议。遇到她特别喜欢的衣服或饰物,只要价格合理,又能满足生活需要,在对方征求意见时应该支持购买并给予肯定答复;当遇到不合理的购买选择时,应简明扼要地说出其不适之处,并建议对方到其它她喜欢的物品处,挑选令其满意的商品。购物中间一旦遇到对方生气或者发火,可以宽容地对待对方,以显示出自己的城府,若对方为无理取闹,应该坦诚地向对方说明情况,让对方明白自己在为她考虑,说明都说清楚了事情也就简化了。另外,在购物结束前,可以给女朋友买些她喜欢的零食,或者一起去对方喜欢的餐饮店,休息的同时也可调节一下情调,让双方都能够感觉到两个人在一起的幸福与甜蜜。

总结一下,在这场情侣博弈中,要想让自己获得最大收益,必须努力做到认真、善意、宽容、强硬、简单明了各种措施相结合。

2、第二题:(20分)

请举例说明下列说法是否正确,构造博弈模型具体说明,阐述原因。

(1)判断分析“先下手为强”

答:“先下手为强”并不满足所有的情形。

博弈中,在有多个"纳什均衡"的情况下,常常是先动手的一方会占一些优势,这和课例中“囚徒困境”情形类似,有一个最佳策略,古代的很多例子也证明了此点,如:诸葛亮先下手为强,占据荆州要势;日本先下手为强,偷袭美国的珍珠港,不然就不会有第二次世界大战;三国曹操先下手为强,迎接汉献帝,后挟天子以令诸侯等。要指出的是,“动态博弈”中也是有很多后动优势的情形,一般是在方案已经制定,自身实力比较弱,需要选择决策的时候,主动放弃先发权利,变先动劣势为后动优势。如:三人参加选举,支持率分别为15%,35%,50%,这个时候,如果15%者先采取行动,可能会立刻被强敌灭掉,所以他必须保存实力,保持低调,不介入强者的争斗,由另两位先动手,争取灭掉一方后均分失败者的支持率,虽然这样扔处于劣势,但比最初情况要好很多。所以,在面对选择

时,一定要先审时度势,做出最合适的选择。

3、第三题:(20分)

(1)案例来源:网易新闻:《虚高房价这样与百姓博弈100天,开发商仍在力挺》,2005年7月

13日

[案例内容]:

现在离3月26日国务院调控楼市的“国八条”出台已逾百天,房地产市场交易凋零至冰点,但开发商们仍在力挺虚高房价,博弈市场。

博弈之一:联手造势

5、6月间,上海的开发商们不只开了一次“碰头会”,达成的“共识”都是不降价,“坚决挺到市场回暖的那天”。

6月底,上海市房地产行业协会一负责人甚至鼓吹“目前房价不具备回探、回弹和大跌的可能,回涨将众望所归”;本月初,上海某地产集团董事长竟公然宣称,中央房地产调控政策“造成了消费恐慌”。博弈之二:集体捂盘

按常规,五、六月份是楼市销售旺季,而今年长三角等楼市敏感地区,许多具备销售条件的楼盘纷纷延迟开盘。

以宁波为例,去年前5个月的新开楼盘达22个,而今年同期只开了5个。上海、南京、杭州5月以来新盘推出的节奏明显放缓。开发商们声称只要能坚决“捂住”,最快到九、十月份行情就可能恢复。更有甚者,反正房子卖不出去,一部分开发商干脆挂高房价,试探市场。

博弈之三:死守高价。

即便是面对连续几个月一套没卖的局面,大的开发商也不轻言降价。一些中小开发商迫于生计,调价也采取了小幅迂回战术,一百元一百元地下调。优惠后的房价依旧远高于去年10月新一轮疯长之前的价格。

位于上海闸北区的一个分批销售的项目,去年10月,一期开盘合同均价为7817元/平方米,而今年3月推出的第三批房源均价已升至1.1万元/平方米。尽管五、六两月连续“零成交”,其第四批房源合同均价还是高达10386元/平方米。

问题:为什么开发商能联手推高房价?你有什么建议让开发商降价?

答:开发商能联手推高房价是因为如今民用房和商品房都比较紧缺,买家都是希望自己能够买到中意的房子,开发商正是利用了他们这一选择,同行之间联手推高房价还提高自己的收益。

要想让开发商降价,首先,可把房地产开发商之间的价格同盟看作是重复博弈。如果博弈只有一次,则每个局中人只关心一次性支付,降价也许是有利的。但若博弈重复多次,则局中人可能会为长远利益而牺牲眼前利益。因而合作——守住高价是最优选择。其次,房地产是地方政府的重要财源。地方政府普遍担心楼市盘整时间过长。开发商们正是利用了地方政府的此番心理,不停地给政府部门“吹风”:调控的目的已经达到,该“鸣金收兵”了。最后,开发商最大的“心结”是市场观望时间过长。市场长期以来没有人气来改变,房价的定价权会回到购房人手中。也就是说,按照市场规律,房价高企能够持续多久就值得怀疑了。如果市场需求下降,价格下降是迟早的事。如果厂商也预期到了这一点,就会选择先下手为强,如此以来,价格同盟可能就很难实现了。

4 、第四题:(20分)

(1)皇帝与功臣

以下是皇帝与功臣博弈的战略表达式,分析三种不同情况的均衡结果,结合有关历史事实对其中的区别进行讨论。

如果功臣的类型(实力强弱)是私人信息,那么作为功臣如何通过传递自己是弱的信号避免杀身之祸?

因为皇帝的不同类型(如正统与非正统,实力强与实力弱)也会对博弈的均衡结果产生影响,那么皇帝如何通过传递自己是强的信号降低功臣造反的概率?

进一步看,只要是家天下就难以避免通过暴力手段进行改朝换代的历史命运,因为皇帝(包括后续的皇帝)总有变弱的那一天,当皇帝的收益又是如此巨大。因此,您认为应该采取哪些有效的机制才能跳出中国几千年的历史周期律。

功臣(实力强)

造反不造反

皇帝杀0,0 -1,-2

不杀-2,2 1,1

功臣(实力中)

造反不造反

皇帝杀0,-1 -1,-2

不杀-2,0 1,1

功臣(实力弱)

造反不造反

皇帝杀0,-3 -1,-2

不杀-2,0 1,1

答:由上述表格可知:当功臣实力强时,功臣造反时的收益是0,皇帝的杀死功臣收益也是0,说明功臣造反皇帝杀死他时结果是二者的收益都为0都得不到好处。功臣不造反他的收益是-1,而皇帝处决他收益为-2,表示皇帝为了稳定自己的江山而解决后顾之忧,但是皇帝也得不到益处。因为功臣对国家的贡献是巨大的,这对皇帝的统治带来很大的阻碍。而当功臣造反皇帝却没有处死他时,这时候功臣就成了叛贼,他也将一无所有,而皇帝没有杀他这给世人留下了好形象。皇帝的收益将得到最大。当实力强的功臣没有造反时皇帝和功臣的收益都是1,这是最理想的现实,国家稳定皇帝功臣和睦相处。比如宋朝的时候实行良好的政策。

当功臣的实力一般时,功臣造反的结果肯定没收益,而皇帝为了稳固自己的地位把他杀死这对皇帝来说收益是-1,如果皇帝不杀他这时候功臣造反落的什么都没有,他的收益为-2,皇帝也没有收益。功臣不造反而皇帝为了稳固自己及子孙后代杀死功臣,这时功臣损失了,皇帝也损失,皇帝得不到世人的拥护损失更大。只有在实力中等的功臣不造反,皇帝也不起疑心不杀功臣是最好的结果。

当功臣的实力弱时,功臣对皇帝的影响不大,功臣造反皇帝把他处死,功臣没有得逞造反,而皇帝的损失更大,因为功臣根本不会对他造成阻碍,而皇帝因为杀了功臣却得不到老百姓的爱戴,如果皇帝不杀功臣,这时候功臣一无所有收益为-2,而皇帝没杀他,皇帝没什么影响。当功臣不造反皇帝却把他杀死了,这时是两败俱伤,功臣的收益是-1,而皇帝的收益是-2,只有功臣不造反,皇帝不杀功臣时是最理想的,因为功臣没实力根本不会造成什么影响。

经分析,皇帝想做永远的皇帝是不可能的,因为功臣的实力总有变强的一天,而皇帝的实力也总有一天会变弱,只有通过民主的选举,轮流选出百姓心目中的真正的能力强的人当领袖。民主领导大众,人民当家作主。没有剥削没有等级,人人平等,国家繁荣发展,即走向现实我们的共产主义社会,国家政府有一个正确的方向去领导广大人民,只有这样,才能在现实中获得双赢。

5、第五题(20分)

(1)学号尾数除以3余0的同学做:

上网查阅当前朝鲜半岛局势的情况,运用博弈论相关知识分析评论各方的行动,并预测走势。

答:当前朝鲜半岛和韩国之间的争端,实际上就是美国为了自己的利益支持韩国,为美国在东亚地区的军事和外交行动找借口。美国需要朝鲜半岛保持紧张状态,为此,朝鲜一再被推到风口浪尖。而朝鲜面临这种紧张形势毫不示弱,结果到底有利于谁,关键在这场博弈中,看谁的智力水平更高超,谁的意志品质更优秀,谁的做法更符合国际形势发展的客观趋势。

从近期的形势发展看,美国利用“天安”号事件拉近了美韩关系,扩大了在东亚海域的军事存在,加强了对朝鲜乃至中国的军事压力,看上去美国实现了意图并占据了优势。但无论是“天安”号事件还是延坪岛炮战,客观上都证明了这样一个结论,即美国保护不了韩国,追随美国必将付出惨痛代价。朝鲜掌握核武器无疑增加了美国对朝动武的顾虑。另外,中朝关系已发展到非同一般的战略水平,对朝鲜可能受到的来自美国的军事打击,中国不会允许,俄罗斯不愿看到,甚至韩国也未必同意。一旦美朝开战,塔利班、基地组织、伊朗以及众多潜在的反美势力必将趁势而起,导致局面更不可收拾。朝鲜试图用大炮告诉韩国,追随美国敌视朝鲜的政策没有出路;告诉美国,解决半岛问题的出路是和平谈判而不是施加压力和炫耀武力。

综合各方面考虑:韩国正确的政策是走到和平轨道上来,排除外部干扰,实现自主和平统一;朝鲜则是要坚持以自强来自保,同时与有利于自己国家的势力联合,在友好相处中获得共同收益。

6、第六题(所有同学都做):(10分)信号传递

请自己给自己出一道题目并加以解答,其难度必须超过试卷中其它题目的平均难度(越难越好,难度大小与评分直接相关),要求在解答中应用博弈模型进行分析和计算。如果你的题目不是自己原创,请务必注明出处。如果您的题目是自己原创,请同时给出您出此题的原因。

案例名称:大股东与美国公司变革-----占优均衡

案例来源:人民网新闻:《改进上市公司管理——美国证交会拟交还股东监督权》, 2004年4月5日

案例内容:

2004年3月初,美国娱乐业巨头——迪斯尼公司上演了一出股东“逼官”的大戏,身兼公司董事长和首席执行官的迈克尔·艾斯纳被剥夺了董事长一职。3月下旬,万年能金融公司董事会被迫接受4家机构投资者联合提出的董事人选;迫于股东的压力,微波—世界通信公司出台了一项新规定:公司董事会在任命新董事时必须向持股数量超过15%的大股东征询意见。

自从迪斯尼股东炒了老板的“鱿鱼”之后,美国一些公司股东要求变革的呼声日益强烈,就连美国证券交易委员会也变得积极起来。美国证交会计划推出新的政策,其核心内容是,允许拥有5%变通股的公

司股东直接推选董事人选。按照证交会的说法,此举的目的是使股东更充分地行使对公司事务的监督权,同时也可以减少由于监督不力导致的公司管理层的各种违规行为。

案例分析:

从该案例可知,上述三公司的行动表明:股东对公司的监督功能在日益增强。在这一形势推动转变的过程中,大股东及机构投资者的作用至关重要。

在现代企业制度中,大股东与小股东之间存在着角色和行为差异。根据公司监督成本与收益的对比关系,大股东有更大的积极性去监督经理们的工作,而小股东则容易选择坐享其成。

结合课堂所学知识,我认为这种情况可以用博弈论中的“猪智博弈”进行分析。在“猪智博弈”中,“等待”是小猪的占优策略,跑去“按按钮”是小猪的劣策略。最终的博弈均衡是:小猪等待,大猪按按钮。在上例中,大股东相当于“猪智博弈”中的大猪,小股东相当于小猪。在大小股东是否密切监督经理工作的博弈中,大股东因为利益攸关会担当起搜集信息监督经理的责任,而小股东则坐享其成也可因大股东密切监督经理的工作而获得收益,即选择所谓的“占优策略”。

博弈论考试题目

博弈论考试题 一、名词解释(20分) 1.纳什均衡 2.子博弈完美均衡 3.重复博弈 4.贝叶斯博弈 二、简答题(30分) 1.按照信息和顺序,博弈有哪些分类?且对应的均衡概念分别是什 么? 2.在完全信息静态博弈中,求纳什均衡的方法有几种,分别是什么? 3.对于重复博弈,合作解可能在哪些情况下产生? 三、分析题(25分,每小题5分) 假设公安局抓住了两个合伙犯罪的嫌疑犯,但获得的证据并不十分确切,对于两者的量刑就取决于两者对于犯罪事实的供认。这两名犯罪嫌疑人在公安局是分别关押以防他们串供。两名犯罪嫌疑人都知道,如果他们都交代犯罪事实,则可能将各被判5年;如果他们都不交代,则有可能会被较轻的妨碍公务罪各判2年;如果一人交代,另一人不交代,交代者会被立即释放,不交代者被判8年。回答以下问题:(1)请写出这两名犯罪嫌疑人博弈的支付矩阵。 (2)假设这两名犯罪嫌疑人都是自私且不讲江湖道义的人,同时被审问且不能够相互沟通串供。请给出该博弈的纳什均衡。(3)说明这两个囚徒的困境在哪里?

(4)利用囚徒困境博弈对下面现象进行解释:电信市场上移动和联通的价格战。 (5)请指出一种走出囚徒困境的办法。 四、计算题(25分) 企业甲和企业乙都是家电制造商,他们都可以选择生产高端或是低端产品,两企业在不同选择下的利润如以下得益矩阵所示。假设企业甲先于企业乙进行产品选择并投入生产,企业乙在决定生产时已经知道企业甲的选择,而且这一点大家都知道。 (1)请写出该博弈的扩展式; (2)该博弈的子博弈完美均衡是什么? 企业2 高端低端 高端 企业1 低端 答题要求: 1.必须手写; 2.稿纸单面书写; 3.下周三上午统一交。

博弈论复习题及答案(DOC)

囚徒困境说明个人的理性选择不一定是集体的理性选择。(√) 子博弈精炼纳什均衡不是一个纳什均衡。(×) 若一个博弈出现了皆大欢喜的结局,说明该博弈是一个合作的正和博弈。()博弈中知道越多的一方越有利。(×) 纳什均衡一定是上策均衡。(×) 上策均衡一定是纳什均衡。(√) 在一个博弈中只可能存在一个纳什均衡。(×) 在一个博弈中博弈方可以有很多个。(√) 在一个博弈中如果存在多个纳什均衡则不存在上策均衡。(√) 在博弈中纳什均衡是博弈双方能获得的最好结果。(×) ~ 在博弈中如果某博弈方改变策略后得益增加则另一博弈方得益减少。(×)上策均衡是帕累托最优的均衡。(×) 因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈就是非合作博弈。 (×) 在动态博弈中,因为后行动的博弈方可以先观察对方行为后再选择行为,因此总是有利的。(×) 在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业就可能具有先动优势。 囚徒的困境博弈中两个囚徒之所以会处于困境,无法得到较理想的结果,是因为两囚徒都不在乎坐牢时间长短本身,只在乎不能比对方坐牢的时间更长。 (×) 纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。(√)不存在纯战略纳什均衡和存在惟一的纯战略纳什均衡,作为原博弈构成的有限次重复博弈,共同特点是重复博弈本质上不过是原博弈的简单重复,重复博弈的子博弈完美纳什均衡就是每次重复采用原博弈的纳什均衡。(√) — 多个纯战略纳什均衡博弈的有限次重复博弈子博弈完美纳什均衡路径:两阶段都采用原博弈同一个纯战略纳什均衡,或者轮流采用不同纯战略纳什均衡,或者两次都采用混合战略纳什均衡,或者混合战略和纯战略轮流采用。(√) 如果阶段博弈G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重复博弈G(T)的子博弈完美均衡结局,其中对于任意的t

浙大博弈论考试题目

博弈论考试 1、完全信息静态博弈 1“老师点名和学生逃课”的案例 构建如下模型:老师 点名不点名 学生逃课a1,b1 a2,b2 不逃课a3,b3 a4,b4 结果:(1)老师每次点名,学生每次不逃课 a3> a1 ,b3> b4 ,a2< a4 ,b2< b1 (2)老师每次不点名,学生每次不逃课 a4> a2 , b4> b3 , a1< a3 , b1< b2 (3)老师有时候点名,学生有时候逃课 a1< a3 , a2> a4 , b1> b2 , b3< b4 (4)老师每次不点名,学生每次逃课 a2> a4 , b2> b1 , a3< a1 , b3< b4 2市场占有者和想进入市场者 构建模型:占有者 默认斗争 进入者进入(40,50)(-10,0) 不进入(0,300)(0,300) 没有占优战略均衡,也没有重复剔除的占优均衡。 结果:(1)占有者默认,进入者进入时,占有者会损失部分利益 (2)占有者斗争,进入者进入,则占有者利益变0,而进入者为负,两败俱伤,因而占有者“斗争”是弱劣战略。 (3)占优者默认,进入者不进入,则占有者获得全部市场 (4)(斗争,不进入时,占有者仍获得全部市场。 综上存在两个纳什均衡,(进入,默认)和(不进入,斗争) 3应试教育和素质教育学生 应试教育素质教育 学校应试教育(0,0)(0,-1) 素质教育(-1,0)(1,1) (1)假设学校和学生都采取应试教育为(0,0),那么若他们都转向素质教育达到最优结局(1,1),(2)但如果单方面采取素质教育,另一方为应试教育,其支付就变为-1,比如如果学校重视应试成绩,而学生重视素质教育,学生单方面受损,为-1 (3)若学校注重素质教育,而学生只注重成绩,学校的策略难以推行,支付为-1. 此博弈中存在两个纳什均衡,即(应试,应试)和(素质,素质),虽然(素质,素质)是最优纳什均衡,但一方采取素质教育存在风险:另一方为应试时,支付变为-1;若采取应试没有变为-1的风险,那么最终结局为(应试,应试)。4两个人合作开发一项产品假设项目开发成功每人收益为4,失败时收益为 0,偷懒者的机会成本为1

博弈论期末习题

《博弈论》期末习题 专业:经济学学号:2 ;姓名:王兆丽 一、试写出掷硬币博弈的局中人及其策略与得益函数,并写出双变量得 益矩阵。 答:局中人:盖硬币者和猜硬币者。 策略:有正面和反面两种可选择策略,若猜对,猜者得1盖者-1.否则猜者-1盖者1.由于每一方都不会让对方在选择之前知道自己的决策,所以可以看做是同时做决策的。 双变量得益矩阵; 猜硬币方 二、试举生活中的一例,说明囚徒困境是如何产生的?并试分析可能走 出囚徒困境的途径。 答:例子:中国移动和中国联通之间的价格战。 产生原因:囚徒困境是在个体之间存在行为和利益相互制约的博弈结构中,以个体理性和个体选择为基础的分散决策方式,无法有效地协调各方面的利益,并实现整体、个体利益共同的最优。简单的说,囚徒困境问题都是个体理性与集体理性的矛盾引起的。 可能走出的囚徒困境途径:(1)惩罚。如果政府对实行价格战以获利的企业实行惩罚,那么就会制止这种现象发生。(2)忠诚文化。有时候,建立一种相互忠诚的文化也可以帮助走出囚徒困境。在很多组织中,团体产生所面临的囚徒困境问题的轻重程度是不同的,这种差异的根本来源就是各个组织有自己的文化。(3)长期关系和重复博弈。建立长期关系使得囚徒困境博弈可以多次重复,如果这个“多次”足够长,那么人们就有可能为了长远的将来利益而牺牲眼前的一笔横财,合作也是可以达成的。

三、用逆向归纳法求解下面的博弈的子博弈完美纳什均衡。 答:1、该博弈共包括四个子博弈:(1)从博弈方1选择R 以后博弈方2的第二 阶段选择开始的三阶段动态博弈;(2)从博弈方2第二阶段选择R 以后博弈方1 的开始选择的两个阶段动态博弈;(3)第三阶段博弈方1选择A 以后博弈方2 的单人博弈;(4)第三阶段博弈方1选择B 以后博弈方2的单人博弈 2、根据逆推归纳法先讨论博弈方2在第四阶段的选择。由于选择C 、D 个中 任何一个的得益都相同,因此在这阶段随意选择一个都可以。倒退回第三阶段, 博弈方1选择AB中任何一个都可以。再推回第二阶段,博弈方2选择L将得到 3选择R得到2,因此选择L;最后回到第一阶段,博弈方1选择L得到2选择 R得到3,。所以该博弈的子博弈完美纳什均衡为:博弈方1第一阶段选择R, 博弈方2第二阶段选择L,即(3,1)是该博弈的完美纳什均衡。 四、两个寡头企业进行价格竞争博弈,企业1的利润函数是 q c aq p ++--=21)(π,企业2的利润函数是p b q +--=22)(π,其中p 是企业1 的价格,q 是企业2的价格。求: 1.两个企业同时决策的纯战略纳什均衡; 两个企业同时定价。根据两个企业的得益函数,很容易导出它们各自的反应 函数:απ1 /αp = -2(p-aq+c)=0 ____ p=aq-c απ2/αq = -2(q-b)=0 ______ q=b

完整word版,博弈论期末复习题

一、支付矩阵 1、试给出下述战略式表述博弈的纳什均衡 B A U D 解:由划线解得知有一个纯战略均衡(R D ,) 再看看它是否有混合战略均衡 设B 以)1,(γγ-玩混合战略,则有 均衡条件: γγγ-=-+?=2)1(21)(U V A γγγ26)1(64)(-=-+?=D V A γγ262-=- 得14>=γ,这是不可能的,故无混合战略均衡,只有这一个纯战 略均衡。 2、试将题一中的支付作一修改使其有混合战略均衡 解:由奇数定理,若使它先有两个纯战略均衡,则很可能就有另一个混合战略均衡。 B A U D 将博弈改成上述模型,则 )1(64)1(25γγγγ-+=-+ γγ2632-=+ 得 5 4 = γ 同样,设A 的混合战略为)1,(θθ-,则

)1(25)1(16θθθθ-+=-?+ θθ3251+=+ 2 1= θ 于是混合战略均衡为? ???????? ????? ??51,54,21,21。 二、逆向归纳法 1、用逆向归纳法的思路求解下述不完美信息博弈的子博弈精炼均衡 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 解 1 (5,8) (6,7) (2,0) (3,4) (1,2) (3,4) 设在1的第二个信息集上,1认为2选a 的概率为P , 则1选L '的支付P P P 32)1(25+=-+= 1选R '的支付P P P P 3233)1(36+>+=-+=

故1必选R '。 ? 给定1在第二个决策结上选R ',2在左边决策结上会选a ,故子博弈精炼均衡 为 {}),(,,d a R L ' 四、两个厂商生产相同产品在市场上进行竞争性销售。第1个厂商的成本函数为 11q c =,其中1q 为厂商1的产量。第2个厂商的成本函数为22cq c =,其中2q 为厂商 2的产量,c 为其常数边际成本。两个厂商的固定成本都为零。厂商2的边际成本c 是厂商2的“私人信息”,厂商1认为c 在?? ????2 3,21上呈均匀分布。设市场需求函数为 214q q P --=,其中P 为价格,两个厂商都以其产量为纯战略,问纯战略贝叶斯均 衡为何? 解:给定2q ,厂商1的问题是 1 211 1)14( )1(max 1 q q q q P q ---=-=π 因)(22c q q =。厂商1不知道c ,故目标函数为 ?? ????--=---??2 /3212 112 /31212112 11 )(3max )1)(4(max dc c q q q q dc q c q q q q 一阶条件: 0)(232 /3212 1 =- -? dc c q q 得 ?-=2 /3212 1)(2123dc c q q (1) 厂商2的问题是: 22 2122212 2)4( )4( )(max 2 q q q q c q c q q q c P q ---=---=-=π 一阶条件: 02)4(21=---q q c

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

博弈论基础复习

《博弈论基础》主要知识点 一、名词解释(5×2=10分) 策略型博弈它是由三个部分组成,即局中人、策略和各种策略组合中所得到的利益。 纳什均衡指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合。 混合策略局中人的混合策略是其纯策略空间上的一种概率分布,表示局中人实际博弈时根据这种概率分布在纯策略中随机选择加以实施。 扩展型博弈博弈存在着局中人行动的先后次序,是对具有动态结构的决策形式进行研究的规范分析工具。 博弈树对于任何一种双人完备博弈,都可以用一个博弈树来描述,并通过博弈树搜索策略寻找最佳解。博弈树类似于状态图和问题求解搜索中使用的搜索树。 完美信息博弈是指一次只有一个局中人在行动,而且他在行动时知道博弈的所有以往行动历史的一类特殊博弈。 子博弈指由原扩展型博弈中的一个决策节点与它的所有后续节点组成的博弈。行为策略是指每一个参与人在每一个信息集上随机的选择行动。 逆向归纳法逆向归纳法是求解子博弈精炼纳什均衡的最简便方法。在求解子博弈精炼纳什均衡时,从最后一个子博弈开始逆推上。 冷酷策略又称触发策略。指参与人在开始时选择合作,在接下来的博弈中,如果对方合作则继续合作,而如果对方一旦背叛,则永远选择背叛,永不合作。 类型 :一般地,将一个参与人所拥有的所有私人信息称为他的类型。 信号博弈是研究具有信息传递作用的信号机制的一般博弈模型,其基本特征是两个博弈方,分别称为信号发出方和信号接收方。 分离均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者以概率1选择不同的信号,接收者完全可以通过信号来准确判断出发送者的类型。 混同均衡信号博弈中的完美贝叶斯均衡之一,这种均衡中不同类型的发送者选择了相同的信号,接收者无法从信号中得到新的信息,无法对先验信念进行修正。 特征函数特征函数型博弈对每一种可能联盟给出相应的联盟总和收益,也就是给出了一种集合函数,称为特征函数。 联盟

博弈论考试试题

博弈论考试试题 你有三个小时考试时间。回答所有问题。考试内容比较多,我在认为最难的问题旁边标注了星号,如果你担心不够时间,可以把这些带星号的问题留到最后才做。 1.(55分钟—36分)简略回答下面每个子问题。请写出你的计算过程,并在你不能给出正式结论时,提供大概的解释,那样我可以给你部分分数。 (a)尽可能给出正式的说明,指出一个观察到的行为是无穷连续的多级博弈意味什么?给出一个不是无穷连续博弈的例子。 (b)尽可能给出正式的说明,指出一个一般性支持的性质意味着什么?在课上我们看到什么理论关于一般性支持的性质? (c)课堂上,在说明带有可观察行为的有限扩展型博弈和无限期多级博弈时,我不同地详细讲述了支付函数。支付函数范畴是如何不同?为什么我做出这个改变? (d)在扩展型博弈中给出一个策略的正式定义。 (e)给出一个博弈的例子,其中一个看起来不合理的结果在一个子博弈完美均衡里变成可能。(f)下面显示的扩展型博弈里,博弈者1有多少个纯策略?写出正常形式的支付矩阵。这个博弈有多少子博弈? (g)找出下面博弈中全部的纳什均衡。

(h )找出二阶段博弈的子博弈完美均衡,博弈者在成本a/16处选择a ,于是博弈者1和2同时行动进行博弈,如下面所示。 (i )找出同时行动博弈中的纳什均衡,其中博弈者1选择1a ∈?,博弈者2选择2a ∈?,支付是,

考虑如下的关于信任的博弈,这在很多试验中都做过。试验者从给博弈者1$10和给博弈者2$0开始。然后试验者问博弈者1愿意将多少美元给博弈者2来帮助他。如果他选择给x美元给试验者,则试验者给博弈者2 *3x。随后,博弈者2有机会将一些或全部(或没有)他获得的钱给博弈者1。 (a)假定这两个博弈者都是风险中性的,仅关心他们自己的支付,找出这个博弈的子博弈完美均衡。(顺便说明,子博弈完美均衡不像在试验中出现。通常博弈者1给出一些,但不会把全部的钱给回试验者) (b) 这个博弈有博弈者获得更高支付的纳什均衡吗? (c)假定我们修改了博弈,以致在上述的两阶段后,博弈者1有机会打博弈者2。假定这将减少博弈者1的效用1美元,减少博弈者2的效用5美元。这将改变你们在(a)和(b)中的答案吗?如果我们在第二阶段后有如下显示的博弈会怎么样呢?作个你认为合理的预测。 (d*)对这个试验结果的另一个解释是,博弈者可以是无私心的。说明无私心的最简单表达——每个博弈者最大化他自己的美元支付和其他博弈者美元支付的权重和——除了权重上一个特别(非强迫)的选择,不能解释试验规则性。你能想出可能被用来说明试验结果的效用函数吗?

博弈论的考试复习资料

一、简答题 2、什么是信号传递博弈?请举例说明。 信号传递博弈是一种比较简单但有广泛应用意义的不完全信息动态博弈。在这个博弈中,有两个参与人,i=1、2,参与人成为信号发送者,参与2称为信号接收者;参与人1的类型是私人信息,参与人2的类型是公共信息(即只有一个类型)。 举例:(1)“市场进入阻挠”是产业经济学中的一个典型例子。设想有一个垄断企业已在市场上(称为“在位者”)处于优势地位,另一个企业虎视眈眈谋求进入(称为“进入者”)。在位者若要保持自己的垄断优势,就会想方设法阻挠进入者进入。 动态博弈通常用博弈树表示,如下 图中,进入者先选择行动(进入或不进),在位者然后默许或斗争,最后的数字是支付水平。如进入者选择“进入”,在位者选择默许,支付水平分别为40和50。 用不完全信息动态博弈分析“市场进入”例子。在这个博弈中,在位者可能是低成本,也可能是高成本,进入者无法得知。假设在位者先行动———比如说定价。用P表示价格,那么,P 本身可能包含有关在位者成本函数的信息,因为不同成本函数下的最优价格是不一样的。假定存在一个价格P3,只有低成本企业才有利可图,而高成本企业是不敢模仿这个价格的。那么,精炼贝叶斯均衡是,低成本在位者选择P3,高成本企业选择一个较高的垄断价格;如果进入者观察到在位者选择了P3,就推断其为低成本,不进入;否则,就认为在位者是高成本,进入。这就说著名的“垄断限价模型”。

这里,在位者是信号发送者,进入者是信号接受者。当在位者选择价格时,他知道进入者将根据自己选择的价格判断自己是高成本还是低成本的概率;进入者确实是根据观测到的价格修正对在位者类型的判断,然后选择进入还是不进入。 3、“在动态博弈中,因为后行动的博弈方可以观测到先行动方的选择,因此,总是有利的。”此说法正确吗?为什么? 不正确,因为在博弈中存在着先动优势和后动优势,所以后行动的人不一定总有利,例如:在斯塔克伯格模型中,企业可能具有先动优势。 4、简述不完全信息静态博弈由哪些要素构成?

博弈论考题与答案

一、假设市场上有三个垄断企业,企业无生产成本,问达到纳什均衡时的产量为多少?假设市场的价格和数量之间P=a—b*Q 解: 二、什么是纳什均衡,你是如何理解纳什均衡的? 答:纳什均衡指的是这样一种战略组合,这种战略组合由所有参与人的最优战略组成,也就是说,给定别人战略的情况下,没有任何单个参与人有积极性选择其他战略使自己获得更大利益,从而没有任何人有积极性打破这种均衡。当然,“纳什均衡”虽然是由单个人的最优战略组成,但并不意味着是一个总体最优的结果。如上述,在个人理性与集体理性的冲突的情况下,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。 三、构建一个博弈,说明如何杜绝学生考试作弊现象(参考高薪养廉博弈) 答: 四、给出该博弈的纳什均衡,并用消除劣势战略法,找出 (R1,C3)这个纳什均衡。 C1 C2 C3 R1 2,12 1,10 1,12 R2 0,12 0,10 0,11 R3 0,12 0,10 0,13 五、两个老朋友在一起喝酒,每个人有四个纯战略:杠子、老虎、鸡和虫子,输赢规则是:杠子降鸡,鸡吃虫子,虫子降杠子,两人同时出令。如果一个打败另一个,赢的效用为1,输的效用为-1,否则效用为0,写出这个博弈的支付矩阵,计算其混合战略纳什均衡。 答:设S为棒子T为老虎C为鸡W为虫子,则其支付矩阵为: 2 S T C W S 0,0 1,-1 0,0 -1,1 1 T -1,1 0,0 1,-1 0,0 C 0,0 -1,1 0,0 1,-1 W 1,-1 0,0 -1,1 0,0 设1、2出STCW的概率分别为P1P2P3P4和Q1Q2Q3Q4,则矩阵达到均衡时,2的期望收益必须满足:0*p1—1*p2+0*p3+1*p4=1*p1+0*p2—1*p3+0*p4=0*p1+1*p2+0*p3—1*p4= —1*p1+0*p2+1*p3+0*p4 整理为—p2+p4=p1—p3= —p1+p3 由于上式为对称的,所以,p1=p2=p3=p4,又p1+p2+p3+p4=1,可得p1=p2=p3=p4=0.25. 同理q1=q2=q3=q4=0.25 综上所述,混合战略的纳什均衡为:A1(0.25,0.25,0.25,0.25)A2(0.25,0.25,0.25,0.25) 六、5个海盗抢到了100颗宝石,每一颗大小和价值都一样他们决定这么分:抽签决定自己的号码(1、2、3、4、5)。首先,1号提出分配方案。然后大家5人进行表决,当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳌鱼。如果1号死后,再由2号提出分配方案,然后大家4人进行表决,当且仅当超过半数的人同意时,按照他的提案进行分配,否则将被扔人大海喂鳖鱼。以次类推。假定每个个强盗都是经济学假设的“理性人”,假定每个判决都能顺利执行。那么,如果你是第一个强盗,你该如何提出分配方案才能够使自己的收益最大化? 七、假设选民政治态度是成线性均匀分布的,说明为什么两党政治具有欺骗性,如果是三党政治情况如何,为什么? 答:政党和政治家争取选民情况实际上就和杂货铺定位博弈一样。工党一定要打出劳工代言人的旗帜,所以他是站在左边的,左边是他的地盘。但是只有左边一半的选民,还不足以保证胜出。为了在竞选中获胜,他要想办法把中间的在两党之间摇摆的选民争取过来。最好的办法,就是使自己的竞选纲领向“右”的方向靠过去一点,就是在竞选中宣布也要照顾中产阶级的利益。移过去一点,地盘就可能大一点。同样,原来立党之本是在“右”边的保守党,在竞选的过程中,也要往左边靠,争取更多的选民。这样斗法的结果,在漫长的竞选过程中,虽然两党的漫骂不断升级,但是实际纲领却不断靠近,直到两个政党在中点紧挨在一起,才是稳定的纳什均衡。 这个政党纲领向中点移动的机制,也说明西方两党政治的欺骗性。竞选的时候,怎样有利于拉票就怎样讲,当选以后,可以忘得一干二净。在这个意义上,我们说不要以为哪个政党上台这些西方国家的态度就会改变,确实很有道理。政党政治,本来在理论上有促使政治家个人操守不可太放肆的优点。但是在西方国家,小学生都知道政治家说的话不可靠,无奈制度决定了,每次竞选,人们只能在那少数政治家之间作出他信非常有限的选择。 为什么第三个政党难成气候?这是因为,如果三个政党的位置不相同,不在同一个点上,那么他们都有向中点

博弈期末考试总结

博弈与决策答案 一、名词解释(每小题2分,共16分) 1、博弈 博弈是指一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠掌握的信息,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以施,并从中各自取得相应结果或收益的过程, 2、占优战略均衡 占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的优策略的基础上达到均衡. 3、重复博弈 重复博弈是指同一个博弈在相同的环境、规则下反复多次执行的博弈问题, 4、序列博弈 序列博弈是指对局者选择策略有时问先后的顺序,某些对局者可能率先采取行动.序列博也是一种动态博弈. 5、动态博弈 动态博弈是指在博弈中,参与人的行动有先后顺序且后行动者能够观察到先行动者所选择的行动. 6、占优战略均衡--占优战略均衡是指在博弈中,如果所有参与人都有占优策略存在,博弈将在所有参与人的占优策略的基础上达到均衡. 7、完全信息---完全信息是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息. 8、得益 得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的策略或行动的函数,这是每个参与人最关心的东西. 9,博弈论:博弈论就是系统的研究各种各样的博弈问题,寻求各博弈方合理选择策略的情况下博弈的解,并对这些解进行讨论分析的理论。 10,纳什战略均衡:纳什战略均衡指在均衡中,每个博弈参与人都确信,在给定其他参与人选择的策略的情况下,该参与人选择了最优策略以回应对手的策略。 11,静态博弈:静态博弈是指在博弈中,参与人同时选择或非同时选择但后行动者并不知道先行动者采取了什么具体行动。 二、、简答题(每小题6分,共24分) 1、占优战略均衡和纳什均衡的联系与区别如下: 1)每一个占优战略均衡都是纳什均衡,而每一个纳什均衡却未必是占优战略均衡; 2)用重复剔除严格劣战略方法,保留下的唯一的重复剔除的占优均衡,就是纳什均衡. 3)纳什均衡,不会被重复剔除严格劣战略方法剔除掉(但弱劣战略剔除,可能会剔除纳什衡): 4)经重复剔除严格劣战略之后,有不唯一的多个哉略组合保留,其中有的战略组合不一定纳什均衡.即重复剔除严格劣战略方法,无法确保将所有非纳什均衡战略剔除,没有被剔的战略组合不一定是纳什均衡. 5)没有占优战略均衡的博弈,不能用重复剔除严格劣战略方法求解的博弈,可以有纳什均衡2,博弈的构成要素有哪些?并对其进行说明。 2、博弈一般由以下几个要素组成,包括:参与人、行动、信息,策略、得益、结果、均衡等.

博弈论测试题

博弈论测试题十一 一、什么是子博弈精炼纳什均衡? 答:将纳什均衡中包含的不可置信的威胁策略剔除出去。它要求参与者的决策在任何时点上都是最优的。由于剔除了不可置信的威胁,在许多情况下,精炼纳什均衡也就缩小了纳什均衡的个数。只有当参与人的策略在每一个子博弈中都构成纳什均衡叫做精炼纳什均衡。或者说,组成精炼纳什均衡的策略必须在每一个子博弈中都是最优的。 二、参与人的理性问题对动态博弈分析的影响是否比静态博弈的影响更大?为什么? 答:正确,博弈论要求个体具有始终追求自身利益最大化的理性意识和理性能力的“自我” 个体理性,这是静态博弈的范畴。除此之外,还要求相关的参与者具有层次较高的“交互理性”,要求不同个体之间在理性和行为方面具有一种“默契”。即,人们的自身利益的最大化不仅取决于自己的选择,还取决于与之相关的其他人的选择与行为,那么为了实现自己的最大利益,个体的理性决策就必须考虑他人的理性选择与行为。作为博弈论的基础,交互理性是其基本的理性要求。博弈论还要求有关博弈的结构、各个博弈参与者的得益函数以及各个博弈参与者的理性等“知识”是所有博弈参与者之间的“共同知识”。也就是,每个博弈参与者不仅要首先明确自己和其他参与者所有可选的策略,还需知晓各种情况下自己最终的收益或其概率分布,并且每个博弈参与者都知道各个参与者掌握这些信息;更为重要的是,每个博弈参与者都知道所有参与者都是理性的,都知道其他博弈参与者知道所有参与者都是理性的,都知道其他博弈参与者知道其他博弈参与者知道所有博弈参与者都是理性的------。理性的共同知识假设是非合作博弈理论的一个非常重要和关键的假设,是实现交互理性和理性主义的纳什均衡的基本前提,这些,都是动态博弈的范畴。因此说,参与者理性问题对动态博弈的分析影响更大。 三、纳什均衡和精炼纳什均衡存在哪些问题? 答:纳什均衡存在的问题: (1)不是所有博弈都存在纳什均衡如纯策略就不存在混合策略则一定会存在纳什均衡,它是通过概率来计算纳什均衡,在这种均衡下,给定其他参与人的策略选择概率,每个参与人都可以为自己确定选择每一种策略的最优概率。 (2)在论及纳什均衡时,我们假设参与人是完全理性的,而且是假定参与人之间不允许达成任何协议的非合作博弈的均衡解。而现实并非如此。 精炼纳什均衡存在的问题:有限重复博弈的子博弈精炼纳什均衡有如下定理∶令G是阶段博弈,G(T)是重复T次的重复博弈。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一子博弈精炼纳什均衡结果是阶段博弈G的纳什均衡重复T次。这个定理成立的条件是单阶段纳什均衡的“唯一性” ,若纳什均衡不是唯一的,上述定理的结论就不一定成立。 四、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发? 答:有限次重复博弈与无限次重复博弈都属于动态博弈,对于有限次博弈,收益是每次收益的简单相加,可以采取子博弈纳什均衡的方法求解,即逆推法;但无限次博弈却不能采取;此外,有限次博弈中博弈的双方都还是关注的是自己短期的利益,而无限次博弈中博弈的双方可能针对某项事情达成协议,达到共谋,为共同的利益而选择自己的行动,达到整体的最优,供应链契约即类似。 五、有限次重复博弈的精炼纳什均衡的最后一次重复必定是第一阶段博弈的一个纳什均衡?答:

博弈论试题及答案

诚信考试沉着应考杜绝违纪 《博弈论》试卷 课堂周四(7/8) 院系专业万方电气系通信工程 学号 余数 0 姓名

河南理工大学2010–2011学年第1学期 《博弈论》课程期末考试试卷 开课学院:经济管理学院,考试形式:开卷,允许带___________入场 考试时间:2010年12月25日-12月25日, 所需时间:周 考生姓名:学号:专业: 题序一二三四五六七八总分得分 评卷人 1、第一题:(10分) (1)举一个你所经历情侣博弈的情形,在实际博弈中你采取什么行动让自己收益最大; 答:作为一个男生,我想很多机会都是把握在自己手中的,情侣博弈有二个“纳什均衡”,一次博弈的结局究竟落到哪一个“纳什均衡”,关键就是要看遇事时自己如何去选择了。 例如:周末和女朋友去逛商场,应该客观地按照需求去采购,在了解女朋友的爱好的前提下,想办法引导她去看性价比最高的商品,并给予一定建议。遇到她特别喜欢的衣服或饰物,只要价格合理,又能满足生活需要,在对方征求意见时应该支持购买并给予肯定答复;当遇到不合理的购买选择时,应简明扼要地说出其不适之处,并建议对方到其它她喜欢的物品处,挑选令其满意的商品。购物中间一旦遇到对方生气或者发火,可以宽容地对待对方,以显示出自己的城府,若对方为无理取闹,应该坦诚地向对方说明情况,让对方明白自己在为她考虑,说明都说清楚了事情也就简化了。另外,在购物结束前,可以给女朋友买些她喜欢的零食,或者一起去对方喜欢的餐饮店,休息的同时也可调节一下情调,让双方都能够感觉到两个人在一起的幸福与甜蜜。 总结一下,在这场情侣博弈中,要想让自己获得最大收益,必须努力做到认真、善意、宽容、强硬、简单明了各种措施相结合。 2、第二题:(20分) 请举例说明下列说法是否正确,构造博弈模型具体说明,阐述原因。 (1)判断分析“先下手为强” 答:“先下手为强”并不满足所有的情形。 博弈中,在有多个"纳什均衡"的情况下,常常是先动手的一方会占一些优势,这和课例中“囚徒困境”情形类似,有一个最佳策略,古代的很多例子也证明了此点,如:诸葛亮先下手为强,占据荆州要势;日本先下手为强,偷袭美国的珍珠港,不然就不会有第二次世界大战;三国曹操先下手为强,迎接汉献帝,后挟天子以令诸侯等。要指出的是,“动态博弈”中也是有很多后动优势的情形,一般是在方案已经制定,自身实力比较弱,需要选择决策的时候,主动放弃先发权利,变先动劣势为后动优势。如:三人参加选举,支持率分别为15%,35%,50%,这个时候,如果15%者先采取行动,可能会立刻被强敌灭掉,所以他必须保存实力,保持低调,不介入强者的争斗,由另两位先动手,争取灭掉一方后均分失败者的支持率,虽然这样扔处于劣势,但比最初情况要好很多。所以,在面对选择

博弈论第三章习题

问题1:如果开金矿博弈中第三阶段乙选择打官司后的结果尚不能肯定,即下图中a 、b 数值不确定。试讨论本博弈有哪几种可能的结果。如果本博弈中的“威胁”和“承诺”是可信的,a 或b 应满足什么条件? ①0a <,不借—不分—不打; ②01a <<,且2b >,借—不分—打; ③1a >,且2b >,借—不分—打(,)a b ; ④0a >,且2b <,借—分—(2,2) 问题2:三寡头市场需求函数Q P -=100,其中Q 是三个厂商的产量之和,并且已知三个厂商都有常数边际成本2而无固定成本。如果厂商1和厂商2同时决定产量,厂商3根据厂商1和厂商2的产量决策,问它们各自的产量和利润是多少? 1123111231(100)2(98)q q q q q q q q q π=----=--- 2123221232(100)2(98)q q q q q q q q q π=----=--- 3123331233(100)2(98)q q q q q q q q q π=----=--- 331230,(98)/2q q q q π?=?=--? 代入,11212122(98)/2,(98)/2q q q q q q ππ=--=-- (a ,b ) (0,4)

1212 0,0q q ππ??==??,得***12398/3,49/3q q q ===

***1234802/9,2401/9πππ===。 问题3:设两个博弈方之间的三阶段动态博弈如下图所示。 (1)若a 和b 分别等于100和150,该博弈的子博弈完美纳什均衡是什么? (2)T N L --是否可能成为该博弈的子博弈完美纳什均衡路径,为什么? (3)在什么情况下博弈方2会获得300单位或更高的得益? (1)博弈方1在第一阶段选择R ,在第三阶段选择S ,博弈方2在第二阶段选择M 。 (2)不可能。T N L --带来的利益50明显小于博弈方1在第一阶段R 的得益300;无论a 和b 是什么数值,该路径都不能构成Nash 均衡,不能成为子博弈完美Nash 均衡。 (3)由于T N L --不是本博弈的子博弈完美Nash 均衡,因此博弈方2不可能通过该路径实现300单位的得益,唯一有可能实现300单位及以上的得益的路径为L N S --,要使该路径成为子博弈完美Nash 均衡而且博弈方2得到300单位及以上的得益必须300,300a b >≥。 问题4:企业甲和企业乙都是彩电制造商,都可以选择生产低档产品或高档产品,每个企业在四种不同的情况下的利润如以下得益矩阵所示。如果企业甲先于企业乙进行产品 (a ,b ) 50,300

博弈论复习讨论题

1、人与人之间的博弈是什么关系? 既可以是竞争关系,也可以是合作关系 2、因为博弈论的研究而获得1994年诺贝尔经济学奖的是 泽尔腾、海萨尼、纳什 3、学习博弈论的目的只是为了在今后与他人的博弈中能够打败对手(×) 4、博弈是指在一定的游戏规则约束下,基于(直接)相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 5、如果博弈前的损益总和与博弈后的损益总和相等,该博弈称为零和博弈 6、策略具有以下特性:完整性、不可观察性、多样性 7、人在博弈中并不是完全理性的(√) 8、博弈论的建立基于两大假设,其中除了人的理性以外,还有一个是(人的认知) 9、囚犯困境的根本原因在于个人行为的负外部性(私人成本与社会成本的差异) 10、在囚犯困境的博弈中,事先订立攻守同盟一定是有用的(×) 11、(占优)策略是指无论其他参与者采取什么策略,某参与者采用该策略的结果都优于或不劣于其他策略。 12、以下现象哪些明显属于“囚犯困境”?价格战、公地悲剧、环境污染 13、“好货不便宜、便宜没好货”其实是一个“智猪博弈”,这是因为不懂行的人占了懂行的人的便宜 14、之所以会出现“万元陷阱”,是因为:不懂得止损、沉没成本 15、智猪博弈是一个搭便车的博弈。一方付出了相应的代价,双方共享了所得到的收益。(√) 16、人在“亏损”的情况下,会从一个风险(厌恶)者变成了风险偏好者。 17、以下哪些博弈不属于竞争关系?同学聚会 18、哪些行业是赢者通吃的?演艺界、搜索引擎、门户网站 19、杭州试行的“谦让牌”之所以没效果,是因为宣传力度不够(×) 20、汇合点(Meeting point)必须是(共同)知识才有用 21、以下是某教授和学生张三之间的策略表达式:教授选择放过该学生的概率是多少?50% 22、以下是某教授和学生张三之间的策略表达式:张三选择平时勤快的概率是多少?20% 23、纯策略是指如果一个策略要求参与者在每一个给定信息情况下只选择一种特定的行动(√)

博弈论 课后习题答案

博弈论课后习题答案 第四部分课后习题答案 1. 参考答案: 括号中的第一个数字代表乙的得益,第二个数字代表甲的得益,所以a表示乙 的得益,而b表示甲的得益。 在第三阶段,如果,则乙会选择不打官司。这时逆推回第二阶段,甲会选择 a,0 不分,因为分的得益2小于不分的得益4。再逆推回第一阶段,乙肯定会选择 不借,因为借的最终得益0比不借的最终得益1小。 在第三阶段,如果,则乙轮到选择的时候会选择打官司,此时双方得益是 (a,b)。a,0 逆推回第二阶段,如果,则甲在第二阶段仍然选择不分,这时双方得益为 (a,b)。b,2 在这种情况下再逆推回第一阶段,那么当时乙会选择不借,双方得益(1,0), 当a,1 时乙肯定会选择借,最后双方得益为(a,b)。在第二阶段如果,则甲会选择 a,1b,2分,此时双方得益为(2,2)。再逆推回第一阶段,乙肯定会选择借,因为 借的得益2大于不借的得益1,最后双方的得益(2,2)。 根据上述分析我们可以看出,该博弈比较明确可以预测的结果有这样几种情况: (1),此时本博弈的结果是乙在第一阶段不愿意借给对方,结束博弈,双方a,0 得益 (1,0),不管这时候b的值是多少;(2),此时博弈的结果仍然012,,,ab且

是乙在第一阶段选择不借,结束博弈,双方得益(1,0);(3),此时博ab,,12 且弈的结果是乙在第一阶段选择借,甲在第二阶段选择不分,乙在第三阶段选择打,最后结果是双方得益 (a,b);(4),此时乙在第一阶段会选择借,甲在第二阶段会选择分,ab,,02且双方得益(2,2)。 要本博弈的“威胁”,即“打”是可信的,条件是。要本博弈的“承诺”,即a,0 “分”是可信的,条件是且。 a,0b,2 注意上面的讨论中没有考虑a=0、a=1、b=2的几种情况,因为这些时候博弈方的选择很难用理论方法确定和预测。不过最终的结果并不会超出上面给出的范围。 2. 参考答案: 静态贝叶斯博弈中博弈方的一个策略是他们针对自己各种可能的类型如何作相应的完整计划。或者换句话说,静态贝叶斯博弈中博弈方的策略就是类型空间到行为空间的一个函数,可以是线性函数,也可以是非线性函数,当博弈方的类型只有有限几种时是离散函数,当博弈方的类型空间是连续区间或空间时则是连续函数。只有一种类型的博弈方的策略仍然是一种行为选择,但我们同样可以认为是其类型的函数。 静态贝叶斯博弈中博弈方的策略之所以必须是针对自己所有可能类型的函数,原因是博弈方相互会认为其他博弈方可能属于每种类型,因此会考虑其他博弈方所有可能类型下的行为选择,并以此作为自己行为选择的根据。因此各个博弈方必须设定自己在所有各种可能类型下的最优行为,而不仅仅只考虑针对真实类型的行为选择。 3. 参考答案:

“博弈论”习题及参考答案

《博弈论》习题 一、单项选择题 1.博弈论中,局中人从一个博弈中得到的结果常被称为()。 A. 效用 B. 支付 C. 决策 D. 利润 2.博弈中通常包括下面的内容,除了()。 A.局中人 B.占优战略均衡 C.策略 D.支付 3.在具有占优战略均衡的囚徒困境博弈中()。 A.只有一个囚徒会坦白 B.两个囚徒都没有坦白 C.两个囚徒都会坦白 D.任何坦白都被法庭否决了 4.在多次重复的双头博弈中,每一个博弈者努力()。 A.使行业的总利润达到最大 B.使另一个博弈者的利润最小 C.使其市场份额最大 D.使其利润最大 5.一个博弈中,直接决定局中人支付的因素是()。 A. 策略组合 B. 策略 C. 信息 D. 行动 6.对博弈中的每一个博弈者而言,无论对手作何选择,其总是拥有惟一最佳行为,此时 的博弈具有()。 A.囚徒困境式的均衡 B.一报还一报的均衡 C.占优策略均衡 D.激发战略均衡 7.如果另一个博弈者在前一期合作,博弈者就在现期合作;但如果另一个博弈者在前一期违约,博弈者在现期也违约的策略称为()。 A.一报还一报的策略 B.激发策略 C.双头策略 D.主导企业策略 8.在囚徒困境的博弈中,合作策略会导致()。 A.博弈双方都获胜 B.博弈双方都失败

C.使得先采取行动者获胜 D.使得后采取行动者获胜 9.在什么时候,囚徒困境式博弈均衡最可能实现()。 A. 当一个垄断竞争行业是由一个主导企业控制时 B.当一个寡头行业面对的是重复博弈时 C.当一个垄断行业被迫重复地与一个寡头行业博弈时 D. 当一个寡头行业进行一次博弈时 10.一个企业采取的行为与另一个企业在前一阶段采取的行为一致,这种策略是一种()。 A.主导策略 B.激发策略 C.一报还一报策略 D.主导策略 11.关于策略式博弈,正确的说法是()。 A. 策略式博弈无法刻划动态博弈 B. 策略式博弈无法表明行动顺序 C. 策略式博弈更容易求解 D. 策略式博弈就是一个支付矩阵 12.下列关于策略的叙述哪个是错误的(): A. 策略是局中人选择的一套行动计划; B. 参与博弈的每一个局中人都有若干个策略; C. 一个局中人在原博弈中的策略和在子博弈中的策略是相同的; D. 策略与行动是两个不同的概念,策略是行动的规则,而不是行动本身。 13. 囚徒困境说明(): A. 双方都独立依照自己的利益行事,则双方不能得到最好的结果; B. 如果没有某种约束,局中人也可在(抵赖,抵赖)的基础上达到均衡; C. 双方都依照自己的利益行事,结果一方赢,一方输; D、每个局中人在做决策时,不需考虑对手的反应 14. 一个博弈中,直接决定局中人损益的因素是(): A. 策略组合 B. 策略 C. 信息 D. 行动 15. 动态博弈参与者在关于博弈过程的信息方面是() A 不对称的 B 对称的 C 不确定的 D 无序的

相关文档