文档库 最新最全的文档下载
当前位置:文档库 › 第七章 对策论

第七章 对策论

第七章 对策论
第七章 对策论

第七章 对策论

§1 引言

社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来解决这样的问题开始于17世纪的科学家,如C.,Huygens 和W.,Leibnitz 等。现代对策论起源于1944年J.,V on Neumann 和O.,Morgenstern 的著作《Theory of Games and Economic Behavior 》。

对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。

在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。

§2 对策问题

对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。

先考察一个实际例子。

例1 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方面将被判刑7年。将嫌疑犯A 、B 被判刑的几种可能情况列表如下:

嫌疑犯B

供认 不供认 嫌疑犯A 供认 (3,3) (0,7) 不供认 (7,0) (1.5,1.5)

表中每对数字表示嫌疑犯B A 、被判刑的年数。如果两名疑犯均担心对方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。

从这一简单实例中可以看出对策现象中包含有的几个基本要素。

2.1 对策的基本要素 (i )局中人

在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。通常用I 表示局中人的集合.如果有n 个局中人,则},,2,1{n I =。一般要求一个对策中至少要有两个局中人。在例1中,局中人是B A 、两名疑犯。

(ii )策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人i ,I i ∈,都有自己的策略集i S 。一般,每一局中人的策略集中至少应包括两个策略。

(iii )赢得函数(支付函数)

在一局对策中,各局中人所选定的策略形成的策略组称为一个局势,即若i s 是第i 个局中人的一个策略,则n 个局中人的策略组

),,,(21n s s s s =

就是一个局势。全体局势的集合S 可用各局中人策略集的笛卡尔积表示,即

n S S S S ???= 21

当局势出现后,对策的结果也就确定了。也就是说,对任一局势,S s ∈,局中人i 可以得到一个赢得)(s H i 。显然,)(s H i 是局势s 的函数,称之为第i 个局中人的赢得函数。这样,就得到一个向量赢得函数))(,),(()(1s H s H s H n =。

本节我们只讨论有两名局中人的对策问题,其结果可以推广到一般的对策模型中去。

2.2 零和对策(矩阵对策)

零和对策是一类特殊的对策问题。在这类对策中,只有两名局中人,每个局中人都只有有限个策略可供选择。在任一纯局势下,两个局中人的赢得之和总是等于零,即双方的利益是激烈对抗的。

设局中人Ⅰ、Ⅱ的策略集分别为

},,{11m S αα =,},,{12n S ββ = 当局中人Ⅰ选定策略i α和局中人Ⅱ选定策略j β后,就形成了一个局势),(j i βα,可见这样的局势共有mn 个。对任一局势),(j i βα,记局中人Ⅰ的赢得值为ij a ,并称

?

?

??

?

???????=mn m m n n a a a a a a a a a A 2

1

22221

11211

为局中人Ⅰ的赢得矩阵(或为局中人Ⅱ的支付矩阵)。由于假定对策为零和的,故局中人Ⅱ的赢得矩阵就是A -。

当局中人Ⅰ、Ⅱ和策略集1S 、2S 及局中人Ⅰ的赢得矩阵A 确定后,一个零和对策就给定了,零和对策又可称为矩阵对策并可简记成

};,{21A S S G =。

例 2 设有一矩阵对策};,{21A S S G =,其中},,{3211ααα=S ,

},,,{43212ββββ=S ,

????

??????----=16100610182142230612A

从A 中可以看出,若局中人Ⅰ希望获得最大赢利30,需采取策略1α,但此时若局中人Ⅱ采取策略4β,局中人Ⅰ非但得不到30,反而会失去22。为了稳妥,双方都应考

虑到对方有使自己损失最大的动机,在最坏的可能中争取最好的结果,局中人Ⅰ采取策略321ααα、、时,最坏的赢得结果分别为

22}22,30,6,12min{-=--

2}10,18,2,14min{= 10}16,10,0,6min{-=--

其中最好的可能为2}10,2,22max{

=--。如果局中人Ⅰ采取策略2α,无论局中人Ⅱ采取什么策略,局中人Ⅰ的赢得均不会少于2。

局中人Ⅱ采取各方案的最大损失为14}6,14,12max{=-,2}0,2,6max{=-,

30}10,18,30max{=-,和16}16,10,22max{=-。当局中人Ⅱ采取策略2β时,其损

失不会超过2。注意到在赢得矩阵中,2既是所在行中的最小元素又是所在列中的最大元素。此时,只要对方不改变策略,任一局中人都不可能通过变换策略来增大赢得或减少损失,称这样的局势为对策的一个稳定点或稳定解。

定义1 设),(y x f 为一个定义在A x ∈及B y ∈上的实值函数,如果存在A x ∈*,

B y ∈*,使得对一切A x ∈和B y ∈,有

)*,(*)*,(*),(y x f y x f y x f ≤≤

则称*)*,(y x 为函数f 的一个鞍点。

定义 2 设};,{21A S S G =为矩阵对策,其中},,,{211m S ααα =,

},,,{212n S βββ =,n m ij a A ?=)(。若等式

**m a x m i n m i n m a x j i ij i

j

ij j

i

a a a == (1)

成立,记**j i G a V =,则称G V 为对策G 的值,称使(1)式成立的纯局势),(**j i βα为对策G 的鞍点或稳定解,赢得矩阵中与),(**j i βα相对应的元素**j i a 称为赢得矩阵的鞍点,*i α与*j β分别称为局中人Ⅰ与Ⅱ的最优纯策略。

给定一个对策G ,如何判断它是否具有鞍点呢?为了回答这一问题,先引入下面

的极大极小原理。

定理 1 设},,{21A S S G =,记ij j

i

a min max =μ,ij i

j

a max min -=ν,则必有

0≤+νμ。

证明 )(m i n m a x

ij i

j

a -=ν,易见μ为Ⅰ的最小赢得,ν为Ⅱ的最小赢得,由于G 是零和对策,故0≤+νμ必成立。

定理2 零和对策G 具有稳定解的充要条件为0=+νμ。

证明:(充分性)由μ和ν的定义可知,存在一行(例如p 行)μ为p 行中的最小元素且存在一列(例如q 列)ν-为q 列中的最大元素。故有

μ≥pq a 且ν-≤pq a

又因0=+νμ,所以νμ-=,从而得出μ=pq a ,pq a 为赢得矩阵的鞍点,),(q p βα为G 的稳定解。

(必要性)若G 具有稳定解),(q p βα,则pq a 为赢得矩阵的鞍点。故有

pq pj j

ij j

i

a a a =≥=min min max μ

pq iq i

ij i

j

a a a =≤=-max max min ν

从而可得0≥+νμ,但根据定理1,0≤+νμ必成立,故必有0=+νμ。

上述定理给出了对策问题有稳定解(简称为解)的充要条件。当对策问题有解时,其解可以不唯一,当解不唯一时,解之间的关系具有下面两条性质:

性质 1 无差别性。即若),(11j i βα与),(22j i βα是对策G 的两个解,则必有

2211j i j i a a =

性质2 可交换性。即若),(11j i βα和),(22j i βα是对策G 的两个解,则),(21j i βα和

),(12j i βα也是解。

§3 零和对策的混合策略

具有稳定解的零和问题是一类特别简单的对策问题,它所对应的赢得矩阵存在鞍点,任一局中人都不可能通过自己单方面的努力来改进结果。然而,在实际遇到的零和对策中更典型的是0≠+νμ的情况。由于赢得矩阵中不存在鞍点,此时在只使用纯策略的范围内,对策问题无解。下面我们引进零和对策的混合策略。

设局中人Ⅰ用概率i x 选用策略i α,局中人Ⅱ用概率j y 选用策略j β,

∑∑====m i n

j j

i y

x 1

1

1,记T m x x X ),,(1 =,T n y y Y ),,(1 =,则局中人Ⅰ的期望赢得

为AY X Y X E T

=),(。

*1S :策略 m αα,,1 *

2

S :策略 n ββ,,1 概率 m x x ,,1 概率 n y y ,,1 分别称*1S 与*

2S 为局中人Ⅰ和Ⅱ的混合策略。

定义4 若存在m 维概率向量X 和n 维概率向量Y ,使得对一切m 维概率向量X 和n 维概率向量Y 有

AY X Y A X Y A X T Y

T X

T min max ==

则称),(Y X 为混合策略对策问题的鞍点。

定理3 任意混合策略对策问题必存在鞍点,即必存在概率向量X 和Y ,使得:

AY X AY X Y A X T X

Y

T Y

X

T max min min max ==。

使用纯策略的对策问题(具有稳定解的对策问题)可以看成使用混合策略的对策问题的特殊情况,相当于以概率1选取其中某一策略,以概率0选取其余策略。

例3 B A 、为作战双方,A 方拟派两架轰炸机Ⅰ和Ⅱ去轰炸B 方的指挥部,轰炸机Ⅰ在前面飞行,Ⅱ随后。两架轰炸机中只有一架带有炸弹,而另一架仅为护航。轰炸机飞至B 方上空,受到B 方战斗机的阻击。若战斗机阻击后面的轰炸机Ⅱ,它仅受Ⅱ的射击,被击中的概率为0.3(Ⅰ来不及返回攻击它)。若战斗机阻击Ⅰ,它将同时受到两架轰炸机的射击,被击中的概率为0.7。一旦战斗机未被击落,它将以0.6的概率击毁其选中的轰炸机。请为B A 、双方各选择一个最优策略,即:对于A 方应选择哪一架轰炸机装载炸弹?对于B 方战斗机应阻击哪一架轰炸机?

解 双方可选择的策略集分别是

},{21αα=A S ,1α:轰炸机Ⅰ装炸弹,Ⅱ护航

2α:轰炸机Ⅱ装炸弹,Ⅰ护航

},{21ββ=B S ,1β:阻击轰炸机Ⅰ

2β:阻击轰炸机Ⅱ

赢得矩阵22)(?=ij a R ,ij a 为A 方采取策略i α而B 方采取策略j β时,轰炸机轰炸

B 方指挥部的概率,由题意可计算出:

82.0)6.01(3.07.011=-+=a 112=a ,121=a

58.0)6.01(7.03.022=-+=a

??

?

?

??=58.01182.0R

易求得82.0min max ==ij j

i

a μ,1max min -=-=ij i

j

a ν。由于0≠+νμ,矩阵

R 不存在鞍点,应当求最佳混合策略。

现设A 以概率1x 取策略1α、概率2x 取策略2α;B 以概率1y 取策略1β、概率2y 取策略2β。

先从B 方来考虑问题。B 采用1β时,A 方轰炸机攻击指挥部的概率期望值为

21182.0)(x x E +=β,而B 采用2β时,A 方轰炸机攻击指挥部的概率的期望值为21258.0)(x x E +=β。若)()(21ββE E ≠,不妨设)()(21ββE E <,则B 方必采用1β以减少指挥部被轰炸的概率。故对A 方选取的最佳概率1x 和2x ,必满足:

??

?=++=+158.082.02

12

121x x x x x x 即

??

?=++=+12

12

22112221111x x x a x a x a x a 由此解得7.01=x ,3.02=x 。

同样,可从A 方考虑问题,得

??

?=++=+1

58.082.0212

121y y y y y y 即

??

?=++=+1

212

22121212111y y y a y a y a y a 并解得7.01=y ,3.02=y 。B 方指挥部被轰炸的概率的期望值874.0=G V 。 记零和对策G 的解集为)(G T ,下面三个定理是关于对策解集性质的主要结果: 定理4 设有两个零和对策

};,{1211A S S G =,};,{2212A S S G =

其中}{1ij a A =,}{2L a A ij +=,L 为任一常数。则

(i )L V V G G +=12 (ii ))()(21G T G T = 定理5 设有两个零和对策

};,{211A S S G =,};,{212A S S G α=

其中0>α为任一常数。则

(i )12G G V V α= (ii ))()(21G T G T =

定理6 设};,{21A S S G =为一零和对策,且T

A A -=为斜对称矩阵。则 (i )0=G V (ii ))()(21G T G T =

其中)(1G T 和)(2G T 为局中人Ⅰ和Ⅱ的最优策略集。

§4 零和对策的线性规划解法

当2>m 且2>n 时,通常采用线性规划方法求解零和对策问题。 局中人Ⅰ选择混合策略X 的目的是使得

j

n

j j Y

X

n

j j j T

Y

X

T

Y

X

y E e y A X AY X Y A X ∑∑=====1

1

min max )

(min max min max

其中j e 为只有第j 个分量为1而其余分量均为零的单位向量,j T j Ae X E =。记

j j

k E E u min =≡,由于∑==n j j y 1

1,∑=n

j j j Y

y E 1

min 在1=k y ,)(0k j y j ≠=时达到最

小值u ,故X 应为线性规划问题

?

????????=≥=≥=≥∑∑==m

i x x E E n j u x a u i m

i i

m

i k j i ij ,,2,1,01

)(,,2,1,s.t.max 11

即 (2) 的解。

同理,Y 应为线性规划

??????

?????=≥==≤∑∑==n

j y y m i v y a v j n

j j n

j j ij ,,2,1,01,,2,1,s.t.min 11 (3) 的解。由线性规划知识,(2)与(3)互为对偶线性规划,它们具有相同的最优目标函

数值。

不妨设0>u ,作变换

u

x x i

i =

',m i ,,2,1 = 则线性规划问题(2)化为:

???

?

?

?

???

=≥=≥∑∑==m i x n j x a x i m

i i ij m

i i

,,2,1,0',,2,1,1's.t.'min 11

同理,作变换

v

y y j j =

',n j ,,2,1 =

则线性规划问题(3)化为:

???

?

?

?

???

=≥=≤∑∑==n j y m i y a y j n

j j ij m

i i

,,2,1,0',,2,1,1's.t.'max 11

例4 在一场敌对的军事行动中,甲方拥有三种进攻性武器321,,A A A ,可分别用于摧毁乙方工事;而乙方有三种防御性武器321,,B B B 来对付甲方。据平时演习得到的数据,各种武器间对抗时,相互取胜的可能如下:

1A 对1B 2:1; 1A 对2B 3:1; 1A 对3B 1:2; 2A 对1B 3:7; 2A 对2B 3:2; 2A 对3B 1:3;

3A 对1B 3:1; 3A 对2B 1:4; 3A 对3B 2:1

解 先分别列出甲、乙双方的赢得的可能性矩阵,将甲方矩阵减去乙方矩阵的对应元素,得零和对策时甲方的赢得矩阵如下:

????

??????----=3/15/32/12/15/15/23/12/13

/1A

编写程序如下:

clear

a=[1/3,1/2,-1/3;-2/5,1/5,-1/2;1/2,-3/5,1/3];b=10; a=a+b*ones(3); %把赢得矩阵的每个元素变成大于0的数 [x0,u]=linprog(ones(3,1),-a',-ones(3,1),... [],[],zeros(3,1)); x=x0/u,v1=1/u-b

[y0,v]=linprog(-ones(3,1),a,ones(3,1),[],[],zeros(3,1)); y=y0/abs(v),v2=1/v+b

解得0.4717) 5283,0,.0(*=X ,0.6226) 0.3774, 0,(*=Y ,0189.0-=v ,故乙方有利。

习 题 七

1. 有甲、乙两支游泳队举行包括三个项目的对抗赛。这两支游泳队各有一名健将级运动员(甲队为李,乙队为王),在三个项目中成绩都很突出,但规则准许他们每人只能参加两项比赛,每队的其他两名运动员可参加全部三项比赛。已知各运动员平时成

假定各运动员在比赛中都发挥正常水平,又比赛第一名得5分,第二名得3分,第三名得1分,问教练员应决定让自己队健将参加哪两项比赛,使本队得分最多?(各队参加比赛名单互相保密,定下来后不准变动)

2. 有三张纸牌,点数分别为1,2,3,显然按大小顺序为123>>。先由A 任抽一张,看过后反放在桌上,并任喊大(H )或小(L )。然后由B 从剩下纸牌中任抽一张,看过后,B 有两种选择:第一,弃权,付给A 1元;第二,翻A 的牌,当A 喊H 时,得点数小的牌者付给对方3元,当A 喊L 时,得点数大的牌者付给对方2元。要求:(i )说明B A ,各有多少个纯策略;(ii )根据优超原则淘汰具有劣势的策略,并列出对A 的赢得矩阵;(iii )求解双方各自的最优策略和对策值。

博弈论第七章习题

第七章习题 一、判断下列表述是否正确,并作简单分析 (1)海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。 答:错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。 (2)完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。 答:正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。 (3)证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。 答:正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象,标的不是一件而是有许多件。 (4)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型,都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。

答:错误。不是因为能够迷惑其他博弈方,而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略,从而也就无法找出自己的最优策略。其实,在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选择,其他博弈方也会替他考虑。因为设定自己所有类型下的行为,实际上是要弄清楚其他博弈方对自己策略的判断。 (5)“鼓励—响应”的直接机制能保证博弈方都按他们的真实类型行为并获得理想的结果。 答:错误。“鼓励—响应”机制也就是说真话的直接机制,实际上只保证博弈方揭示,也就是说出自己的真实类型。 博弈方不直接选择行为,也不保证根据真实类型行为,更谈不上一定能实现最理想的结果。因为直接机制的结果常常是带有随机选择机制的,并不一定理想。实际上对所有博弈方都理想的结果在静态贝叶斯博弈中本身不一定存在。 二、双寡头古诺模型,倒转的需求函数为 ()P Q a Q =-, 其中12Q q q =+为市场总需求,但a 有h a 和l a 两种可能的情况,并且厂商1知道a 究竟是h a 还是l a , 而厂商2只知道h a a =的概率是θ, l a a =的概率是1θ-,这种信息不对称情况双方都是了解的。双方的总成本仍然是i i i c q cq =。如果两厂商同时选择产量,问双方的策略空间是什么?本博弈的贝叶斯纳什均衡是什么? 解:设厂商1已知h a a =时的产量为11()h q a q =,已知l a a =时的产量是11()l q a q =;再假设厂商2的产量是 2q ,这两个函数关系就是两个厂商的策略空间。 11211()h h h h h a q q q cq π=---

(数学建模教材)7第七章对策论

第七章 对策论 §1 引言 社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来 解决这样的问题开始于 17 世纪的科学家,如 C.,Huygens 和 W.,Leibnitz 等。现代对 策论起源于 1944 年 J.,V on Neumann 和 O.,Morgenstern 的著作《Theory of Games and Economic Behavior 》。 对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。 一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展 的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常 生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。 在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对 抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目 标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并 力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否 存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。 §2 对策问题 对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的 努力而是各方所采取的策略的综合结果。 先考察一个实际例子。 例 1(囚徒的困境) 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大 量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个 人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑 18 个月;如果双 方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从 宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯 A 、 B 被判刑的几种可能情况列 于表 1。 表 1 表 1 中每对数字表示嫌疑犯 A 、B 被判刑的年数。如果两名疑犯均担心对方供认并希 望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。 从这一简单实例中可以看出对策现象中包含有的几个基本要素。 2.1 对策的基本要素 (i )局中人 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局 中人。通常用 I 表示局中人的集合.如果有 n 个局中人,则 I = {1,2,L , n }。一般要求 一个对策中至少要有两个局中人。在例 1 中,局中人是 A 、B 两名疑犯。 (ii )策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参 加对策的每一局中人 i , i ∈ I ,都有自己的策略集 S i 。一般,每一局中人的策略集中 至少应包括两个策略。 -154- 嫌疑犯 B 供认 不供认 嫌疑犯 A 供认 不供认 (3,3) (0,7) (7,0) (1.5,1.5)

博弈论谢识予第四五章参考标准答案

博弈论谢识予第四五章参考答案

————————————————————————————————作者:————————————————————————————————日期: 2

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。 如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

博弈论谢识予第四五章参考答案

第四章参考答案 2、火车站和机场餐饮商业服务的顾客往往都是一次性的,回头客、常客比较少,这些经济交易具有一次性博弈的特征,它们的价格总是较高而质量又会差一些,顾客也会尽量不在这些地方购买商品和消费。在一般商业区和居民区的餐饮商业服务则回头客和常客较多,有明显的重复博弈特征,在居民区购买商品和消费的老顾客一般能得到比较公平、优惠的价格,还能得到较好的服务,甚至有些还可以信用消费(赊账),因此消费者一般会比较放心地消费。这就是现实生活中重复博弈和一次性博弈效率不同的典型例子之一。 3、从研究对象和问题特征看,有限次重复博弈研究的主要是有明确结束时间的(合作、竞争等)关系,无限次重复博弈研究的主要是没有明确结果时间,或者较长期的关系。 从分析方法的角度,动态博弈和重复博弈分析中常用的逆推归纳法在无限次 16 重复博弈中无法直接运用,因为没有最后一次重复。因此无限次重复博弈分析的主要方法是构造法,即根据特定效率意义等构造了博弈完美纳什均衡。此外,也可以运用某些技巧解决问题,如教材中利用三阶段讨价还价博弈分析无限阶段讨价还价博弈的技巧。 从博弈的结果看,无限次重复博弈的效率往往高于有限次重复博弈,有些在有限次重复博弈中无法实现的效率较高的结果,在无限次重复博弈中有可能实现。例如囚徒的困境型博弈的无限次重复博弈和有限次重复博弈就体现了这种差别。两类重复博弈民间定理的差异也说明了这一点。 最后,在重复次数不多的有限次重复博弈中不一定要考虑得益贴现问题,在我限次重复博弈问题中这是必须考虑的。 上述区别在理论方面最主要的启发是重视有限次和无限次重复博弈的区别,区分研究这两类博弈问题是非常重要的,在实践方面的主要启发是促进和保持经济关系的长期稳定性,对于提高社会经济效率等常常有非常重要的意义。 6、用画线法容易找出该博弈的两个纯策略纳什均衡(T,L)和(M,R)。这两个纳什均衡的得益都帕累托劣于(B,S)。一次性博弈中效率较高的(B,S)不可能实现。但该博弈的结构表明存在双方合作的利益,在两次重复博弈中也有构造惩罚机制的条件,因此我会考虑运用试探合作的触发策略争取部分实现(B,S),提高博弈的效率。 我作为博弈方1会采用这样的触发策略:第一次重复采用B;第二次重复时,如果前一次的结果是(B,S),则采用M,如果前一次的结果是其他,则采用T。如果另一个博弈方有同样的分析能力,或者比较有经验,那么他(或她)也会采用相似的触发策略:在第一次重复时采用S;第二次重复时,如果前一次的结果是(B,S),则采用R,否则采用L。 双方采用上述触发策略构成一个子博弈完美纳什均衡,因此是稳定的。这时候前一次重复实现了(B,S),提高了博弈的效率。 当然,上述触发策略也是有风险的,因为当另一个博弈方不理解和没有采用上述策略时,我的得益会较低。当然如果考虑到人们具有学习进步的能力,而且缺乏分析和学习能力,采用效率较低策略的博弈方长期中会逐步被淘汰掉,那么采用上述触发策略的合理性就得到了进一步的支持。

产业经济学(王俊豪)第七章复习题答案

第七章博弈论与企业策略性行为 1.策略性行为的含义,其研究的市场基础与方法分别是什么? 答: 策略性行为是指一个企业旨在通过影响竞争对手对该企业行动的预期,使竞争对手在预期的基础上做出对该企业有利的决策行为。策略性行为的市场基础是寡占或垄断市场。策略性行为的研究方法主要是博弈论和信息经济学的运用。 2.什么是限制性定价? 答: 限制性定价是通过原有企业的当前价格策略来影响潜在企业对进入市场后利润水平的预期,从而影响潜在企业的进入决策。 3.什么是掠夺性定价? 答: 掠夺性定价是指原有企业将价格削减至对手平均成本之下,即使自己遭受短期损失,也要将对手驱逐出市场或者遏制进入。一旦对手离开市场,原有企业就会提高价格以补偿掠夺期损失。 4.合作策略性行为有哪两大类?简述明确合作策略性行为的商业实践。 答: 合作策略性行为是指企业旨在协调本行业各家企业行动和限制竞争而采取的一些行为。合作策略性行为分为默契合作策略性行为和明确合作策略性行为加以分析。 在没有涉及到信息的模型中,每个企业都知道与其他企业接触时会确定的协议,并且能够及时发现欺骗行为并加以惩罚。在这种情况下,这些企业就无需明确地合谋。但是现实中信息不对称的情况是广泛存在的。比如我们不排除

在一些行业中,企业的价格易于被竞争对手察觉,但是在另外一些行业中,价格可能在某种程度上被掩盖起来。比如企业只把产品卖给少数大买主(交易次数少,但每份订单大的情形)的时候。在这种情况下,单靠默契合作是不够的,而明确合作策略性行为的多种商业实践本质就是解决寡头合作企业间的信息不对称问题。 5.博弈论的主要内容是什么? 答: 一个完整的博弈应至少包含如下三项要素: (1)博弈的参加者,也称为局中人或博弈方。 (2)策略空间。 (3)局中人的盈利函数。 策略空间、盈利函数以及局中人的与博弈有关的特征等知识构成博弈的信息,从信息完备与否的角度,博弈可以分为完全信息与不完全信息两类。完全信息是指每一个局中人对于自己以及其他局中人的策略空间、盈利函数等知识有完全的了解,反之,则为不完全信息。 按照局中人行动的先后次序,如果局中人同时选择行动,称为静态博弈。如果局中人的行动有先后顺序,后行动者可以观察到先行动者的行动,并在此基础上采取自己最有利的策略,称为动态博弈。 6.简述新产业组织理论。 答: 在20世纪70年代以后由于新的研究方法引入而出现的新产业组织理论(NIO),它的研究焦点是策略性行为。新产业组织理论的兴起和发展对传统产业组织理论的分析方法和分析范式提出了重要挑战。一方面,新产业组织理论超越了传统哈佛学派的SCP分析范式。另一方面,新产业组织理论也对芝加哥学派的静态的价格—产出框架提出了质疑。以博弈论和信息经济学为方法论基础的新产业组织理论则明确了策略性行为在产业组织理论中的核心地位。正如泰

博弈论第四章习题

第四章习题 一、如果T次重复齐威王田忌赛马,双方在该重复博弈中的策略是什么?博弈结果如何? 答:因为这是零和博弈,结论比较具体。重复Nash 均衡,均以1/6的概率选择各个策略,期望收益分别为1和-1。 因为这是竞争性的零和博弈,无论是有限次重复博弈还是无限次的重复博弈,均不能达成合作的条件。 二、举出现实生活中的一个重复博弈与一次性博弈效率不同的例子。 答:火车站和机场餐饮业的服务的顾客往往是一次性的,回头客和常客也比较少,价格高,质量差,一次性博弈。效率也比较低。 商业区和居民区的餐饮业和商业服务业,回头客和常客比较多,比较注重信誉,质优、价廉,重复博弈。效率也比较高。 三、有限次重复博弈和无限次重复博弈有什么区别?这些区别对我们有什么启发?

答:动态博弈的逆向归纳法可以用于有限次重复博弈,但不能用于无限次重复博弈,主要用逆向归纳法。 无限次重复博弈的效率往往高于有限次重复博弈。当重复次数较少不一定考虑贴现问题,但无限次重复博弈必须考虑贴现问题。 启发:重视有限次与无限次的区别,区分和研究这两类博弈,在实践方面重要启发是促进和保持经济的长期稳定和可持续发展,提高社会经济效率是非常有意义的。 四、判断下列表述是否正确,并作简单讨论: (1)有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。 答:不一定。对于有两个以上纯策略纳什均衡的条件下就不一定。如“触发策略”就不是。 (2)有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。 答:是,根据子博弈完美纳什均衡的要求,最后一次必须是原博弈的一个纳什均衡。 (3)无限次重复博弈均衡解的得益一定优于原博

博弈论第七章习题复习课程

博弈论第七章习题

第七章习题 一、判断下列表述是否正确,并作简单分析 (1)海萨尼转换可以把不完全信息静态博弈转换为不完美信息博弈,说明有了海萨尼转换,不完全信息静态博弈和一般的不完美信息动态博弈是等同的,不需要另外发展分析不完全信息静态博弈的专门分析方法和均衡概念。 答:错误。即使海萨尼转换把不完全信息静态博弈转换为不完美信息动态博弈,也是一种特殊的有两个阶段同时选择的不完美信息动态博弈,对这种博弈的分析进行专门讨论和定义专门均衡的概念有利于提高分析的效率。 (2)完全信息静态博弈中的混合策略可以被解释成不完全信息博弈的纯策略贝叶斯纳什均衡。 答:正确。完全信息静态博弈中的混合策略博弈几乎总是可以解释成一个有少量不完全信息的近似博弈的一个纯策略Bayes—Nash均衡。夫妻之争的混合策略Nash均衡可以用不完全信息夫妻之争博弈的Bayes—Nash均衡表示就是一个例证。 (3)证券交易所中的集合竞价交易方式本质上就是一种双方报价拍卖。 答:正确。我国证券交易中运用的集合竞价确定开盘价的方式就是一种双方报价拍卖。与一般双方报价拍卖的区别只是交易对象,标的不是一件而是有许多件。 (4)静态贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型,都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他博弈方,从而可以获得对自己更有利的均衡。 答:错误。不是因为能够迷惑其他博弈方,而是其他博弈方必然会考虑这些行为选择并作为他们行为选择的依据。因为只根据实际类型考虑行为选择就无法判断其他博弈方的策略,从而也就无法找出自己的最优策略。其实,在这种博弈中一个博弈方即使自己不设定针对自己所有类型的行为选

第七章 对策论

第七章 对策论 §1 引言 社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来解决这样的问题开始于17世纪的科学家,如C.,Huygens 和W.,Leibnitz 等。现代对策论起源于1944年J.,V on Neumann 和O.,Morgenstern 的著作《Theory of Games and Economic Behavior 》。 对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。 在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。 §2 对策问题 对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的努力而是各方所采取的策略的综合结果。 先考察一个实际例子。 例1 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑18个月;如果双方都供认伪造了钱币,将各被判刑3年;如果一方供认另一方不供认,则供认方将被从宽处理而免刑,但另一方面将被判刑7年。将嫌疑犯A 、B 被判刑的几种可能情况列表如下: 嫌疑犯B 供认 不供认 嫌疑犯A 供认 (3,3) (0,7) 不供认 (7,0) (1.5,1.5) 表中每对数字表示嫌疑犯B A 、被判刑的年数。如果两名疑犯均担心对方供认并希望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。 从这一简单实例中可以看出对策现象中包含有的几个基本要素。 2.1 对策的基本要素 (i )局中人 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局中人。通常用I 表示局中人的集合.如果有n 个局中人,则},,2,1{n I =。一般要求一个对策中至少要有两个局中人。在例1中,局中人是B A 、两名疑犯。 (ii )策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参加对策的每一局中人i ,I i ∈,都有自己的策略集i S 。一般,每一局中人的策略集中至少应包括两个策略。 (iii )赢得函数(支付函数)

博弈论各章节课后习题答案 (4)

第四章谈判与协调 1.帕累托占优均衡和纳什均衡的关系是什么? 纳什均衡的基本思想是:每一个局中人选择一个策略,由所有局中人的策略构成了一个策略组合;在其它局中人选定策略不变的情况下,若某一个局中人单独地违背自己已选的策略,那么他的收益只会下降(或收益不会增加)。这样的策略组合构成一个均衡局势,并命名为纳什均衡。纳什均衡有纯策略的纳什均衡和混合策略的纳什均衡。一个博弈中有不止一个纳什均衡时,就构成一个多重纳什均衡问题。在多重纳什均衡下给出一些选择标准就得到一些特定的纳什均衡。其中帕累托占有纳什均衡是根据这样的选择标准选择的均衡。在博弈 中,若均为G 的其纳什均衡,若满足[,{},{}]i i G N S P =12,,,m s s s ????0 i s ?,0()()i i i j P s P s ?? >1,2,,,1,2,,i n j m ==??则称为博弈G 的帕累托占优纳什均衡。可见帕累托占有纳什均衡是纳什均衡中收益最大 0i s ? 的一种均衡。 2.分别找出具有下列性质的2人博弈的例子。 (1)不存在纯策略纳什均衡; (2)至少有两个纳什均衡,并且其中之一是帕累托占优均衡。 (1 )不存在纯策略的纳什均衡:该博弈不存在纯策略的纳什均衡 (2) 该博弈有三个纳什均衡:(战争,战争)、(和平,和平)和一个混合策略纳什均 衡。很显然,(和平,和平)是一个帕累托占优纳什均衡。 2525((,),(,77773.假设在某一产品市场上有两个寡头垄断企业,它们的成本函数分别为: TC 1=0.1q +20q 1+100000TC 2=0.4q +32q 2+20000 2122这两个企业生产一同质产品,其市场需求函数为:Q=4000-10p 。试分别基于古诺模型和纳什谈判模型求解两企业的利润。 解:由和400010Q p =?12 Q q q =+得124000.1() p q q =?+战争 和平国 家 1战争-5,-58,-10和平-10,810,10

博弈论第四章

4 非完全信息动态博弈 4.1 精炼贝叶斯均衡概述 例简单的非完全信息动态博弈 参与人1的类型t为个人信息。 参与人2 不知道t,但知道t的概率分布。 博弈的时序: (1)参与人1选择行动a1∈A1; (2)参与人2观察a1,选择a2∈A2 博弈的收益:u1 (a1, a2, t ), u2 (a1, a2, t ) u1u1u1u1 u1u1u1u1 u2u2u2u2 u2u2u2u2例: 1 R L M 1 3 p 2 1- p L'R'L'R' 2 0 0 0 1 0 1 2

标准式表示 参与人2 L'R' L2,10,0 参与人1 M0, 20, 1 R1, 31, 3 纯战略纳什均衡: (L,L'), (R,R') 均为子博弈精炼纳什均衡(无子博弈)。 但是(R, R')不可信。 排除不可信的纳什均衡: 要求1 参与人必须有一个推断(belief). 要求2 参与者的战略必须满足序贯理性(sequentially rational). 定义 处于均衡路径上(on the equilibrium path)的信息集: 在均衡战略下,博弈以正的概率到达该集. 处于均衡路径之外(off the equilibrium path)的信息集: 在均衡战略下,博弈不会到达此集. 要求 3 在处于均衡路径上的信息集上, 推断由贝叶斯法则和参与人的均衡战略决定。 例要求3的说明 参与人1的类型空间:{ t1,t2,t3,t4 } 行动空间:A= { L,R}

推断p i : 观察到L 后,参与人1的类型是t i 的概率。 推断q i : 观察到R 后,参与人1的类型是t i 的概率。 p 1 + p 2 + p 3 + p 4 = 1 q 1 + q 2 + q 3 + q 4= 1 如果参与人1的战略: t 1选 L ,t 2选 L , t 3选R ,t 4 选R 。 参与人2对p i 与 q i 的推断: p 1 = 3.02.02.0+= 0.4, p 2 = 3 .02.03 .0+= 0.6, p 3 = 0, p 4 =0; q 1 = 0, q 2= 0, q 3 =3.02.02.0+= 0.4, q 4= 3 .02.03 .0+= 0.6, 要求 4 在处于均衡路径之外的信息集上, 可能情况下,推断由贝叶斯法则和参与人的均衡战略决定。 原文:At information sets off the equilibrium path, beliefs are determined by Bayes ’ rule and the players ’ equilibrium strategies where possible.

第七章 对策论

第七章 对策论 (Game Theory) 本章重点:基本概念、矩阵对策的混合扩充 本章难点:矩阵对策的混合扩充 Game Theory也可译为博弈论,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题的学科。 1994年诺贝尔经济学奖授给了三位博弈论专家:纳什、泽尔腾、海萨尼。博弈论已经成为当代经济学的基石。博弈论博大精深,它不仅在经济学领域得到广泛应用,在军事、政治、商业征战、社会科学领域以及生物学等自然科学领域都有非常重大的影响,工程学中如控制论工程也少不了它。 7.1 基本概念 7.1.1对策现象与对策论 1.对策和对策论 在日常生活中及各种领域内,经常可以看到一些充满着竞争、对抗、冲突的现象。对策论是研究上述现象的数学理论和方法。它是一种理论模型,其中包括参加者所掌握的全部信息及可能采取的行动等。 对策论把各式各样的冲突现象抽象成一种数学模型,然后给出分析这些问题的方法和解。应该说明的是,所谓解是指对策中的所有参与者都按最佳策略行动而得到的结果。对策论的研究中一般都假设:在对策中所有参与者都是“完全理智”的,在采取的策略上没有任何失误。 2.对策现象 (1)下棋:围棋源于我国殷代。 (2)齐王赛马:齐王与大将田忌赛马,各自的马都分为三等,但齐王的同等马均强于田忌。孙膑给田忌出主意,用下----上,上----中,中----下,结果田忌胜出。 (3)猜手:小孩A与B猜手,若规定赢得1分,平得0分,输得 -1分,则A的赢得可用下表来表示 表7.1 3.对策论的产生 1944年,纽曼与曼彻斯特发表了题为《对策论和经济行为》。二次大战前后,由于军事需要,抽象成数学模型。 50年代是对策论发展的鼎盛时期,纳什和夏普利等提出了讨价还价模型和合作对策的“核”的概念。同时,非合作对策也开始创立。纳什于1950和1951年发表了两篇关于非合作

博弈论课后习题

第一章导论 1、什么是博弈?博弈论的主要研究内容是什么? 2、设定一个博弈模型必须确定哪几个方面? 3、举出烟草、餐饮、股市、房地产、广告、电视等行业的竞争中策略相互依存的例子。 4、“囚徒的困境”的内在根源是什么?举出现实中囚徒的困境的具体例子。 5、博弈有哪些分类方法,有哪些主要的类型? 6、你正在考虑是否投资100万元开设一家饭店。假设情况是这样的:你决定开,则的概率你讲收益300万元(包括投资),而的概率你将全部亏损;如果你不开,则你能保住本钱但也不会有利润,请你(a)用得益矩阵和扩展形式表示该博弈;(b)如果你是风险中性的,你会怎样选择?(c)如果你是风险规避的,且期望得益的折扣系数为,你的策略选择是什么?(d)如果你是风险偏好的,期望得益折算系数为,你的选择又是什么? 7、一逃犯从关押他的监狱中逃走,一看守奉命追捕。如果逃犯逃跑有两条可选择的路线,看守只要追捕方向正确就一定能抓住逃犯。逃犯逃脱可以少坐10年牢,但一旦被抓住则要加刑10年;看守抓住逃犯能得到1000元奖金。请分别用得益矩阵和扩展形式表示该博弈,并作简单分析。 第二章完全信息静态博弈 1、上策均衡、严格下策反复消去法和纳什均衡相互之间的关系是什么? 2、为什么说纳什均衡是博弈分析中最重要的概念? 3、找出现实经济或生活中可以用帕累托上策均衡、风险上策均衡分析的例子。 4、多重纳什均衡是否会影响纳什均衡的一致预测性质,对博弈分析有什么不利影响? 5、下面的得益矩阵表示两博弈方之间的一个静态博弈。该博弈有没有纯策略纳什均衡?博弈的结果是什么? 6、求出下图中得益矩阵所表示的博弈中的混合策略纳什均衡。 7、博弈方1和2就如何分10 000元进行讨价还价。假设确定了以下规则:双方同时提出自己要求的数额S1和S2,0≤s1,s2≤10 000,如果s1+s2≤10 000,则两博弈方的要求都得到满足,即分别得到s1和s2,但如果是s1+s2>10 000,则该笔钱就被没收。问该博弈的纯策略纳什均衡是什么?如果你是其中一个博弈方,你会要求什么数额,为什么? 8、设古诺模型中有n家厂商、qi 为厂商i的产量,Q=q1+…+qn 为市场总产量、P为市场出清价格,且已知P=P(Q)=a-Q(当Q<a时,否则P=0)。假设厂商i生产qi产量的总成本为Ci=Ci(qi)=cqi,也就是说没有固定成本且各厂商的边际成本都相同,为常数c(c<a).假设各厂商同时选择产量,该模型的纳什均衡是什么?当n趋向于无穷大时博弈分析是否仍然有效? 9、两寡头古诺模型,P(Q)=a-Q等与上题相同,但量厂商的边际成本不同,分别为c1和c2。如果0<ci <a/2,问纳什均衡产量各为多少?如果c1<c2<a,但2c2>a+c1,则纳什均衡产量又为多少? 10、甲乙两公司分属两个国家,在开发某种新产品方面有下面得益矩阵表示的博弈关系(单位:百万美元)。该博弈的纳什均衡有哪些?如果乙公司所在国政府想保护本国公司利益,有什么好的办法? 11、设一个地区选民的观点标准分布于【0,1】上,竞选一个公职的每个候选人同时宣布他们的竞选立场,即选择0到1之间的一个点。选民将观察候选人们的立场,然后将选票投给立场与自己的观点最接近的候选人。例如有两个候选人,宣布的立场分别为x1=和x2=,那么观点在x=左边的所有选民都会投候选人1的票,而观点在x=右边的选民都会投候选人2的票,候选人1将以60%的选票获胜。再设如果又候选人的立场相同,那么立场相同的候选人将平分该立场所获得的选票,得票领先的候选人票数相同时则用抛硬币决定哪个候选人当选。我们假设候选人唯一关心的知识当选(即不考虑自己对观点的真正偏好),如果又两个候选人,问纯策略纳什均衡是什么?如果又三个候选人,也请作出一个纳什均衡。 12、运用本章的均衡概念和思想讨论下列得益矩阵表示的静态博弈。

博弈论第4章答案

R R M 4.1.a 标准式 1↖2 L ’ R ’ 4,1 0,0 3,0 0,1 2,2 2,2 纯战略纳什均衡:( L, L ’ ) ( R, R ’ ) 子博弈精炼纳什均衡:( L, L ’ ) ( R, R ’ ) 精炼贝叶斯纳什均衡:( L, L ’ ) 4.1.b 标准式 1↖2 L ’ M ’ R ’ 1, 3 1, 2 4, 0 4, 0 0, 2 3, 3 2, 4 2, 4 2, 4 纯战略纳什均衡:( R, M ’ ) 子博弈精炼纳什均衡:( R, M ’ ) 精炼贝叶斯均衡: 没有 4.2 标准式 1↖2 L ’ R ’ 2,2 2,2 3,0 0,1 0,1 3,0 六种纯战略组合,每种组合中都至少有一方存在偏离的动机,因此不存在纯战略纳什均衡,因此也就不存在纯战略精炼贝叶斯均衡。 求混合战略精炼贝叶斯均衡: 设参与者1选择L 、M 、R 的概率分别为1,2,12(1)p p p p ?? 参与者2选择L ’和R ’的概率分别为,(1)q q ? 在给定参与者1的战略下,参与者2选择L ’和R ’的收益无差异,则: 1212 120*1*1*0*p p p p p p +=+?= 给定参与者2的战略,参与者1选择L 、M 、R 的收益无差异,则: 121212 12[3*0*(1)][0*3*(1)]2*(1) 41:**,*112 p q q p q q p p p p p p q +?=+?=??=== =又 联立得 所以 L L M L L M L R L

4.3答案(见4.5) 4.4 表示方法 第一个括号,逗号左边为type 1发送者信号,逗号右边为type 1发送者信号; 第二个括号,逗号左边为接收到L 信号的反应,逗号右边为接收到R 信号的反应; P 为信号接收者对type 1发送L 的推断,q 为信号接收者对type 1发送R 的推断 (a ) [(,),(,),1/2] [(,),(,),1/2] [(,),((1),),1/2][(,),(,),1,0] R R u u p R R d u p R R d u u p L R u d p q αα><+?=== (b ) [(,),(,),1/2,2/3] [(,),(,),1,0][(,),(,),0,1] L L u u p q L R d u p q R L u d p q =<==== 中文版习题4.5答案 (a ) [(,),(,),1/3,1/2]R R u d p q >= (b ) 12121212[(,,),(,),1/3,1/2] [(,,),(,),1/2,0] L L L u u p p q q L L R u d p p q q ==+<==+=

第七章:博弈论

7博弈论Game Theory 7.1策略性决策的制定 如果人和人的行为是相互影响的,那么一个人的决策必须考虑到他人的决策和行为。对策论是对决策者之间的行为的相互影响的研究。因为对策论的研究特别强调决策者行为的理性,在过去的二十年间,对策论已被广泛地应用于经济学中。确实大多数经济行为能够被看成是对策论的一个特殊的情形。 博弈的分类 本章开始详尽考察了策略式博弈并进而更详尽地讨论了扩展式博弈。前一种是指行为者同时作出单一选择的博弈,而后一种则指行为者序贯地作出行动选择。 沿着这条路径,我们将会遇到特定解的概念。我们将研究的解的概念包括那些以占优观点、纳什均衡、贝叶斯一纳什均衡、逆向归纳、子博弈完善均衡与序贯均衡等为基础的

概念。其中每个解概念比其前辈更复杂,并且知道在什么时候应用这一个解而非另一个解是作为一个好的应用经济学家的更为重要的一部分。 一般地,这里有两种方法描述一个对策:策略(规范)形式的表示和扩展形式的表示,博弈矩阵(支付矩阵)和博弈树 博弈矩阵:由参与者、战略集、支付构成,通常来描述一个静态的策略式博弈 囚徒困境 囚徒1 囚徒2 抵赖坦白抵赖 坦白 -1,-1-9, 0 0, -9-8, -8 博弈树:参与者、战略、概率、支付,通常来描述一个动态的扩展式博弈

7.2策略式博弈 策略式博弈的描述 定义7.1策略式博弈 1、参与人players:指的是一个博弈中的决策主体,其目的是通过选择行动策略以最大化自己的支付(效用)水平“自然”是虚拟参与人(pseudo-player),他在博弈的特定时点上以特定的概率选择随机行动。 2、行动actions:参与人i的行动以a i表示,是他所能做的某一选择。参与人i的行动集(action set)A i={a i},是其可以采取的全部行动的集合。一个行动组合(action profile)是一个由博弈中的n个参与人每人选择一个行动而组成的有序集,a={a i),(i=1,...,n).行动的顺序 3、信息information:是参与人有关博弈的知识,如自然的

西方经济学(微观经济学)课后练习答案第七章

微观第七章习题 一、名词解释 完全垄断市场垄断竞争市场寡头市场价格歧视博弈纳什均衡 占优策略均衡 二、选择题 1、对于垄断厂商来说,()。 A、提高价格一定能够增加收益; B、降低价格一定会减少收益; C、提高价格未必会增加收益,降低价格未必会减少收益; D、以上都不对。 2、完全垄断的厂商实现长期均衡的条件是()。 A、MR=MC; B、MR=SMC=LMC; C、MR=SMC=LMC=SAC; D、MR=SMC=LMC=SAC=LAC。 3、完全垄断厂商的总收益与价格同时下降的前提条件是()。 A、Ed>1; B、Ed<1; C、Ed=1; D、Ed=0。 4、完全垄断厂商的产品需求弹性Ed=1时()。 A、总收益最小; B、总收益最大; C、总收益递增; D、总收益递减。 5、完全垄断市场中如果A市场的价格高于B市场的价格,则() A、A市场的需求弹性大于B市场的需求弹性; B、A市场的需求弹性小于B市场的需求弹性; C、A市场的需求弹性等于B市场的需求弹性; D、以上都对。 6、以下关于价格歧视的说法不正确的是()。 A、价格歧视要求垄断者能根据消费者的支付意愿对其进行划分; B、一级价格歧视引起无谓损失; C、价格歧视增加了垄断者的利润; D、垄断者进行价格歧视,消费者就必定不能进行套利活动。 7、垄断竞争的厂商短期均衡时,()。 A、一定能获得差额利润; B、一定不能获得经济利润; C、只能得到正常利润; D、取得经济利润、发生亏损和获得正常利润都有可能。 8、垄断竞争厂商长期均衡点上,长期平均成本曲线处于( B )

A、上升阶段 B、下降阶段 C、水平阶段 D、以上三种情况都有可能 9、垄断竞争厂商实现最大利润的途径有:( D ) A、调整价格从而确定相应产量 B、品质竞争 C、广告竞争 D、以上途径都可能用 10、按照古诺模型下列哪一说法不正确,()。 A、双头垄断者没有认识到他们的相互依耐性; B、每一个寡头都认定对方的产量保持不变; C、每一个寡头垄断者都假定对方价格保持不变; D、均衡的结果是稳定的。 11、斯威齐模型是() A、假定一个厂商提高价格,其他厂商就一定跟着提高价格; B、说明为什么每个厂商要保持现有的价格,而不管别的厂商如何行动; C、说明为什么均衡价格是刚性的(即厂商不肯轻易的变动价格)而不是说明价格如何决定; D、假定每个厂商认为其需求曲线在价格下降时比上升时更具有弹性。 12、在拐折的需求曲线模型中,拐点左右两边的弹性是()。 A、左边弹性大,右边弹性小; B、左边弹性小,右边弹性大; C、两边弹性一样大; D、以上都不对。 13、与垄断相关的无效率是由于()。 A、垄断利润 B、垄断亏损 C、产品的过度生产 D、产品的生产不足。 三、判断题 1、垄断厂商后可以任意定价。 2、完全垄断企业的边际成本曲线就是它的供给曲线。 3、一级价格歧视是有市场效率的,尽管全部的消费者剩余被垄断厂商剥夺了。 4、许多学院和大学对贫困学生提供奖学金。可以认为这种政策是一种价格歧视。 5、垄断厂商生产了有效产量,但它仍然是无效率的,因为它收取的是高于边际成本的价格,获取的利润是一种社会代价。 6、完全垄断厂商处于长期均衡时,一定处于短期均衡。 7、垄断竞争厂商的边际收益曲线是根据其相应的实际需求曲线得到的。 8、由于垄断厂商的垄断地位保证了它不管是短期还是长期都可以获得垄断利润。 四、计算题 1、已知某垄断者的成本函数为TC=0.5Q2+10Q,产品的需求函数为P=90-0.5Q, (1)计算利润最大化时候的产量、价格和利润; (2)假设国内市场的售价超过P=55时,国外同质的产品将输入本国,计算售价p=55

博弈论 蒋文华 浙江大学

献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么!

行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策

略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉 特别提示: 如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢?(大智若愚) 特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示:

在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。----汉代刘向,《围棋赋》 二、西方的理解 game(规则) 费厄泼赖(fair play)

第三节学习博弈论的收益 一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展 三、提出完善游戏规则(制度)的建议

35博弈论-第四章

第四章完全信息动态博 弈 更为现实的考虑是将静态博弈动态化,动态化后,纳什均衡这一概念是否仍然有效呢?答案是部分有效的。如果不存在动态不一致,那么纳什均衡在完全信息动态博弈中仍不失为一个有用的均衡概念,但纳什均衡概念本身并不能保证不出现动态不一致,为了克服这一点在纳什均衡的基础上生产了所谓子博弈完美均衡。而这一章,我们将围绕这子博弈完美均衡来展开。

第一节完美信息与完全但不完美信 息 完全信息动态博弈可以分为两类,即完美信息与完全但不完美信息。所谓的完美信息博弈,是指博弈中的后行动者始终能够观察到前行动者的行动,因而动态博弈中不存在参与者同时行动这样的情况。而完全但不完美信息博弈,则指动态博弈中,至少存在两个参与者同时行动的情况,因而“后行动者”无法观察到“前行动者”的行动。我们不妨用两个例子来加以说明。

例4.1 动态囚徒困境 囚徒1 图4-1 动态囚徒困境

例4.2 取消管制 政府 图4-2 取消管制 与图4-2完全等价的表示方法见图4-3。

政府 图4-3 取消管制 定义4.1完美信息动态博弈就是不存在同时行动的完全信息动态博弈。 显然,运用策略式来描述动态博弈会非常不便,特别是当信息不完全时更是如此,为了更简便地描述动态博弈,我们将引入一种新的博弈表达式——扩展式。

第二节动态博弈的扩展式我们把博弈中所有从开始到结束的行动序列称为全历史(Terminal history),而用参与者函数来表示在每一个全历史上,在博弈进行到某个阶段时谁来行动。因而要完整地描述一个动态博弈,必须具备四个要素: (1)参与者集合; (2)全历史集合; (3)参与者函数; (4)偏好。 如果我们把全历史表示成一个行动序列(a1, a2,…, a K)(K为自然数,当K→∞时,就表示无穷动态博弈),那么(a1, a2, …, a m),其中m K ≤,就称为全历史(a1, a2, …, a K)的子历史(Subhistory)。当m < K时,(a1,

相关文档