当前位置：文档库 › 博弈论复习题及答案分析

博弈论复习题及答案分析

（√ ）
（× ）
（）
（ ×）
（× ）
（√）
（×）
（√）
（√ ）
（× ）
（× ）
（×）
对立的，因此零和博弈就是非合

因为后行动的博弈方可以先观察对方行为后再选择行为，因此总

所以后行动的人不一定总有利，例如：在

无法得到较理想的结果，是因为

（×）
）
作为原博弈构成的有限次
共同特点是重复博弈本质上不过是原博弈的简单重复，重复博弈的子
）
两阶段都
或者轮流采用不同纯战略纳什均衡，或者两
）
G={A1, A2,…,An; u1, u2,…,un)具有多重Nash均衡，那么可能（但
存在重复博弈G(T)的子博弈完美均衡结局，其中对于任意的tG的Nash均衡。（√ ）（或：如果阶段博弈G={A1, A2,…,An; u1,
…,un)具有多重Nash均衡，那么该重复博弈G(T)的子博弈完美均衡结局，对
t所有阶段都不可能发生合作，局中人会一直重复
）（或：零和博弈的无限次重复博弈中，可

符合各局中人最
采用原博弈的纯战略纳什均衡本身是各局中人能实现的最好结果，符合
因此，不管是重复有限次还是无限次，不会和一次性博弈有
）
符合各局中人最
但惟一的纳什均衡不是效率最高的战略组合，存在潜在合作利益的囚徒
）（或：原博弈惟一的纳什均衡本身是帕雷托效率意义上最佳
符合各局中人最大利益，不存在潜在合作利益的囚徒困境博弈。（×））
(static game)和动态博
(dynamic game)。
G有唯一的Nash均衡，那么对任意有限次T，重复博弈G(T)有唯一的
G的Nash均衡策略。（√ ）
、无限次重复博弈与有限重复博弈的区别：
无限次重复博弈没有结束重复的确定时间。在有限次重复博弈中，

无限次重复博弈不能忽视不同时间得益的价值差异和贴现问题，

无限次重复博弈与有限次重复博弈的共同点：试图“合作”和惩

、根据两人博弈的支付矩阵回答问题：
a b
2,3 0,0
0,0 4,2
写出两人各自的全部策略，并用等价的博弈树来重新表示这个博弈（6分）
找出该博弈的全部纯策略纳什均衡，并判断均衡的结果是否是Pareto有效。
求出该博弈的混合策略纳什均衡。（7分）
策略
Ｂ
ｂ
（草图如下：
Pareto有效，仅(B, b)是Ｋ－Ｈ有效。
、用反应函数法求出下列博弈的所有纯战略纳什均衡。
参与人2
a b c d
A 2,3 3,2 3,4 0,3
B 4,4 5,2 0,1 1,2
C 3,1 4,1 1,4 10,2
D 3,1 4,1 -1,2 10,1

B，a）与（A，c）
2aa和，
的反应函数22
2
,,(),BaaBabRaAacCad如果如果如果或者D,如果
的反应函数11
1
,,(),DcaAaaBRacaCca如果如果如果,如果
B，a）与（A，c），因此纯策略纳什均衡为（B，a）与（A，c）。
、（entry deterr

ence市场威慑）考虑下面一个动态博弈：首先，在一个市场
然后市场上的已有企业（在位者）选择是否与新
，回

右图：残酷型
找出给定在位者的两种类型所分别对应的纳什均衡，以及子博弈精炼纳什均
12分）
已有企业为温柔型的概率至少多少时，新企业才愿意进入（8分）
温柔 NE (in, accommodate) 和 (out, fight)。 SPNE为(in, 进入者在位者进入不进入默许斗争（-10，25）（0，100）（10，20）进入者在位者进入不进入默许斗争（20，30）（-10，0）（0，100）
NE (out, fight). SPNE同理
10(1)0pp 1/3p得到
、博弈方1 和博弈方 2就如何分 10，000 元钱进行讨价还价。假设确定了以
A 和 B，0≤A，B≤10，000。如果 A+B
10，000，则两博弈方的要求得到满足，即分别得 A 和 B，但如果 A+B>10，
，则该笔钱就没收。问该博弈的纳什均衡是什么？如果你是其中一个博弈方，

5000，5000）这个聚点均衡。
、北方航空公司和新华航空公司分享了从北京到南方冬天度假胜地的市场。如
500000元的垄断利润，但不受限制的竞争会使每一方的利
60000元。如果一方在价格决策方面选择合作而另一方却选择降低价格，
900000元。
（1）将这一市场用囚徒困境的博弈加以表示。
2）解释为什么均衡结果可能是两家公司都选择竞争性策略。
（1）用囚徒困境的博弈表示如下表：
北方航空公司
竞争
合作 500000，500000 0，900000
900000，0 60000，60000
2）如果新华航空公司选择竞争，则北方航空公司也会选择竞争（60000>0）；
北方航空公司仍会选择竞争（900000>500000）。若北
新华航空公司也将选择竞争（60000>0）；若北方航空公司
900000>0）。由于双方总偏好竞争，故
600000元。
、设啤酒市场上有两家厂商，各自选择是生产高价啤酒还是低价啤酒，相应的

1）有哪些结果是纳什均衡？
2）两厂商合作的结果是什么？
1）（低价，高价），（高价，低价）
2）（低价，高价）
、A、B两企业利用广告进行竞争。若A、B两企业都做广告，在未来销售中，
企业可以获得20万元利润，B企业可获得8万元利润；若A企业做广告，B企
A企业可获得25万元利润，B企业可获得2万元利润；若A企业不
B企业做广告，A企业可获得10万元利润，B企业可获得12万元利润；
A、B两企业都不做广告，A企业可获得30万元利润，B企业可获得6万元利

（1）画出A、B两企业的支付矩阵。
2）求纳什均衡。
答：（1）由题目中所提供的信息，可画出A、B两企业的支付矩阵（如下
。
B企业
不做广告
企业做广告 20，8 25，2
10，12 30，6
2）因为这是一个简单的完全信息静态博弈，对于纯策

纳什均衡解可运用

A厂商做广告，则B厂商的最优选择是做广告，因为做广告所获得的利
8大于不做广告获得的利润2，故在8下面划一横线。如果A厂商不做广告，
B厂商的最优选择也是做广告，因为做广告获得的利润为12，而不做广告的
6，故在12下面划一横线。
B厂商做广告，则A厂商的最优选择是做广告，因为做广告获得的利润
大于不做广告所获得的利润10，故在20下面划一横线。如果B厂商不做广告，
厂商的最优选择是不做广告，因为不做广告获得的利润30大于做广告所获得
25，故在30下面划一横线。
因此，最终的纯策略纳什均衡就是
、B两厂商都做广告。
、求出下面博弈的纳什均衡(含纯策略和混合策略)。
乙
L R
U 5,0 0,8
2,6 4,5
Nash均衡。

Nash均衡((
891,),(7374,)
、某产品市场上有两个厂商，各自都可以选择高质量，还是低质量。相应的

该博弈是否存在纳什均衡？如果存在的话，哪些结果是纳什均衡?

该矩阵博弈有两个纯策略Nash均衡，即(低质量, 高质量)， (高
,低质量)。
乙企业
高质量低质量
高质量 50,50 100,800
900,600 -20,-30

，可得
63y,9712x
75,13863(),9785,9712((。
、甲、乙两企业分属两个国家，在开发某种新产品方面有如下收益矩阵表示的
试求出该博弈的纳什均衡。如果乙企业所在国政府想保护本国企业利

乙企业
开发不开发
开发 -10,-10 100,0
0,100 0,0

,0100,00,10010,10
(开发,不开发)和(不开发,开发)。
((
1,1110),(111,1110))。
a个单位,则收益矩阵变为：
,0a100,00,100a10,10,要使(不开发,开发)成为该博弈的唯一纳什均衡点,只需
。此时乙企业的收益为100+a。
、博弈的收益矩阵如下表：
乙
右
上 a，b c，d
e，f g，h
（1）如果（上，左）是占优策略均衡，则a、b、c、d、e、f、g、h之间必

（2）如果（上，左）是纳什均衡，则（1）中的关系式哪些必须满足？
（3）如果（上，左）是占优策略均衡，那么它是否必定是纳什均衡？为什

4）在什么情况下，纯战略纳什均衡不存在？
（1）
a，gc，db，hf。本题另外一个思考角度是从占优策略
,(),(hdfb；而对甲而言，占优策略为
,(),(geca。综合起来可得到所需结论。
2）纳什均衡只需满足：甲选上的策略时，
b，同时乙选左的策略时，ea。
b，ea。
3）占优策略均衡一定是纳什均衡，因为占优策略均衡的条件包含了纳什

4）当对每一方来说，任意一种策略组合都不满足纳什均衡时，纯战略纳

、Smith和John玩数字匹配游戏，每个人选择1、2、3，如果数字相同， John
Smith 3美元，如果不同，Smith给John 1美元。
（1）列出收益矩阵。
2）如果参与者以1/3的概率选择每一个数字，证明该

混合策略存在一个

（1）此博弈的收益矩阵如下表。该博弈是零和博弈，无纳什均衡。
John
2 3
1 3，-3 -1，1 -1，1 2 -1，1 3，-3 -1，1
-1，1 -1，1 3，-3
2）Smith选（1/3，1/3，1/3）的混合概率时，
选1的效用为：
1131131)3(311U
选2的效用为：
1131)3(311312U
选3的效用为：
1)3(311311313U
John选（1/3，1/3，1/3）的混合概率时，
选1的效用为：
1)1(31)1(31331'1U
选2的效用为：
1)1(31331)1(31'2U
选3的效用为：
1331)1(31)1(31'3U
21UUU，'3'2'1UUU，所以：
1,31,31(),31,31,31(是纳什均衡，策略值分别为John：31U；Smith：31'U。
、假设双头垄断企业的成本函数分别为：
120QC，2222QC，市场需求曲线
P2400，其中，
1QQQ。
（1）求出古诺（Cournot）均衡情况下的产量、价格和利润，求出各自的反

（2）求出斯塔克博格（Stackelberg）均衡情况下的产量、价格和利润，并

3）说明导致上述两种均衡结果差异的原因。
答：（1）对于垄断企业1来说：
19020)](2400max[211121QQQQQQ
这是垄断企业1的反应函数。
其等利润曲线为：
211122380QQQQ
对垄断企业2来说：
502)](2400max[1222221QQQQQQ
这是垄断企业2的反应函数。
其等利润曲线为：
212242400QQQQ
在达到均衡时，有：
80
450190
111QQQQ
均衡时的价格为：
)3080(2400P
两垄断企业的利润分别为：
80230802803802

30430802304002

均衡点可图示为：
（2）当垄断企业1为领导者时，企业2视企业1的产量为既定，其反应函

/50
2QQ
1的问题可简化为：
/803/280204502400max
11111QQQQQQ
均衡时价格为：
8032802400P
利润为：
/39200
，9/256002
该均衡可用下图表示：
企业2领先时可依此类推。
3）当企业1为领先者时，其获得的利润要比古诺竞争下多。而企业2获
1先行动时，其能考虑企业2的反应，并以此来
而企业2只能被动地接受企业1的既定产量，计划自己的

Stackelberg均衡企业2的反应线 50 0 企业1 95 200 190 企业2 企业1的反应线 0 企业1 95 200 190 企业2 企业1的反应线均衡点
、在一个由三寡头操纵的垄断市场中，逆需求函数为p=a-q
-q2-q3，这里qi是
i的产量。每一企业生产的单位成本为常数c。三企业决定各自产量的顺序
(1)企业1首先选择q
≥0；(2)企业2和企业3观察到q1，然后同时分别
q
和q3。试解出该博弈的子博弈完美纳什均衡。
1选择产量q
，第二阶段企业2和3
q
后，他们之间作一完全信息的静态博弈。我们按照逆向递归法对博弈

1）假设企业1已选定产量q
，先进行第二阶段的计算。设企业2，3的利润函

23212cqq)qqqa(
23213cqq)qqqa(

2
21
2cqqqaq （1）
cq2qqa
321
3 （2）
1）、（2）组成的方程组有：
cqaqq1*3*2 （3）
2）现进行第一阶段的博弈

分析：
1，其利润函数为；
13211cqq)qqqa(
3）代入可得：
)cqa(q111 （4）
4）对q
求导：
cq2a
1
1

ca(
1q*1 （5）
2*
)ca(
1
3）将式（5）代回（3）和（4）有该博弈的子博弈完美纳什均衡：
ca(
1q*1,)ca(61qq*3*2
、某寡头垄断市场上有两个厂商，总成本均为自身产量的20倍，市场需求函
Q=200-P。
1）若两个厂商同时决定产量，产量分别是多少？
2）若两个厂商达成协议垄断市场，共同安排产量，则各自的利润情况如何？
（1）分别求反应函数，180-2Q1-Q2=0，180-Q1-2Q2=0，Q1=Q2=60
2）200-2Q=20，Q=90，Q1=Q2=45
、一个工人给一个老板干活，工资标准是100元。工人可以选择是否偷懒，老
假设工人不偷懒有相当于 50 元的负效用，老板想克扣
60 元工资，工人不偷懒老板有 150 元产出，而工人偷懒
80元产出，但老板在支付工资之前无法知道实际产出，这些情况双

1）如果老板完全能够看出工人是否偷懒，博弈属于哪种类型？用得益矩阵或

2）如果老板无法看出工人是否偷懒，博弈属于哪种类型？用得益矩阵或扩展

1）完全信息动态博弈。

2）完全信息静态博弈，结果仍然是工人偷懒，老板克扣。
、给定两家酿酒企业A、B的收益矩阵如下表：
A企业
啤酒
企业白酒 700，600 900，1000
800，900 600，800
B企业的收益，后一个数字表示B企业的收益。
1）求出该博弈问题的均衡解，是占优策略均衡还是纳什均衡？
2）存在帕累托改进吗？如果存在，在什么条件下可以实现？福利增量是

3）如何改变上述A、B企业的收益才能使均衡成为纳什均衡或占优策略均
A、B企业的收益才能使该博弈不存在均衡？
答：（1）有两个纳什均衡，即（啤酒，白酒）、（白酒，啤酒），都是纳什均

2）显然，（白酒，啤酒）是最佳均衡，此时双方均获得其最大收益。若均
，则存在帕累托改善的可能。方法是双方沟通，共同做出
800+900变为900+1000，增
200。
3）如将（啤酒，白酒）支付改为（1000，1100），则（啤酒，白酒）就成
800，500），将（白酒，啤
900，500），则该博弈就不存在任何占优策略均衡或纳什均衡。
、在纳税检查的博弈中，假设A为应纳税款，C为检查成本，F是偷税罚款，
C
1）写出支付矩阵。
2）分析混合策略纳什均衡。
（1）该博弈的支付矩阵如下表：
纳税人
不逃税
检查 A-C+F， -A-F A-C，-A
0，0 A，-A
2）先分析税收检查边际：因为S为税务机关检查的概率，E为纳税人逃
E，税收机关选择检查与否的期望收益为：
AEFECAEFCAEK)1)(()(),1(
1()1(0),0(EAEAEEK
,0(

),1(EKEK，得：)/(FACE。
如果纳税人逃税概率小于E，税收机关的最优决策是不检查，否则是检查。
再分析逃税边际：给定S，纳税人选择逃税与否的期望收益是：
FASSFASK)()1(0)()1,(
SAASSK)1)(()0,(
0,()1,(SKSK，得：)/(FAAS。即如果税收机关检查的概率小于S，纳

因此，混合纳什均衡是（S，E），即税收机关以S的概率查税，而纳税人以
的概率逃税。
、假设古诺的双寡头模型中双寡头面临如下一条线性需求曲线：
Q为两厂商的总产量，即Q=Q
+Q2。

=MC2=0

1的总收益TR
由下式给出：
1的边际收益MR
为：
=30-2Q1-Q2
MR
=MC1=0，得厂商1的反应函数(reaction function)

=15-0.5Q2 (6-1)
2的反应曲线为：
=15-0.5Q1 (6-2)
Q
和Q2的值，即方程组6-1和6-2的解。
Q
=Q2=10。
Q为Q
+Q2=20，均衡价格为P=30-Q=10。
(6)条
假定两寡头可以串谋。它们能共同确定产量以使总利润最大化。
TR为：
2
MR为：
MR=MC=0，可以求得当Q=15时总利润最大。如果两厂商同
Q
=Q2=7.5。其实，任何
15的产量Q
和Q2的组合都使总利润最大化，因此，把Q1+Q2=15称为契约
Q
=Q2=7.5是契约曲线上的一个点。
Q
=Q2=15，各厂商的利润为零。
、两家电视台竞争周末黄金时段晚8点到10点的收视率，可选择把较好的节目
在前面还是后面。他们决策的不同组合导致收视率如下：
如果两家是同时决策，有纳什均衡吗?
2121111QQQQ30Q)Q30(PQTR2121111QQQQ30Q)Q30(PQTR
(2)如果双方采用规避风险的策略，均衡的结果是什么?

1：对方采取前面战略的最小收益为18
16
1 会选择收益为18的战略——前面
2：前面的策略是一个优超策略——前面

如果电视台1先选择，结果有什么?若电视台2先选择呢?
(4)如果两家谈判合作，电视台1许诺将好节目放在前面，这许诺可信吗？结果能是什么？
1 许诺将好节目放在前面的许诺不可信。
2，前面为占优策略，
2 ，选择前面的时候，电视台1 选择后面的收益要大于前面的收益。

、如果将如下的囚徒困境博弈重复进行无穷次，惩罚机制为触发策略，贴现因
δ。试问δ应满足什么条件，才存在子博弈完美纳什均衡？

坦白不坦白
4,4 0,5
5,0 1,1

(不坦白,不坦白)，均衡结果为
，采用触发策略，局中人i的策略组合s的最好反应支付
s,s(Pmax)s(
ii
si
i=5,Pi(s*)=4，Pi(sc)=1。若存在子博弈完美纳什均衡，必须满
11545
s(P)s()s(P)s(c
*i*i*i，即只有当贴现因子>1/4时，才存在子博弈完美

、在Bertrand价格博弈中，假定有n个生产企业，需求函数为P=a-Q，其中P是
Q是n个生产企业的总供给量。假定博弈重复无穷多次，每次的价格都
企业使用“触发策略”(一旦某个企业选择垄断价格，则执行“冷
求使垄断价格可以作为

完美均衡结果出现的最低贴现因子δ是多少。
δ与n的关系。
3个步骤
1）n个企业合作，产量总和为垄断产量，价格为垄断价格，然后平分利润。
2）其中一个企业采取欺骗手段降价，那个这家企业就占有的全部市场，获得

3）其他企业触发战略，将价格降到等于边际成本，所有的企业利润为零。

1）设每个企业的边际成本为c，固定成本为0
MR=MC
:Q=(a-c)/2
=(P-c)*Q=(a-c)2/4
(a-c)2/4n
2）假设A企业自主降价，虽然只是微小的价格调整，但足以占领整个市场，
(a-c)2/4
3）其他企业在下一期采取冷酷策略，使得所有企业的利润为0

企业不降价： (a-c)2/4n， (a-c)2/4n， ……
企业降价： (a-c)2/4， 0， ……
就要使得不降价的贴现值大于等于降价的贴

δ
不降价的贴现值： [(a-c)2/4n][1/(1- δ)]
降价的现值： (a-c)2/4
[(a-c)2/4n][1/(1- δ)]≥ (a-c)2/4
δ≥1-1/n
、假设某劳动市场为完全竞争市场,其供求函数如下: S
:W=120+2L DL:W=360-L
(在完全竞争市场下)的生产函数为 f(L,K)=10L0.5K0.5 (K=100)

(a)该厂商的AC
,MCL及VMPL各为多少?
劳动工资为多少?厂商会雇用多少劳动?
S
=DL解得：W=280

P=MR=MC=W/MP

W= AC
=MCL=VMPL
AC
=MCL=VMPL=280
D=S解得：P= 40，q=10

0.5
2=51 (取整数)
试计算表1中的战略式博弈的重复剔除劣战略均衡。
1 一个战略式表述博弈
B
L M R
U 1,2 3,1 2,4
5,6 7,1 2,6
D 3,1 2,0 7,8
B而言，战略M严格劣于R；（因为1<4, 1<6,0<8），因此剔除B的战略
；构成新的博弈如下
B
L R
U 1,2 2,4
5,6 2,6
D 3,1 7,8

A而言，战略U严格劣于D(因为1<3,2<7)，因此剔除A的战略U，构

B
L R
M 5,6 2,6
3,1 7,8
已经没有严格的劣战略，因此没有严格的劣战略可以剔除。
严格劣战略可解的。
B而言，战略L弱劣于R（因为6=6，1<8）,因此
B的弱劣战略L，构成新的博弈如下：
B
R
M 2,6
7,8
A而言，战略M严格劣于D（因为2<7）,因此剔除A
M，构成新的博弈如下：
B
R
D 7,8
D，R）
ps: 如果同学们用划线的方法求纳什均衡，就可以发现纯战略nash均衡有
（M,L）和（D,R）但采用剔除弱劣战略的方法，把其中一个纳什均衡剔除

试给出下述战略式表述博弈的所有纳什均衡。
R
1 U 2,2 3,3
4,4 1,2
1选择U，2的最佳选择是R(因为2<3)，在相应位置划线
1选择D，2的最佳选择是L（因为4>2），在相应位置划线
2选择L，1的最佳选择是D（理由自己写），在相应位置划线
2选择R，1的最佳选择是U（理由自己写），在相应位置划线
),(RU和),(LD
Wilson的奇数定理，可能有一个混合战略均衡。
1选U的概率为，那么选D的概率为1
2选L的概率为，那么选R的概率为1，
那么2选战略L和R的期望收益应该应该相等，因此

应
)1(23)1(42
LUU
? 自己求解（2分）
1选战略U和D的期望收益应该应该相等
1(14)1(32
UUU

?
市场里有两个企业1和2。每个企业的成本都为0。市场的逆需求函数为
。其中P是市场价格，Q为市场总产量。
1）求古诺（Cournot）均衡产量和利润。
2）求斯坦克尔伯格（Stackelberg）均衡产量和利润。
设两个企业的产量分别为
q，2q，有21qqQ，因此利润函数分别为：
1211121116)16(qqqqqqq
1222221216)16(qqqqqqq

216
1
1qqq
216
2
2qqq
1和企业2的反应函数分别为：
1621qq
1612qq
?
1qq。自己求解
2）设企业1先行，企业2跟进。两个企业的产量分别为
q，2q，因此利润函数分别为：
1211121116)16(qqqqqqq
1222221216)16(qqqqqqq
在第二阶段，企业2在已知企业1的产量的情况下，最优化自己的产量，从
2的反应函数：
216
2
2qqq
2的反应函数为：
1612qq
1考虑到企业2的反应，从而自己的利润函数为：
16(1616)16(11211212111211qqqqqqqqqqq （2分）
1的利润最大，应满足一阶条件：0
1q
?
q。
所以?
q。
PS: 古诺模型是完全信息静态博弈，求的是纳什均衡；斯坦伯格模型是完全信息动

（1）试给出图1中的完全信息动态博弈的子博弈精炼均衡和均衡结果。
2）倘若2告诉1：2的战略是
,,(jic，问此时1的最优战略是什么？（3）在
2）中，1和2的战略组合构成一个纳什均衡吗？均衡结果是什么？（4）（3）

1

a b
2 2
c d e j
(1,2) (2,1) 1 (6,3)
f g
(3,2)
l i
(4,6) (0,2)
（1） 2

1

a b
2 2
c d e j

(1,2) (2,1) 1 (6,3)
（2分） f g
(3,2)
l i
(4,6) (0,2)
)],,(),,[(lecgb，均衡结果为（4，6）。
2）若2的战略为),,(jic，则1的最优战略为),(fb。
3）给定2的战略为),,(jic，1的最优战略为),(fb；反之，给定1的战略
,(fb，战略),,(jic是2的一个最优战略。所以它们构成一个纳什均衡，均衡结
6,3）。
4）因为2的战略),,(jic中含有不

可置信的威胁i，使1在f和g之间不敢
。当博弈进行到2在l与i之间进行选择的时候，2必会选l，给定如此，1
g而不是f，此时2会选e，这就是子博弈精炼均衡。
、试解出下述不完美信息动态博弈的精炼贝叶斯均衡。
1 R
(1,2)
L L

2
l r l r
(2,4) (0,1) (3,1) (7,2)
2
“2”看见“1”未选R时，设他认为“1”选L的概率为P， “1”
L的概率为1－P，则“2”选l的期望支付为：
PP31)1(14
”
r的期望支付为
PP2)1(21
PP231，即
1P时，“2”选l，而给定“2”选l，“1”选L收
2，选L的收益为3，选R的收益为1，因此“1”会选
。而给定“1”
L，“2”认为
10P（注意：P是“1”选L的概率），与41P矛盾。故
1P不会有均衡；
PP231，即
1P时，“2”选r，给定“2”选r，“1”选L收益为0，
的收益为7，选R的收益为1，因此“1”会选L。而给定“1”选L，“2”
0P，与
1P吻合。于是，得到均衡战略：rPL,0,，即“1”在第
L，“2”虽然看不到“1”的选择，但“2”认为“1”选择L的概
0，所以“2”在第二阶段选择r，这样的战略构成了一个贝叶斯精炼纳什
7，2）。