文档库 最新最全的文档下载
当前位置:文档库 › 博弈论与非线性分析

博弈论与非线性分析

博弈论与非线性分析
博弈论与非线性分析

博弈论与非线性分析

俞建

贵州大学数学系

贵州省博弈、决策和控制理论重点实验室

2008年3月

(一)

我们知道,博弈论是由V on Neumann 和Morgenstern 在1944年合作的名著“博弈论与经济行为”[1]的出版而宣告诞生的. 在“序言”中,他们就提出“经济与社会问题可以从这个角度得到最好的解释”,在第1章中,他们又指出“博弈论是建立经济行为理论的最恰当的方法”.

[1]J.Von Neumann, O.Morgenstern, Theory of Games and Economic Behavior, 1944(有中译本,王文玉等译,2004).

[1]中深入研究了矩阵博弈:

局中人1,纯策略的集合{}1,,m A a a = ,混合策略的集合

(){

}11

,,:0,1

m

m

i

i i X x x x

x

x ===≥∑= . 局中人2,纯策略的集合{}1,,n B b b = ,混合策略的集合

(){

}

11

,,:0,1n n j

j j Y y y y y y ===

≥∑= .

如果局中人1选择i a ,局中人2选择j b ,则局中人2支付局中人1ij c ,所有{}ij c 构成一个m n ?矩阵. 这样,如果局中人1选择混合策略()1,,m x x x X =∈ ,局中人2选择混合策略

()1,,n y y y Y =

∈ ,则局中人2支付局中人1的期望支付是

11

m

n

ij i j i j c x y ==∑∑.

V on Neumann 证明了:

()()*

*

*

**

*

11,,,,,m n x x x X y y y Y ?=∈=

∈ ,使

**

*

*

11

11

11

m ax m in ,m n

m n

m n

ij i j ij i j ij i j y Y

x X

i j i j i j c x y c x y c x y ∈∈======∑∑=∑∑=∑∑

换句话说,*

*

(,)x y 是此矩阵博弈的平衡点,或者有

11

11

m ax m in m in m ax m

n

m

n

ij i j ij i j y Y

y Y

x X

x X

i j i j c x y c x y ∈∈∈∈====∑∑=∑∑.

以上结果称为最大最小定理(最好的愿望,最坏的准备).

年轻的Nash 将V on Neumann 的矩阵博弈的模型在两个方面作了推广:由2人→n 人,尤其是由零和→非零和, 这种博弈称为n 人有限非合作博弈.

以二人有限非合作博弈(双矩阵博弈)为例来说明:

如果局中人1选择纯策略i a , 局中人2选择纯策略j b ,则局中人1得到支付ij c , 局中人2得到支付ij d , 未要求0ij ij c d +=(1,,,1,,i m j n ?=?= ),允许0,0ij ij c d >>,双赢. 这样如果局中人1选择混合策略()1,,m x x x X =∈ , 局中人2选择混合策略()1,,n y y y Y =∈ , 则局中人1和局中人2得到的期

望支付分别是11

m

n

ij i j i j c x y ==∑∑和11

m

n

ij i j i j d x y ==∑∑.

1950和1951年,Nash[2][3]证明了:

()()*

*

*

*

*

*

11,,,,,m n x x x X y y y Y ?=

∈=

∈ ,使

*

**

1111*

**

11

11

m a x ,

m a x .

m

n

m

n

ij i j

ij i j x X

i j i j m

n

m

n

ij i j

ij i j y Y

i j i j c x y

c x y

d x y d x y ∈====∈====∑∑=∑∑∑∑=∑∑

这样的()*

*

,x y

之后称为Nash 平衡点:谁都不能通过单独

改变自己的策略而使自己获得更大的利益 .

Nash 平衡点是非合作博弈中最重要、最核心的概念 .

[2]J.F .Nash,

Proceedings

of

the

National

Academy

of

Sciences,USA,36(1950),48-49.

[3] J.F .Nash, Annals of Mathematics,54(1951),286-295.

V on Neumann 和Nash 工作的两个理论前提: ⑴对每个局中人来说,所有信息都是公开的,完全的,对称的;

⑵每个局中人都是完全理性的,都能够在各自策略集中选择对自己最为有利的策略.

对应用来说,以上两个假设太理想了,太苛刻了,因为它要求每个局中人都是神——无所不知且无所不能. Harsanyi 和Selten 的工作分别在这两个方面提出了新的思想,大大扩展了博弈论的应用,正因为如此,他们才与Nash 一起,在“博弈论与经济行为”一书出版整整50年后,共同获得了1994年的Nobel 经济奖,也正是这次获奖,才确认了博弈论对经济理论的核心重要性.具体来说, Harsanyi 在非对称信息条件下,提出了“类型”的概念,用Bayes 方法对博弈论模型进行分析,为信息经济学奠定了基础. 而Selten 将完全理性看作有限理性的极限,提出了Nash 平衡点精练的概念.

Nobel经济奖中的博弈论工作

1996年、2001年和2007年的获奖工作属于信息经济学的领域,而从本质上讲,这些工作都是非合作博弈论在经济学中的重要应用,因此也都包含在20世纪90年代以来

出版的任何一本博弈论的教科书中. Maskin和Myerson 都是杰出的博弈论学者,Myerson还有名著“博弈论,矛盾冲突分析”出版. 此外,2002年Nobel经济奖的获得者是Kahneman和Smith,其中Kahneman是因把心理学研究融入经济学而获奖,他是行为经济学的倡导人; Smith是因在实验经济学作出了开创性贡献而获奖,而许多经济学实验也是从博弈论开始的.

博弈论的研究近些年来如此火热,主要原因还在于经济实践发展和与之相适应的经济理论发展的需要. 近些年来,经济全球化深入发展,生产规模扩大,垄断势力增强,人们要谈判,讨价还价,进行交易,所有这一切都建立在个人理性的基础上,建立在竞争的基础之上. 随着这种竞争和冲突的日益加剧,各种策略和利益的对抗、依存和制约的持续发展,使博弈论(主要是非合作博弈)的研究达到了全盛时期,由它的概念、内容、思想和方法出发,已经并将继续几乎全面地改写经济学,也并将得到更加广泛的应用.

博弈论与经济学的关系极为密切,这是可以理解的,但是博弈论与非线性分析的关系又如何呢?二者也是非常密切的.

首先,V on Neumann在[1]中的“技术说明”中就指出:“很难说当代数学中的哪一分支学科及其哪一部分是必需的.不过,要想比较透彻地了解本书所分析的问题,读者必须超越

传统的数学推理方式,这些推理主要是数理逻辑、集合论和泛函分析的推理”.

在[1]中,V on Neumann是用凸集分离定理来证明矩阵博弈平衡点的存在性的,而在[4]中,他用的是以下引理:V on Neumann引理

设,m n

??是两个非空有界闭凸集,,A B X Y X R Y R

??

是两个非空闭集. 如果

1){}

?∈=∈∈是非空闭凸集

,():(,)

x X A x y Y x y A

2){}

?∈=∈∈是非空闭凸集,

,():(,)

y Y B y x X x y B

则A B≠?

.

[4]J.Von Neumann, Ergebnisse eines Mathenmatischen Kolloquiums,8(1935-1936),73-83.

在[2]和[3]中,Nash是分别应用以下Brouwer不动点定理和Kakutani不动点定理来证明n人有限非合作博弈平衡点的存在性的.

Brouwer不动点定理

设n

?是非空有界闭凸集,映射:f C C

C R

→连续,则

*

x C

?∈,使**

=.

()

f x x

Kakutani不动点定理

设n

?是非空有界闭凸集,集值映射:2C

C R

F C→上半连续,且x C

?∈,使?∈,()

F x是C中的非空闭凸集,则*x C

**

∈.

()

x F x

我们知道, Kakutani不动点定理是应用Brouwer不动点定理来证明的,而它也是Brouwer不动点定理的推广,见[5]; 而Kakutani不动点定理与V on Neumann引理是等价的,见[6]. [5]J.Franklin,Methods of Mathematical Economics,1980(有中译本,俞建,顾悦译,1985).

[6]K.C.Border,Fixed Point Theorems with Applications and Game Theory,1985.

这样, 无论是V on Neumann还是Nash, 两位大师对博弈论研究的奠基之作就与凸分析、集值映射、不动点定理,与非线性分析紧密联系在一起了.

(二)

V on Neumann 的矩阵博弈的概念很快就被推广到以下二人零和博弈:

设X 和Y 分别是局中人1和局中人2的策略集, 当局中人1选择策略x X ∈,局中人2选择策略y Y ∈, 则局中人1从局中人2获得的支付为(,)f x y (此时局中人2从局中人1获得的支付为

(,)f x y -,支付和为零,故称为二人零和博弈). 如果存在*x X ∈,*

y Y ∈,使

*

*

*

*

*

*

(,)m ax (,),(,)m in (,),y Y

x X

f x y f x y f x y f x y ∈∈==

则称**

(,)x y 为此二人零和博弈的平衡点,此时,x X y Y ?∈?∈, 有*

*

*

*

(,)(,)(,)f x y f x y f x y ≤≤, 即*

*

(,)x y 是f 在X Y ?中的鞍点.

Nash 的 n 人非合作有限博弈的概念很快就被推广到以下n 人非合作博弈:

设{}1,,N n = 是局中人的集合, i N ?∈,i X 是第i 个局中

人的策略集, 1

:n

i i i f X X R ==

→∏

是第i 个局中人的支付函数.

i N ?∈,记?\i N i =.如果存在()1,,n x x x X ***

=∈ ,使i N ?∈,

()()?

?,m ax ,i i

i i i i i i u X f x x f u x *

*

*

∈=,

则称x *

为此博弈的Nash 平衡点.

如果{}12

121,2,,,,N X X X

Y f f f f =====-,则

此博弈的Nash 平衡点即为f 在X Y ?中的鞍点. 1) 平衡点与不动点的关系:

i N ?∈,定义集值映射?:2

i

X i i F X →如下:

()()(){}

???:,m ax ,i i

i i i i i i i i i i u X F x w X f w x f u x ∈=∈=.

定义集值映射:2X

F X →如下:

()()?1

n

i i i F x F x ==

.

则x *

是以上博弈的Nash 平衡点当且仅当x *

是集值映射F 的不动点.

2) Nash 平衡点与Ky Fan 点的关系:

Ky Fan 点的概念是由我们[7]引入的:设函数

:X X R φ?→

,如果x X *?∈,使y X ?∈,有(,)0x y φ*

≤,则

x *

称为函数φ的Ky Fan 点. 注意到[8]引入了平衡问题的概

念:如果x X *?∈,使y X ?∈,有(,)0x y φ*≥,则x *

称为平衡问题φ的解.无论是[7]还是[8],都是建立在非线性分析中著名的Ky Fan 不等式的基础之上的[9].

[7]K.K.Tan,J.Yu,X.Z.Yuan,Proc.Amer.Math.Soc,123(1995),1511-1519. [8]E.Blum,W.Oettli,Math.Student,63(1994),123-145. [9]Ky Fan,in Inequality Ⅲ(O.Shisha Eds),1972,103-113.

定义函数:X X R ??→如下:

()()()?

?

1

,,,n

i

i

i

i

i i i x y f y x f x x ?=??=

-??

∑. 则x *

是以上博弈的Nash 平衡点当且仅当x *

是函数?的KyFan 点.

以上n 人非合作博弈的概念很快又被推广到以下的广义博弈:

设i N ?∈,?:2

i

X i i G X →是第i 个局中人的可行策略映

射.如果存在()1,,n x x x X *

*

*

=∈ ,使i N ?∈,有()?i i i x G x *

*

∈,

()

()

()?

?

?,m ax

,i i i i i i i i i u G x f x x f u x *

*

*

*

∈=,

则称x *

为此广义博弈的平衡点.

如果()???,,i i i i i i N x X G x X ?∈?∈=,则此广义博弈的平衡点即为n 人非合作博弈Nash 平衡点. 1) 平衡点与不动点的关系:

i N ?∈,定义集值映射?:2

i

X i i F X →如下:

()()()()()?????:,m ax ,i i i i i i i i i i i i i i u G x F x w G x f w x f u x ∈??

=∈=????

.

定义集值映射:2X

F X →如下:

()()?1

n

i i i F x F x ==

.

则x *

是以上广义博弈的平衡点当且仅当x *

是集值映射F 的不动点.

2) 平衡点与拟变分不等式(QVI)解的关系:

定义函数:X X R ??→如下:

()()()?

?

1

,,,n

i

i

i

i

i i i x y f y x f x x ?=??=

-??

∑. 定义集值映射:2X

G X →如下:

()()?

1

n

i

i i G x G x ==

∏.

则x *

是以上广义博弈的平衡点当且仅当x *

是拟变分不等式

(,)G ?的解(即()x G x *

*

∈, 且()y G x *

?∈,有(,)0x y ?*

≤).

1954年, Arrow 和Debreu[10]正是应用广义博弈平衡点的存在性证明了数理经济学中一般均衡的存在性, Arrow 和Debreu 也主要是因为这项杰出的工作而分别在1972年和1983年获得Nobel 经济奖. 更加详尽的研究见[11].

[10]K.J.Arrow,G .Debreu,Econometrica,22(1954),165-290.

[11]A.Mas-Colell,M.D.Whinston,J.R.Green,MicroeconomicTheoy,1995(

有中译本,刘文忻,李绍荣主译2001) .

以下是著名的Fan-Glicksberg 不动点定理, Fan -Browder 不动点定理和Ky Fan 不等式: (1) Fan-Glicksberg 不动点定理

设X 是Hausdorff 局部凸空间E 中的非空凸紧集, 集

值映射:2X

F X →是上半连续的,且x X ?∈, ()F x 是X 中的非空凸紧集, 则*

x X ?∈, 使*

*

()x F x ∈.

(2) Fan -Browder 不动点定理

设X 是Hausdorff 线性拓扑空间E 中的非空凸紧集, 集值映射:2X

F X →满足

1)x X ?∈, ()F x 是X 中的非空凸集, 2)y X ?∈, {}1

():()F

y x X y F x -=∈∈是X 中的开集,

则*

x X ?∈, 使**

()x F x ∈. (3) Ky Fan 不等式

设X 是Hausdorff 线性拓扑空间E 中的非空凸紧集,

:f X X R ?→满足

1)x X ?∈, (),y f x y →在X 上是下半连续的, 2)y X ?∈, (),x f x y →在X 上是拟凹的, 3)x X ?∈, (),0f x x ≤,

则*

y X ?∈, 使x X ?∈, 有*

(,)0f x y ≤.

应用以上三个结果,可以证明以下二人零和博弈平衡点存在性定理, n 人非合作博弈Nash 平衡点存在性定理和广义博弈的平衡点存在性定理. (1)二人零和博弈鞍点存在性定理

设X 和Y 分别是Hausdorff 线性拓扑空间E 和F 中的非空凸紧集, :f X Y R ?→满足

1) x X ?∈, (),y f x y →是下半连续和拟凸的, 2)y X ?∈, (),x f x y →是上半连续和拟凹的, 则*

*

(,)x y X Y ?∈?, 使(,)x y X Y ?∈?, 有

****

(,)(,)(,)f x y f x y f x y ≤≤.

(2) n 人非合作博弈Nash 平衡点存在性定理

设{}1,,N n = 是局中人的集合,i N ?∈, 设i X 是

Hausdorff 线性拓扑空间i E 中的非空凸紧集,

1

:n

i i i f X X R ==

→∏

连续, 且??i i x X ?∈, ()?,i i i i u f u x →在

i X 上是拟凹的, 则()1,,n x x x X *

*

*

?=∈ , 使i N ?∈, 有

()()?

?,m ax ,i i

i i i i i i u X f x x f u x *

*

*

∈=.

(3) 广义博弈的平衡点存在性定理

设{}1,,N n = 是局中人的集合, i N ?∈, 设i X 是Hausdorff

局部凸空间i E 中的非空凸紧集,

1

:n

i i i f X X R ==

→∏

连续, 且??i i x X ?∈, ()?,i i i i u f u x →在

i X 上是拟凹的,集值映射 ?:2

i

X i i G X →连续, 且

??i i x X ?∈,()?i i G x 是i X 中的非空凸紧集, 则

()1,,n x x x X *

*

*

?=∈ , 使i N ?∈, 有()?i i i x G x *

*

∈, 且

()

()

()?

?

?,m ax

,i i i i i i i i i u G x f x x f u x *

*

*

*

∈=.

当然以上存在性定理都可以有不少推广,我们做过不少工作,例如见[12].

[12]K.K.Tan,J.Yu,X.Z.Yuan,Inter.J.Game Theory,24(1995),217-222.

(三)

目前博弈论的难题是一个博弈可能有多个平衡点而如何选取的问题.

对矩阵博弈,或者更广泛的二人零和博弈,这个难题不存在. 设X 和Y 分别是局中人1和局中人2的策略集,

:f X Y R ?→是局中人1的支付函数,记()S

f 是

f 在

X Y ?中的鞍点全体. 可以容易地证明,如果()()11,x y S

f ∈,

()()22,x y S f ∈, 则()()12,x y S f ∈,()()21,x y S f ∈, 且

()()()()11221221,,,,f

x y f

x y f

x y f

x y =

=

=

. 这说明即使

f 在X Y ?中的鞍点不唯一,也不存在如何合理选取的问题,

因为局中人1选择策略1x 或2x , 局中人2选择策略1y 或2y ,得到的都是鞍点,且无论在哪个鞍点处, 局中人1和局中人2得到的支付都是相等的.

以上结果对双矩阵博弈就不成立. Nash 平衡点太多了,应当加以精练, Selten 在1975年给出了以下完美平衡点的概念[13].

[13]R.Selten, Inter.J.Game Theory,4(1975),25-55.

以双矩阵博弈为例:

设局中人1和局中人2都不是完全理性的,而是有限理性的,是可能犯错误的,在他们作出决策时可能会发生某种“颤抖”. 设0ε>足够小(满足1m ε<, 1n ε<), 而

()

()11

,,:,1m

m i i i X x x x x x εε===≥=??

????∑ 是扰动博弈中局中人1的策略集,

()

()11

,,:

,1n

n j j j Y y y y y y ε

ε===≥=??

???

?

是扰动博弈中局

中人2的策略集.

扰动博弈必存在Nash 平衡点()()(),x y εε.如果

(),x y

*

*

是当0k ε→时()()(),k k

x y εε的一个极限点, 即(),x y *

*

是当局中人1和局中人2犯错误的概率逐渐减小, “颤抖”逐渐消失时被扰动博弈平衡点的极限点, 则称(),x y **

原博弈的一个完美平衡点. Selten 证明了完美平衡点必存在. 这种经扰动而回复的平衡点, 当然具有一种稳定性. 用这种方法, Selten 就删除了一些不稳定的平衡点, 使太多了的Nash 平衡点得到了一种精炼.

实际上,中国数学家吴文俊和江加禾[14]早在1962年就给出了一个深刻的结果.为了研究Nash 平衡点的稳定性, 他们对n 人有限非合作博弈引入了本质平衡点和本质博弈的概念, 并证明了任意有限非合作博弈都可以用一列本质博弈来任意逼近,而他们是应用[15]中关于本质不动点的结果而得到这一结果的.

[14]W.T.Wu,J.H.Jiang,Scientia Sinica,11(1962),1307-1322. [15]M.K.Fort,Amer.J.of Math,72(1950),315-322.

以双矩阵博弈为例, (,)x y X Y ?∈?,定义映射

(,)(,)f x y x y ''=如下:

1

111

111m ax (0,)

1m ax (0,)

n

m

n

i ij j ij

i j j i j i m

n

m

n

ij

j ij

i j i j i j x c y c

x y x c

y c x y =======+-'=

+

-

∑∑∑∑∑∑∑,

1,,i m

= ;

1

111

1

1

1

m ax (0,)

1m ax (0,)

m

m

n

j ij i ij

i j i i j j n

m

m

n

ij

i ij

i j j i i j y d x d

x y y d

x d

x y =======+-'=

+

-

∑∑∑∑∑∑∑,

1,,j n = .

容易验证: ()1,,m x x x X '''=∈ ;()1,,n y y y Y '''=∈ , ()(),,f

x y x y X Y ''=∈

?. Nash 早已证明, ()*

*

,x y

是双矩

阵博弈的平衡点当且仅当()*

*

,x y

是连续映射f 在X Y ?中

的不动点. [14]证明了由双矩阵博弈({}ij

c 和{}ij

d 确定)到连

续映射f 的映射是连续的,于是由[15]中本质不动点的结果即可推得双矩阵博弈本质平衡点的结果.

一般情况下,我们可以考虑定义在线性赋范空间凸紧集

X 上满足一定连续性和凸性条件的向量值函数1(,,)n f f f = 的集合Y ,在适当引进距离ρ之后, Y 成为一

个完备度量空间. ()N f 表示对应于博弈f (1,,n f f 分别表示n 个局中人的定义在X 上的支付函数)的所有Nash 平衡点所成之集.我们要问:当f 变化很小时,集合()N f 是否变化也很小?这当然是稳定性问题的研究. ()x N f ∈称为博弈f 的

本质平衡点,是指当f Y '∈充分接近f 时,有()x N f ''∈也充分接近x ;f 称为本质博弈,是指所有()x N f ∈都是博弈f 的本质平衡点.我们[16]证明了: f Y ∈是本质博弈当且仅当集值映射:2X

N Y →在f 是连续的;应用Fort 关于集值映射通有连续性(generic continuity)的结果[17],我们[16]还证明了:存在Y 中一个稠密剩余集Q (Q 称为剩余集,是指Q 包含一列在Y 中稠密开集的交集),使f Q ?∈,f 是本质博弈(因Q 在Y 中稠密,任一博弈f Y ∈当然可以用一列本质博弈来任意逼近),此时, lim ((),())0f f

h N f N f '→'=,其中h 是X 上的

Hausdorff 距离,博弈f 的Nash 平衡点集是稳定的.更加深入的研究可见[18][19],其中[19]是关于空间类的讨论.

[16]俞建,应用数学学报,16(1993),153-157. [17] M.K.Fort,Publ.Math.Debrecen,2(1951),100-102. [18]J.Yu,J of Mathematical Economics,31(1999),361-372. [19] J.Yu, X.Z.Yuan, Proc.Amer.Math.Soc,124(1996),3357-3359.

在Baire 分类的意义下,稠密剩余集Q 是第二类型的(第二纲的),即对大多数的博弈f Y ∈来说,它的Nash 平衡点集都是稳定的.

应用类似的方法,我们[20]还证明了:设X 和Y 分别是线性赋范空间E 和F 中的凸紧集,C 是满足一定连续性和凸性条件的函数f 的集合(在适当引进距离之后, C 成为一个完备度量空间),则存在C 中的一个稠密剩余集Q ,使

?∈,f在X Y

f Q

?中的鞍点是唯一的,即在Baire分类的意义上,对绝大多数的函数f C

∈,它的鞍点都是唯一的. [20]K.K.Tan,J.Yu,X.Z.Yuan,Bull.Polish Acad. of Sci. Mathematics,43(1995),119-129.

关于有限理性与平衡的稳定性的关系,还可见[21][22].

[21] C.Yu,J.Yu,Nonlinear Analysis,Theroy,Method s and Applications, 65(2006),583-592.

[22]C.Yu,J.Yu,Nonlinear Analysis,Theroy,Methods and A pplications,

67(2007),930-937.

在Selten之后, 考虑到各种形式的颤抖和扰动, 又有恰当平衡点[23]、序列平衡点[24]等精炼概念.

[23]R.B.Myerson, Inter.J.Game Theory,7(1978),73-80.

[24]D.Kreps,R.Wilson,Econometrica,50(1982),863-894.

1986年, 为了更加全面地研究Nash平衡点的稳定性, Kohlberg和Mertens[25]提出了这样的问题: 一个稳定的Nash 平衡点应该满足哪些必要的条件? 这是公理化的方法, 他们希望用这种方法对平衡点进行精炼. 通过细致的论证, 他们得出结论: 一般还不能将它精炼成单点集, 它只能是集值的,是所谓平衡点集的本质连通区. 因为在n人有限非合作博弈中,每个局中人的策略集均为单纯形, 支付函数也均为多项式, 其Nash平衡点集就必是等式和不等式的有限系统的解集,称为半代数集(semi-algebraic set). 他们首先应用代数几何的方法证明了: 任一n人有限非合作博弈,其平衡点集的连通区必为有限个, 然后证明了至少有一个是本质的. 这

一工作影响很大, 而他们的工作又被[26]等改进和推广. 更加深入的研究可见[27][28].

[25]E.Kohlberg,J.F .Mertens,Econometrica,54(1986),1003-1037. [26]J.Hillas,Econometrica,58(1990),1365-1390.

[27]J.Hillas,M.Jensen,J.Potters,D.Vermeulen,Mathematics of Operations Research,26(2001),611-636.

[28]https://www.wendangku.net/doc/c611240514.html,indan,R.Wilson,Proc.Nat.Acad.Sci.,102(2005),15706-15711.

实际上,江加禾早在1963年就证明了: 任一n 人有限非合作博弈的Nash 平衡点集的连通区中,至少有一个是本质的[29](他未对Nash 平衡的稳定性给出深入的背景分析,也未能证明任一n 人有限非合作博弈的Nash 平衡点集的连通区必为有限个),他是受[30]中关于不动点集本质连通区存在性结果的影响而得到这一结果的.

[29]J.H.Jiang, Scientia Sinica,12(1963),951-964. [30]S.Kinoshita,Osaka J.Math.,4(1952),19-22.

一般情况下,我们可以考虑定义在线性赋范空间凸紧集

X 上满足一定连续性和凸性条件的向量值函数1(,,)n f f f = 的集合Y ,在适当引进距离ρ之后, Y 成为一

个距离空间. ()N f 表示对应于博弈f (1,,n f f 分别表示n 个局中人的定义在X 上的支付函数)的所有Nash 平衡点所成之集.将()N f 作以下分解:

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

完全信息和不完全信息-博弈论相关

3、完全信息和不完全信息: 完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。 在不完全信息博弈里,至少有一个参与人不知道其他参与人的支付函数。 温泉信息是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。显然不完全信息意味着不完美信息,但逆命题不成立。 12、完美和不完美信息: 不完美信息指的是自然做出了它的选择,但是其他选择人并不知道它的具体选择是什么,金知道各种选择的概率分布。 完美信息:指一个参与人对其他参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。 2、贝叶斯均衡: 是纳什均衡在不完全信息博弈中的自然扩展。在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其他参与人实际上会选择什么策略,但是它能正确预测到其他参与人的选择如何以来与其各自的类型。这样,他决策的目标就是在给定自己的类型和别人的类型已从战略情况下最大化自己的期望效用 14、PBNE贝叶斯纳什均衡是这样一种类型依从战略组合:给定自己的类型和别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就是说没有人有积极性选择其他战略。 贝叶斯纳什均衡:P147 4、有限次重复博弈: 16、重复博弈是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。定理:令G是阶段博弈,G(T)是G重复T次的重复博弈(T小于正无穷)。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都是一次性博弈的均衡结果)。 7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。 激励相容约束也是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望他选择的行动。显然,只有代理人选择委托人所希望的行动是得到的期望效用不小于他选择其他行动是得到的期望效用时,代理人才有积极性选择委托人所希望的行动。满足激励相容约束的机制称为可实施机制。 8、似然率f l/f h:统计学上,似然率度量给定代理人选择a=L时PAI发生的概率与给定代理人选定a=H是PAI发生的概率的比率,它告诉观测者观测到的PAI在多

完全信息和不完全信息博弈论相关

3、完全信息与不完全信息: 完全信息博弈的基本假设:所有参与人都知道博弈的结构、博弈的规则,知道博弈支付函数。 在不完全信息博弈里,至少有一个参与人不知道其她参与人的支付函数。 温泉信息就是指自然不首先行动或自然的促使行动被所有参与人观测到的情况,即没有事前的不确定性。显然不完全信息意味着不完美信息,但逆命题不成立。 12、完美与不完美信息: 不完美信息指的就是自然做出了它的选择,但就是其她选择人并不知道它的具体选择就是什么,金知道各种选择的概率分布。 完美信息:指一个参与人对其她参与人(包括虚拟参与人“自然”)的行动选择有准确了解的情况,即每一个信息集只包含一个值。 2、贝叶斯均衡: 就是纳什均衡在不完全信息博弈中的自然扩展。在静态不完全信息博弈中,参与人同时行动么有机会观察到别人的选择。给定别人的战略选择,每个参与人的概率分布而不知道其真实类型不可能准确的知道其她参与人实际上会选择什么策略,但就是它能正确预测到其她参与人的选择如何以来与其各自的类型。这样,她决策的目标就就是在给定自己的类型与别人的类型已从战略情况下最大化自己的期望效用 14、PBNE贝叶斯纳什均衡就是这样一种类型依从战略组合:给定自己的类型与别人类型的概率分布的情况下,每个参与人的期望效用达到了最大化,也就就是说没有人有积极性选择其她战略。 贝叶斯纳什均衡:P147 4、有限次重复博弈: 16、重复博弈就是指同样结构的博弈重复多次,其中每次博弈成为“阶段博弈”。定理:令G就是阶段博弈,G(T)就是G重复T次的重复博弈(T小于正无穷)。那么,如果G有唯一的纳什均衡,重复博弈G(T)的唯一的子博弈纳什均衡结果就是阶段博弈G的纳什均衡重复T次(即每个阶段博弈出现的都就是一次性博弈的均衡结果)。 7、激励相容:当参与人之间存在信息不对称时,任何一种有效的制度安排都必须满足“激励相容”条件。 激励相容约束也就是委托人设计机制时要考虑的第二个约束:给定委托人不知道代理人的类型时,代理人在所涉及的机制下必须有积极性选择委托人希望她选择的行动。显然,只有代理人选择委托人所希望的行动就是得到的期望效用不小于她选择其她行动就是得到的期望效用时,代理人才有积极性选择委托人所希望的行动。满足激励相容约束的机制称为可实施机制。 8、似然率f l/f h:统计学上,似然率度量给定代理人选择a=L时PAI发生的概率与给定代理人选定a=H就是PAI发生的概率的比率,它告诉观测者观测到的PAI在多大

博弈论信息经济学知识点

博弈论与信息经济学 完全信息静态博弈 考察占优战略均衡概念及求解 解题思路:理性参与人做出是最优选择,该博弈存在占优战略均衡,据此可知答案为(3)。 考察重复剔除劣战略占优战略均衡概念及求解 说明:考察重复剔除劣战略,求解占优均衡的方法。答案:(U,L) 下面考察PNE及其解法

妻子 丈夫 (a )请检验,纳什均衡(最优战略组合)是同生共死;均衡结果是同生,或者共死; (b )请检验,占优均衡(占优战略组合)是坚强活着;均衡结果是同生(互相煎熬); (c )请检验,纳什均衡(最优战略组合)是你死我活;均衡结果是死活,或者活死; 显然,(c )情形之下,二人之间的仇恨比(b )中更深。 一些类型的博弈中,PNE 未必存在。以下考察MNE 及其解法 说明:猜谜游戏,是一种典型的零和博弈。这类博弈没有纯战略NE ,但是却存在混合战略 (c ) 活着 死了 (b ) 活着 死了 活着 死了 (a ) 活着 死了 活着 死了

NE。希望大家通过这个例子,加深对NE的概念及NE存在性定理的理解。同时,混合战略NE求解也是本题考察点。以下两个例子,与此相同,供大家练习使用。 模型化如下博弈:两个小朋友一起做猜拳游戏,每人有三个纯战略:石头、剪刀、布。胜负规则为:石头胜剪刀,剪刀胜布,布胜石头,如二人出手相同则未分胜负。二人同时出手。胜者的支付为1,负者的支付为-1,未分胜负时支付均为0。(1)请写出该博弈的支付矩阵,并判断其是否存在占优战略均衡。(2)该博弈是否存在纯战略纳什均衡,是否存在混合战略纳什均衡?如果存在,请写出。 下例来自张维迎,P131。 美国普林斯顿大学“博弈论”课程中有这样一道练习题:如果给你两个师的兵力,你来当司令,任务是攻克“敌人”占据的一座城市。而敌人的守备是三个师,规定双方的兵力只可整师调动,通往城市的道路有甲、乙两条,当你发起攻击时,若你的兵力超过敌人你就获胜;若你的兵力比敌人守备部队兵力少或者相等,你就失败。你如何制定攻城方案? 与零和博弈不同,有些博弈既有PNE,又有MNE。如以下性别战博弈和斗鸡博弈。 性别战博弈:

浅析价格战中的博弈论

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流治理(采购与供应链1班) 学号:1040407122 姓名:曾维乐

二〇一一年十二月十八日 价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。

关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单讲来确实是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自同意选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中能够看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(能够是个人,也能够是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所明白的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

《博弈论与信息经济学》习题库

上海师范大学商学院 任课教师:刘江会 2010-2011学年第一学期 《博弈论与信息经济学》习题 一.判断下列表述是否正确,并作简单讨论: 1.有限次重复博弈的子博弈完美纳什均衡每次重复采用的都是原博弈的纳什均衡。 答:不一定。对于有两个以上纯策略纳什均衡的条件下就不一定。如“触发策略”就不是。 2.有限次重复博弈的子博弈完美纳什均衡的最后一次重复必定是原博弈的一个纳什均衡。 答:是,根据子博弈完美纳什均衡的要求,最后一次必须是原博弈的一个纳什均衡。 3.无限次重复博弈均衡解的得益一定优于原博弈均衡解的得益。 答:错。如严格竞争的零和博弈就不优于。 4.无限次重复古诺产量博弈不一定会出现合谋生产垄断产量的现象。 答:正确。合谋生产垄断产量是有条件的,由贴现率来反映,当不满足条件时,就不能构成激励。 5.如果博弈重复无限次或者每次结束的概率足够小,而得益的时间贴现率 充分接近1,那么任何个体理性的可实现得益都可以作为子博弈完美纳什均衡的结果出现。

答:这就是无限次重复博弈的民间定理。 6.触发策略所构成的均衡都是子博弈完美纳什均衡。 答:错误。触发策略本身并不能排除重复博弈中不可信的威胁和承诺,因此由触发策略构成的不一定是子博弈完美纳什均衡。 7.完全但不完美信息动态博弈中各博弈方都不清楚博弈的进程,但清楚博弈的得益。 答:不一定,不是所有博弈方都不清楚博弈的进程,只要有一个博弈方都不完全清楚博弈的进程。 8.不完美信息动态博弈中的信息不完美性都是客观因素造成的,而非主观因素造成。 答:错。信息不完美很多是人为因素所造成的,因为出于各自的动机和目的,人们在市场竞争或合作中常常会故意隐瞒自己的行为。 9.在完全但不完美信息动态博弈中,若不存在混合策略,并且各博弈方都是主动选择且行为理性的,则不完美信息从本质上说是“假的”。 答:正确。因为只包含理性博弈方的主动选择行为,利益结构明确,而且不同路径有严格优劣之分,从不需要用混合策略的动态博弈来说,所有博弈方选择的路径都可以通过分析加以确定和预测,根本无须观察。从这个意义上说,这种博弈的不完美信息实际上都是假的。 10.子博弈可以从一个多节点信息集开始。 答:不能从多节点信息集开始,因为多节点必然分割信息集。 11.不完美信息指至少某个博弈方在一个阶段完全没有博弈进程的信息。 答:不是完全没有博弈进程的信息,而是没有完美的信息,只有以概率判断

博弈论在经济学中的应用

博弈论在经济学中的应用 刘肃素 (华中师范大学经济与工商管理学院 2011211086) 摘要:博弈论是研究策略博弈的数学理论,亦称对策论。它的作用在于发现普遍有效的博弈原则。在现代经济社会中充满了博弈,这就需要了解博弈的思想,用科学理论来指导行为。博弈论应用于经济学,已经和正在引起现代经济学一系列的发展和突破。博弈论在经济学中所取得的重大进展发现,博弈论方法越来越成为经济学研究的主流方法。随着博弈论在现代经济学中的运用和研究的深化以及经济复杂性现象的不断涌现,博弈论的经济学研究呈现出合作化、对称化和连续化的发展新趋势。 关键词:博弈论经济学对策论应用 Abstract:game theory is the mathematical theory of research strategy game, which is also called game theory. It is found that the average effective principles of game. In the modern economic society is full of game, this game, you need to understand in a scientific theory to guide behavior. Game theory is applied to economics, has been and is causing a series of modern economics development and breakthrough. Major progress was made in the game theory in economics, found that the game theory method is becoming the mainstream in the economics research method. With

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

价格战中博弈论的浅析

价格战中博弈论的浅析

价格战中博弈论的浅析 2011-2012学年第一学期 课程名称:博弈论 班级:10物流管理(采购与供应链1班) 学号:1040407122 姓名:曾维乐 二〇一一年十二月十八日

价格战中的博弈论浅析 摘要:博弈论研究互动决策行为,大多数时候是研究对抗性行为,但并不是所有的对抗行为。博弈论是运筹学的一个重要分支,类型众多。本文在简要介绍了博弈论相关内容的基础上,重点介绍了纳什均衡。通过案例,充分运用囚徒困境、智猪博弈、反向归纳法等进行分析,从而得出在经济决策中行为人如何决定最优决策的方法。在此基础上,结合博弈论相关知识,分析解决经济生活中的一些实际问题。如:针对商家的价格战问题。 关键词:囚徒困境懦夫博弈安全博弈纳什均衡 一、理论介绍 1、博弈论简介 博弈论(game theory),也称对策论,它是运筹学的一个重要分支,是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题,简单说来就是一些个人或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,各自取得相应结果的过程。 从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、

博弈论经典案例《智猪博弈》

在经济学中,在经济学中,智猪博弈”(PigS ' PayoffS(BoXed PigS) 是一个著名博弈论例子。 这个例子讲的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将选择搭 便车”策略,也就是舒舒服服地等在食槽边;而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。 小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之 间的距离。 如果改变一下核心指标,猪圈里还会出现同样的小猪躺着 大猪跑”的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半分量。结果是小 猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡

献食物,所以谁也不会有踩踏板的动力了。 如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然 是失败的。 改变方案二:增量方案。投食为原来的一倍分量。结果是小 猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的 共产主义”社会,所以竞争意识却不会很强。 对于游戏规则的设计者来说,这个规则的成本相当高(每次提供双份的食物);而且因为竞争不强烈,想让猪们去多踩踏板的效 果并不好。 改变方案三:减量加移位方案。投食仅原来的一半分量,但同时将投食口移到踏板附近。结果呢,小猪和大猪都在拼命地抢着踩踏板。等待者不得食,而多劳者多得。每次的收获刚好消费 宀 完。 对于游戏设计者,这是一个最好的方案。成本不高,但收获最 大。 原版的智猪博弈”故事给了竞争中的弱者(小猪)以等待为最佳策略的启发。但是对于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并不是最佳状态。为使资源最有效配置,规 则的设计者是不愿看见有人搭便车的,政府如此,公 司的老板也是如此。而能否完全杜绝搭便车”现象,就要看游戏 规则的核心指标设置是否合适了。

博弈论案例分析

博弈论案例分析 一、经济学中的“智猪博弈” (Pigs’payoffs) 故事背景:猪圈里有一头大猪和一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会落下少量的食物。如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略,答案是:小猪将选择“搭便车”策略,也就 是舒舒服服地等在食槽边; 而大猪则为一点残羹不知疲倦地奔忙于踏板和食槽之间。原因何在,因为,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。对小猪而言,无论大猪是否踩动踏板,不踩踏板总是好的选择。反观大猪,已明知小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,所以只好亲力亲为了。“小猪躺着大猪跑”的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次落下的事物数量和踏板与投食口之间的距离。如果改变一下核心指标,猪圈里还会出现同样的“小猪躺着大猪跑”的景象吗,试试看。改变方案一:减量方案。投食仅原来的一半分量。结果是小猪大猪都不去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,所以谁也不会有踩踏板的动力了。如果目的是想让猪们去多踩踏板,这个游戏规则的设计显然是失败的。改变方案二:增量方案。投食为原来的一倍分量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方不会一次把食物吃完。小猪和大猪相当于生活在物质相对丰富的“共产主义”社会,所以竞争意识却不会很强。对于游戏规则的设计者来说,这个规则的成相当高(每次提供双份的食物) ;而且因为竞争不强烈,想让猪们去多踩踏板的

博弈论与信息经济学 课后答案

张1.5 假定消费者从价格低的厂商购买产品,如果两企业价格相同,就平分市场,如果企业i 的价格高于另一企业,则企业i的需求量为0,反之,其它企业的需求量为0。因此,企业i

的需求函数由下式给出: i i i i i i i i p pi p p p p 0)/2Q(p ) Q(p q --->=c 那么每家企业的利润02 i i j i p c q ππ-== >,因此,企业i 只要将其价格略微低于其它企业就将获得整个市场的需求,而且利润也会上升至 ()()22 i i i i p c p c Q p Q p εε---->,()0ε→。同样,其它企业也会采取相同的策略,如果此下去,直到每家厂商都不会选择降价策略,此时的均衡结果只可能是p i =p j =c 。此时,企业i 的需求函数为2 i a c q -=。 张1.8

张2.3

张2.4

张 2.9 (1)由于古诺博弈的阶段均衡是1i a c q n -=+,此时的利润为2 1a c n -?? ?+?? ;若各家企业合作垄断市场,则此时的最优产量是()argmax i i i a nq c q ∈--?,可求得2i a c q n -= ,此时的利润为2 4a c n -?? ??? ,此时若有企业i 背叛,其产量就是()1 2 4j j i i a c q n q a c n ≠--+== -∑,其收益为()2 214n a c n +?? - ? ?? 。下面我们来看重复博弈下的古诺博弈。在这个博弈中,有两个博弈路径,我们分别进行讨论。 首先,在惩罚路径上,由于每个阶段参与企业选择的都是最优的产量,因此能够获得最优的收益,因此是均衡的。 其次,在合作路径上,只要合作的收益大于背叛的收益,则均衡也是可以实现的,这要 求:()2 2 2 211141411a c n a c a c n n n δδ-+-???? ??≥-+ ? ? ?--+??????,解得()1 2411n n δ-??≥+??+???? 。 (2)伯川德博弈的阶段均衡是i p c =,此时参与者的利润均为0。若各企业合作,则此时的最优价格是:()()argmax i i i p p c a p ∈--,此时2i a c p -= ,则2i a c q n -=,利润

博弈论复习题及答案

一、名词解释(每题7分,共28分) 1、逆向选择:逆向选择源于事前的信息不对称,经典例子就是“柠檬市场”——二手车市场,它使得市场资源逐渐流向低质量的产品或要素,最后形成劣货驱逐良货的局面,这种现象称之为“逆向选择”。 2、策略互动:所谓策略互动,就是参与人之间的策略相互影响、相互作用和相互制约。用策略性思维来分析问题,从中找出合理策略,实现目标最优。 3、纳什均衡:对于博弈方而言,互为最优的策略选择就是纳什均衡。 4、信号发送:是指信息优势方不断发出信息的行为,就叫信号发送。 5、博弈论:研究人们如何进行决策,以及这种决策如何达到均衡(合理策略)的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。 二、简要回答问题(每题10分,共40分) 1、博弈的基本要素有哪些?基本特点是什么? 答:博弈的基本要素有:参与人、策略、行动顺序、信息、收益等五个要素。博弈的基本特点则是需尽可能考虑到博弈对方的决策选择以及对自身的影响,并从中选择出对自身最有利的方案决策,从而达到收益和效用最大化。 2、什么是性别战博弈?请求出其中的纳什均衡? 答:性别战博弈是不可调和的博弈,双方只有一方选择满足另外一方的要求才能达成均衡,也就是混合策略纳什均衡;故性别战博弈的纳什均衡会有两种情况,分别是:男生陪女生看电影以及女生陪男生看足球的两种选择。 3、猎鹿博弈反映的基本思想是什么? 答:反应的基本思想是需要沟通和互相协调,因为只有合作才能猎到所需猎物。

博弈论与信息经济学答案

第一章 5. n 个企业,其中的一个方程:π1=q 1(a -(q 1+q 2+q 3……q n )-c ),其他的类似就可以了,然后求导数,结果为每个值都相等,q 1= q 2=……q n=(a-c)/(n+1)。或者先求出2个企业的然后3个企业的推一下就好了。 6.假定消费者从价格低的厂商购买产品,如果两企业价格相同,就平分市场,如果企业i 的价格高于另一企业,则企业i 的需求量为0,反之,其它企业的需求量为0。因此,企业i 的需求函数由下式给出: i i i i i i i i p pi p p p p 0)/2Q(p ) Q(p q --->=c 那么每家企业的利润02 i i j i p c q ππ-== >,因此,企业i 只要将其价格略微低于其它企业就将获得整个市场的需求,而且利润也会上升至()()22 i i i i p c p c Q p Q p εε---->,()0ε→。同样, 其它企业也会采取相同的策略,如果此下去,直到每家厂商都不会选择降价策略,此时的均衡结果只可能是p i =p j =c 。此时,企业i 的需求函数为2 i a c q -= 。 在静态的情况下,没有一个企业愿意冒险将定价高于自己的单位成本C ,最终P=C ,利润为0。因为每个参与人都能预测到万一自己的定价高于C ,其他人定价为C 那么自己的利益就是负的(考虑到生产的成本无法回收)。就算两个企业之间有交流也是不可信的,最终将趋于P=C 。现实情况下一般寡头不会进入价格竞争,一定会取得一个P 1=P 2=P 均衡。此时利润不为零,双方将不在进行价格竞争。 7.设企业的成本相同为C ,企业1的价格为P 1,企业2的价格为P 2。

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

耶鲁大学公开课博弈论课习题

耶鲁大学公开课:博弈论 习题集1(第1-3讲内容) Ben Polak, Econ 159a/MGT522a. 由人人影视博弈论制作组Darrencui翻译 1.严格劣势策略与弱劣势策略:严格劣势策略的定义是什么?弱劣势策略的定义是什么?请用 一个包含两个参与人的博弈矩阵来举例说明,要求其中一个参与人有三个策略且三者之一为严格 劣势策略;另一个参与人有三个策略但三者之一为弱劣势策略。请指出你所举例子中的劣势策略。 2.迭代剔除(弱)劣势策略:请看下面的博弈 2 (a). 这个博弈中是否存在严格劣势策略和弱劣势策略?如果存在,请指出并说明。 (b). 剔除掉严格劣势策略和弱劣势策略之后,在简化的博弈中是否还有劣势策略呢?如果是,请指出并说明。最后哪些策略不会被剔除呢? (c). 回顾你第一次剔除劣势策略时哪些策略是劣势策略并给出解释。把它与第二次剔除的劣势策略作比较。从中你能得出关于迭代剔除劣势策略的何种结论? 3. 霍特林的选址博弈(也称霍特林模型):回顾一下课堂中所讲的选票博弈。其中有两个参与人,每个参与人都从集合* +中选出自己的立场。这十个立场均分全部的选票。选民把选票投给与自己立场最接近的候选人。如果两个候选人站在同一个立场上,那么持该立场选民 的选票平均分给每个候选人。候选人想要最大化自己的得票率。举例来说,()。而 () [提示:回答这道题时不必画出整个矩阵] (a).课堂中我们指出立场2严格优于立场1,而实际上还有其它的立场也是严格优于立场1的,请找出所有优于立场1的立场并作出解释。 (b).假设现在有三名候选人。举例来说,()而()。此时立场2是否严格优于立场1?立场3呢?请作出解释。另外,假设我们剔除了立场1和10,但是该立场的选票依然存在。在简化的博弈中,立场2是否严格劣于或弱劣于其它(纯)策略?请作出解释。

《博弈论与信息经济学》课程论文

《博弈论与信息经济学》课程论文 2014-2015(1) 学院:生命科学学院 专业:生态学 年级: 2011级 学号: 1107040029 学生姓名:李贵阳 任课教师:胡鸣 2014年12月

论博弈论中的策略思维 李贵阳 贵州大学生命科学学院(550025) 内容摘要:博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。本文从合作、模仿、创新、拍卖、战争和群居等实例表明博弈论中的策略思维是如何影响人们的行为的。 关键词 :博弈论策略思维 博弈论源于历史上一些颇为有趣的游戏, 但同时也是一门学问艰深的理论。那么博弈论为什么能在经济学领域产生如此巨大的影响呢 ? 又何以在经济分析中独辟蹊径,形成了能与 (随机 )一般均衡理论相对立的另一种经济学研究范式? 这恐怕还得益于博弈论的起源和其中蕴含的策略思维。博弈论从本质上讲是一种游戏理论, 在给定游戏的特定规则 (信息结构 )下, 游戏参与人要想赢得游戏就必须对其他参与人的心理和可能采取的行动进行反复揣摩, 并据此决定和调整自己的行为 ,这就是制定策略或对策的过程。为此, “博弈论”一般也称为“对策论”或“游戏理论”。加之博弈论的游戏情节一般也源于人们的真实生活, 是生活环境的抽象和概念化, 因此, 博弈的结果不仅仅是游戏胜败的表现, 而且更是生活哲理的凝结 ,它为人们深刻理解和准确把握各类社会经济现象提供了一份独特的视角,同时对制定社会规则和经济政策具有现实的指导意义。 一、“囚徒困境”:合作还是不合作 考虑这样一种情形,小偷甲和乙联手作案 ,私入民宅被警方逮住, 但未获证据。警方将两人分别置于两所房间分开审讯。若一人招供但另一人不招, 则招

博弈论习题

博弈论习题 一、判断题 1、纳什均衡即任一博弈方单独改变策略都只能得到更小利益的策略组合。 2、若一博弈有两个纯战略纳什均衡则一定还存在一个混合战略纳什均衡。 3、博弈中混合策略纳什均衡一定存在,纯策略的不一定存在。 4、后行为的博弈方可以先观察到对方行为后再做选择,因此总是有利的。 5、如果扩展式博弈的一个策略组合不仅在均衡路径上是纳什均衡,而且在非均衡路径上也是纳什均衡,就是该扩展式博弈的一个子博弈精炼纳什均衡。 6、逆向归纳法并不能排除所有不可置信的威胁。 7、如果阶段博弈有唯一的纳什均衡,对于一个有限次重复博弈来说,重复阶段博弈中的纳什均衡是完善纳什均衡路线的唯一的子博弈精炼纳什均衡。 8、无限次重复博弈的均衡解一定优于原博弈均衡解的收益。 9、所有博弈方都有关于收益的信息,至少部分博弈方缺乏博弈进程信息的扩展式博弈,称为完全但不完美信息扩展式博弈。 10、不完美信息扩展式博弈中的信息不完美性都是客观因素造成的。 11、子博弈可以从一个多节点信息集开始。 12、不完美信息是指至少某个博弈方在一个阶段完全没有博弈进程的信息。 13、在贝叶斯博弈中之所以博弈方需要针对自己的所有可能类型都设定行为选择,而不是只针对实际类型设定行为选择,是因为能够迷惑其他交易方,从而可以获得对自己更有利的均衡。 14、古玩市场的交易中买卖双方的后悔都来自于自己对古玩价值判断的失误,若预先对价值的判断是正确的,那么交易者肯定不会后悔。 15、只要消息的发送者和接手者的利益不是对立的,那么肯定能传递一些信息。 16、教育程度在劳动力市场招聘员工时受到重视的理由是,经济学已经证明教育对于提高劳动力素质有不可替代的作用。 17、引入“自然”这个虚拟参与者后,不完全信息博弈与不完美信息博弈基本上是相同的。 18、因为零和博弈中博弈方之间关系都是竞争性的、对立的,因此零和博弈

相关文档
相关文档 最新文档