文档库 最新最全的文档下载
当前位置:文档库 › 《博弈论原理模型与教程》第06章扩展式博弈第01节.

《博弈论原理模型与教程》第06章扩展式博弈第01节.

《博弈论原理模型与教程》第06章扩展式博弈第01节.
《博弈论原理模型与教程》第06章扩展式博弈第01节.

《博弈论:原理、模型与教程》

第二部分完全信息动态博弈

第6章扩展式博弈

(已精细订正!)

对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。

前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。

但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。

本章将介绍一种新的博弈问题描述方式—扩展式博弈。从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。

6.1 扩展式博弈(文字描述、博弈树描述)

所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。

一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题:

(1)每个参与人在什么时候行动(决策、选择);

(2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。

[注:

行文中频繁出现的“行动”一词,有两义:

其一,动词的“行动”,指选择、决策。

其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。]

上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。

定义6 – 1 扩展式博弈包括以下要素: (1)参与人集合{1,2,...,}n Γ=;

(2)参与人的行动顺序,即每个参与人在何时行动;

(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息(集); (4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。

从上述定义可以看到:如果要用扩展式博弈对一个博弈问题进行建模(或者描述),那么除了要说明博弈问题所涉及的参与人及每位参与人的支付函数以外,还必须对博弈过程中参与人所遇到的决策问题的序列结构进行详细的解释,说清楚每个参与人在何时行动,以及参与人行动时可供选择的行动方案和所了解到的信息。

【例6-1】 考察一个“新产品开发博弈”。试用扩展式博弈对两个企业都知道市场需求且企业同时决策的博弈情形,即完全信息静态的“新产品开发博弈”进行建模。

??

?

?

???

???????????。为):不投入资金,利润不开发(万元开发,赔企业万元不开发,获利润

企业需求小元开发,获利润企业万元不开发,获利润

企业需求大元资金投入)

开发(企业040022002300280022000:1b a 图1-1 新产品开发的投入-产出图

解:

文字描述如下:

根据定义6-1,完全信息静态的“新产品开发博弈”的扩展式博弈包括以下要素: (1)参与人是企业1和企业2;

(2)两个企业同时行动,即同时选择产量;

(3)每个企业行动时有两种选择—“开发”和“不开发”,并且每个企业行动时不知道对方的选择1; (4)两个企业的支付如图1-1所示。

1 注意,虽然此时每个企业都不知道对方的选择,但用扩展式博弈进行建模时仍然假设参与

人都同时看到了图1-1所示的投入-产出图,即图1-1对两个企业来说为共同知识。

??

?

?

???

???????????。为):不投入资金,利润不开发(万元开发,赔企业万元不开发,获利润

企业需求小元开发,获利润企业万元不开发,获利润

企业需求大元资金投入)

开发(企业040022002300280022000:1b a 图1-1 新产品开发的投入-产出图

【例6-2】 继续考察“新产品开发博弈”。试用扩展式博弈对两个企业都知道市场需求且企业1先决策,企业2观测到企业1的选择后再进行选择的博弈情形,即完全信息动态的“新产品开发博弈”进行建模。 解:

文字描述如下:

根据定义6-1,完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素: (1)参与人是企业1和企业2; (2)企业1先行动,企业2后行动;

(3)企业1行动时有两种选择—“开发”和“不开发”,企业1行动时不知道企业2的行动;企业2行动时有两种选择—“开发”和“不开发”,但企业2行动时已经知道企业1的行动; (4)两个企业的支付仍然有如图1-1所示。

上述两个例子中,用文字描述的方法给出了博弈问题的扩展式描述。

对于一些简单的博弈问题,这种文字表述的方法也许是简单可行的。但可以想象,如果遇到的是更为复杂的博弈问题,如参与人人数大于2,每个参与人可以多次行动且每次行动时可供选择的行动方案不同等,文字描述所给出的模型就会显得繁冗拖沓,极不直观,因此 需要寻找一种简便易行的扩展式博弈的描述方式。

下面就以“新产品开发博弈”为例,介绍一种不仅简单方便,而且十分直观的扩展式博弈的描述方式—博弈树。

所谓博弈树,就是由结和有向枝构成的“有向树”。

图6-1给出的是当市场需求为大时,完全信息动态的“新产品开发博弈”的博弈树。

在图6-1所示的博弈树中,最上端的一个点1x (用空心圆表示)表示博弈的开始,将“企业1”标示在点1x 上,表示博弈开始于企业1的选择。企业1的选择有“开发”和“不开发”,分别用标有“开发”和“不开发”的有向枝表示。若企业1选择“开发”,则博弈从点1x 达到2x (用实心圆表示);若企业1选择“不开发”,则博弈从点1x 达到点3x (用实心圆表示)。点2x (或3x )上标有“企业2”,表示企业2在博弈到达点2x (或3x )时,即企业1选择“开发”(或“不开发”)后,再进行选择;企业2的行动也

有“开发”和“不开发”,同样分别用标有“开发”和“不开发”的有向枝表示。若企业2选择“开发”,则博弈从点2x (或3x )达到点4x (或6x )(都用实心圆表示);若企业2选择“不开发”,则博弈从点2x (或3x )达到点5x (或7x )(都用实心圆表示)。由于企业2选择后博弈结束,因此点4x 、5x 、6x 和7x 都表示博弈的结束。在点4x 、5x 、6x 和7x 旁标有支付向量,表示博弈达到该点时企业的所得。其中,支付向量中的第一个数字表示企业1的所得,第二个数字表示企业2的所得1

图6-1中,点1x 、2x 、3x 、4x 、5x 、6x 和7x 称为博弈树的结(node ),其中标有参与人(即企业)的结1x 、2x 和3x 称为决策结(decision node ),表示参与人在此选择行动;标有支付向量的结4x 、

5x 、6x 和7x 表示博弈结束,称为终点结(terminal node )。在决策结中,决策结1x 表示博弈的开始,

亦称为博弈树的初始结或根(root )。结与结的连线称为博弈树的枝(branch ),表示博弈从枝的一个结达到另一个结参与人需要选择的行动。例如,博弈从决策结1x 达到2x ,需要企业1选择行动“开发”,所以在连接1x 和2x 的枝上标有行动“开发”。在博弈树中,枝是有向的,表示博弈只能从枝的一个结达到另一个结。例如,在连接1x 和3x 的枝上,标有行动“不开发”,表示当企业1选择“不开发”时,博弈从1x 达到3x ,因此连接1x 到3x 的枝的方向是从1x 指向3x 。

1 一般情形下,支付向量中数字的顺序与博弈树中参与人的行动顺序相对应。

通过以上介绍,再考察图6-1中的博弈树,可以得到这样的信息: (1)博弈中的参与人是企业1和企业2; (2)博弈中企业1先选择,企业2后选择;

(3)企业1选择时有行动“开发”和“不开发”,企业2选择的行动有“开发”和“不开发”; (4)博弈中企业的支付。

也就是说,除了“企业2行动时是否观测到企业1的选择”这一点暂时无法从图6-1中知道以外,完全信息动态的“新产品开发博弈”的扩展式描述所需要的信息(或要素)都可以从图6-1中得到。

如果还能够直接从博弈树中知道“企业2行动时是否观测到企业1的选择”,那么给出博弈树,就意味着给出了完全信息动态的“新产品开发博弈”的扩展式描述。

下面探讨如何在博弈树中,将“企业2行动时是否观测到企业1的选择”这一信息表示出来。

在完全信息动态的“新产品开发博弈”中,企业2决策时企业1已经做出选择,此时企业2面临的决策情形无非只有以下两种: 第一种:企业2知道企业1的选择; 第二种:企业2不知道企业1的选择。

对于第一种情形,企业2知道企业1的选择,即知道企业1选择“开发”还是“不开发”,因此企业2知道博弈是从1x 到了2x 还是从1x 到了3x 。这就意味着当轮到企业2决策时,他知道自己是在点2x 上还是在点3x 上。对于第二种情形,企业2不知道企业1的选择,即不知道博弈是从1x 到了2x 还是从1x 到了3x 。因此,当轮到企业2决策时,他不知道自己是在点2x 上还是在点3x 上。所以,“企业2行动时是否观测到企业1的选择”这一问题,实际上就等价于“企业2行动时是否知道自己是在博弈树中的点2x 上还是在点3x 上”。

为了将“企业2行动时是否知道自己是在博弈树中的点2x 上还是在点3x 上”这一点说清楚,需要引入“信息集”(information set )的概念。

在博弈树中,参与人i 的一个信息集(用i I 表示)是参与人i 决策结的一个集合,它满足以下条件: (1)i I 中的每个决策结都是参与人i 的决策结;

(2)当博弈到达信息集i I (即博弈到达i I 中某个决策结)时,参与人i 知道自己是在信息集i I 中的决策

结上,但不知道自己究竟在i I 中哪个决策结上。

因此,参与人i 的信息集i I 可以用来描述当轮到参与人i 行动时他所了解到的信息,即他知道什么(知道自己位于哪一个信息集上)、不知道什么(不知道自己位于信息集中哪一个决策结上)。

例如,在“新产品开发博弈”中,假设企业1先行动,企业2后行动,但企业2行动时不知道企业1的行动,那么在如图6-1所示的博弈中当企业2行动时就只知道博弈要么到达点2x ,要么到达点3x ,但具体在哪一点上,企业2不清楚。也就是说,企业2只知道自己位于决策结集合23{,}x x 上,但不知道位于23{,}x x 中哪一个决策结上。在这种情况下,23{,}x x 就是企业2的一个信息集。如果假设企业2行动时知道企业1的行动,那么在如图6-1所示的博弈中,当企业2行动时就知道博弈是到达了点2x ,还是到达了点3x 。此时,企业2的决策结集2{}x 和3{}x 都是企业2 的信息集1

X

为一决策结集合,用

)(X I i 表示参与人i 的由决策结集X

构成的一个信息集。例如,

}{),(322x x I 表示企业2的由决策结集}{3

2,x x 构成的信息集,}{)(2

2

x I 和}{),(3

2

2

x x I 分别表示企业2

的由决结集}{2x 和}{3x 构成的信息集。

为了更好地理解信息集这个概念,考虑如图6-2所表示的博弈情形中参与人3的信息集2

(顺便考虑参与人2、参与人3的信息集)。

由于参与人3选择时,参与人1和参与人2都已经做出选择,因此参与人3选择时可能面临的决策情形就有以下4种:

(1)既知道参与人1的选择,也知道参与人2的选择; (2)知道参与人1的选择,但不知道参与人2的选择; (3)知道参与人2的选择,但不知道参与人1的选择; (4)既不知道参与人1的选择,也知道参与人2的选择。

1 注意,这是一种信息退化了的情况,即信息集中只含有一个决策结(亦称单结信息集)。此时,虽然信息集的定义要求参与人不知道自己在信息集哪一个决策结上,但由于只有一个决策结,实际上也意味着参与人知道自己在哪一个决策结上。

2 在图

6-2中,省略了参与人的支付,但这样并不影响对问题的分析。

下面对上述4种情形分别进行考察:

首先考察第二种情形,即参与人3知道参与人1的选择,但不知道参与人2的选择。

参与人3知道参与人1的选择,就意味着当轮到他选择时,他知道博弈进入了博弈的左边(如果参与人1选择L )还是右边(如果参与人1选择R );但由于参与人3不知道参与人2的选择,因此当轮到他选择时,他不知道自己是在4x 上还是在5x 上,或者6x 上还是7x 上。但是,参与人3知道自己要么就在4x 或者5x 上,要么就在6x 或者7x 上,所以参与人3的决策结集

}{5

4

,x x 和}{7

6,x x 都为参与人3的信息

集。在博弈树中,用虚线将属于同一信息集的决策结连起来,表示它们属于同一信息集。例如,6-2中,用虚线将点4x 和5x 连起来,表示它们都属于信息集}{5

4

,x x ,用虚线将点6x 和7

x

连起来,表示它们都

属于与信息集 }{76,x x 。

其次考察第三种情形,即参与人3知道参与人2的选择,但不知道参与人1的选择。

虽然参与人3知道参与人选择了 '

L 还是 '

R ,但由于他不知道参与人1的选择,因此当参与人2选择 '

L 时,参与人3知道自己是在4x 或者6x 上,但究竟在哪一点上参与人3并不清楚,所以决策集合

}{64,x x 是参与人3的一个信息集。当参与人2选择 'R 时,参与人3知道自己是在5x 或者7x 上,但

究竟在哪一个点上并不清楚,所以决策结集合

}{75,x x 是参与人3的另一个信息集。在图中6-3中,用

虚线将点4x 和6x 连起来,表示它们都属于信息集}{64,x x ,用虚线将点5x 和7x 连起来,表示它们都属

于信息集}{75,x x 。

考察第四种情形,即参与人3既不知道参与人1的选择也不知道参与人2的选择。

由于参与人1和参与人2的选择参与人3都不知道,因此当轮到参与人3行动时,他只知道自己位

于点

4x 、5x 、6x 和7x 四点中的某一点上,但究竟在哪一点上参与人

3并不清楚,所以决策结集合

}{7654,,,x x x x 是参与人3的一个信息集。在图6-4中,用虚线将点4x 、5x 、6x 和7x 连起来,表示

它们都属于信息集}{7654,,,x x x x 。

最后考察第一种情形,即参与人3既知道参与人1的选择也知道参与人2的选择。

由于参与人3既知道参与人1的选择,又知道参与人2的选择,因此当轮到参与人3行动时,他知

道自己在点4x 、5x 、6x 和7x 四点中的哪一点上,所以决策集合}{4x 、}{5x 、}{6x 和}{7x 都是参与

人3的信息集(参见图6-5)。

从上面分析可以看到:如果有了信息集这个概念,同时又在博弈中用特定的方式将信息标示出来1

,那么给出一个博弈问题的博弈树时,实际上就意味着给出了这个博弈问题的扩展事描述。例如,如果读者现在看到的是如图6- 2(或者图6-3、图6-4、图6-5)所示的博弈树,那么就应该从图6-2中得到一个博弈问题的扩展事描述,这种描述包含了扩展事博弈的所有要素。

当然,当采用“将参与人属于同一信息集的决策结用虚线连起来”的方式表示参与人的信息集时,在图6-~2

图6-5隐含了参与人2行动时已经观察到参与人1的行动,因为在图6-~2图6-5中,参

与人2的信息集都是单结信息集(即值包含一个决策结的信息集)2

【例6-3】 考察“新产品开发博弈”。试用博弈树描述“两个企业都知道市场要求,且企业1先决策,企业2观察到企业1的选择后在进行选择”的博弈情形。

1 即将属于同一信息集问题结用虚线连起来这种方式来标示博弈中的信息集。

2

在博弈考试时,最先行动的参与人知道自己在博弈树起始结进行选择,所以行动的参与人

的信息集都是单结信息集。

图6-1实际上已经给出了当市场需求为大时,“新产品开发博弈”的博弈树。

图6-6给出的是当市场需求为小时,“新产品开发博弈”的博弈树。

注意,在图6-6的博弈树中没有标示出枝的方向。在以后的讨论中,假设博弈树中的博弈都是从上往下进行的,因此在不引起歧义的情况下,都不标示出博弈树中枝的方向。

以上讨论了博弈问题的扩展式描述,并给出了扩展式博弈的一种直观描述方式—博弈树。由于在博弈分析中,假设博弈的结构(或描述方式)为共同知识,因此在以后的讨论中,如果给出博弈树,就意味着所有的参与人都同时一起看到博弈树。

在博弈分析中,除了前面-再提到的博弈结构和参与人完全理性为共同知识外,对于多阶段的动态博弈问题,一般还假设参与人满足“完美记忆”(perfect recall )的要求,即假设参与人不会忘记以前知道或者做过的事情。

在现实生活中,不满足“完美记忆”要求的情形比比皆是。例如,人们在玩卜克时,往往会忘记自己曾经出过什么牌或者对手曾经出过什么牌;在棋类比赛中,也会出现这种情况。但是,在博弈分析中,如果没有“完美记忆”假设,各种博弈结果都有可能出现,那么也就无法对博弈结果进行预测。

考察图6-7中的博弈树。在图6-7中,当参与人1第二次行动时,他分析不清决策结4x 和5x 及6x 和

7x ,这还容易理解,因为他不知道参与人2的选择。但是,他分不清决策结4x 和5x 及6x 和7x 就让人难

以理解了。这实际上意味着:参与人1第二次行动时忘了他第一次行动时的选择。所以,图6-7所表示博弈不满足“完美记忆”要求。

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

博弈论在多个领域中应用广泛

博弈论在多个领域中应用广泛,在管理中的以下方面受到了广泛关注。 (1>博弈论在区域创新中的应用 研究对象主要包括企业之间的博弈,企业与政府之间的博弈,政府之间的博弈。易余1}L运用演化博弈理论研究企业自主创新行为、模仿创新行为与市场结构 的演化,研究表明,在满足一定的条件下,市场中进行自主创新投资的企业的比例以及市场结构将演化稳定。政府的宏观调控对于企业自主创新行为以及市场结构的演化起着至关重要的作用。刘义建立博弈模型,通过研究区域创新系统内各个参与者的博弈,分析参与者共享隐性知识的可能性以及隐性知识应该怎样在这个系统内转移,对怎样才能更好地实现隐性知识在区域创新系统内共享提出对策。郭朝阳从技术创新成本的角度,建立了国内企业与国外企业技术创新竞争的静态博弈模型,根据模型,当国外企业以规模扩张为竞争目标时,我国企业只能选择渐进式的技术创新战略。技术创新是经济发展的动力和源泉,企业是技术创新的主体,但政府也应通过创新政策的介入来鼓励和促进企业的创新。由于企业和政府各自效用不同,从而对技术创新的投入战略不同,双方对技术创新投资时都本着自己效用最大化的原则,使其在投资决策中二者相互博弈,赵惠芳通过一个静态博弈模型分析并试解释某些现实经济现象。 (2>博弈论在人力资源管理中的应用 由于人力资源管理面对的对象主要涉及人与人之间的互动关系,所以用博弈论来研究人力资源管理中的一些问题能够较真实的模拟出管理情境,得出比较实际实用的结论。贾蔚使用博弈论的有关模型,对企业在人力资源管理过程中企业与其雇员之间的行为进行分析。张向前应用博弈论分析方法,在强调个人理性和政府、社会、企业理性矛盾基础上,研究分析人力资源管理中的公共资源等有关人力资源的若干问题,建立相应的分析模型,提出了解决问题的建议。涂锦分析了高校教师绩效的现状,在相关经济利益主体行为特征基础上建立高校人力资源

《博弈论原理模型与教程》第06章扩展式博弈第01节.

《博弈论:原理、模型与教程》 第二部分完全信息动态博弈 第6章扩展式博弈 (已精细订正!) 对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。 前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。 但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。 本章将介绍一种新的博弈问题描述方式—扩展式博弈。从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。 6.1 扩展式博弈(文字描述、博弈树描述) 所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。 一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题: (1)每个参与人在什么时候行动(决策、选择); (2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。 [注: 行文中频繁出现的“行动”一词,有两义: 其一,动词的“行动”,指选择、决策。 其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。] 上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。

博弈论战略分析入门

当当网购买 货到付款 点击查看详情 市场价:¥42.00 当当价:¥36.30 点击查看 本书简介 本书主要针对经济学专业入门课程和非经济专业学生编写,是一本全面介绍博弈论的具有指导意义的入门教材。 阐释清晰:本书以基础性知识作为重点,以清晰的思路和简洁明了的方法阐述了博弈论知识及其应用,并覆盖了所涉及的各个学科。全书讲解深入浅出,循序渐进,具有很强的逻辑性。每章开头的“预备知识”介绍了学习该章之前应该经已掌握的内容,增加了章节安排的灵活性;同样位于各章开头的“本章主要概念”介绍了该章将会出现的关键概念,以使学生对整章内容有所准备。 案例生动:案例是本书的一种重要讲解工具,涉及商业、拍卖、军事、生物学和博彩等方面,不仅使概念的引出更加出动,而且能够激发读者的全面思考。方便学生理解的应用实例及各章后面的“练习与讨论”,不仅进一步阐释了博弈理论,而且涉及不同的学科领域,既可以用来检验学生的

知识掌握程度,也可以作为教师的课堂问题。 结构科学:对一般的导论性教材中关未特别说明或不会涉及的概念、容易混淆的概念,本书也做了必要的解释。书中没有涉及过多、过于复杂的数学计算,而是设置了部分选修章节,介绍一些与概率相关的概念,详细分析解读,对于只想简单了解博弈论的读者来说,略去选修章节,其中,不会影响全书逻辑的连贯性。 目录 译者序 前言 第一部分 基本原理 第1章 冲突、战略与博弈 第2章 护展式博弈与标准式博弈 第二部分 标准式博弈的非合作均衡 第3章 占优战略与社会两难 第4章 纳什均衡 第5章 博弈论中的经典例子 第6章 三人博弈 第7章 概率与博弈论 第8章 混合战略纳什均衡 第9章 非合作均衡的深入讨论 第10章 双寡头垄断的战略与定价 第11章 多人博弈 第三部分 博弈的合作解 第12章 合作博弈的要素 第13章 核在经济学中的应用 第四部分 序贯博弈 第14章 序贯博弈 第15章 嵌套博弈 第16章 重要博弈 第17章 无限重要博弈 第五部分 博弈论的应用 第18章 博弈论、法律与社会机制设计 第19章 投票博弈 第20章 博弈与实验 第21章 拍卖 第22章 演进和有限理性学习 术语表 当当网购买 货到付款 点击查看详情

博弈论的形成和发展

博弈论的形成和发展 在西方社会科学中,博弈论被评为“纪念西方文明发展的十八座里程碑”奖章的第十七位荣膺者,也被认为是20世纪社会科学领域取得的最大成果。有许多学者甚至认为博弈论有可能成为研究所有社会科学的统一方法。 一、博弈论的形成和发展 1、博弈理论的早期研究。一般认为,对于博弈理论的最早研究可以追溯到18世纪初。瓦德格拉夫(Waldegrave)在1713年提出了两人博弈的极小化极大混合策略解。古诺(Cournot)和伯特兰德(Bertrand)分别在1838年和1883年提出了博弈论最经典的模型,两位学者分别从产量决策和价格决策分析垄断的双寡头竞争模型,确定了在竞争之下各自的最优反映函数。这些都是关于博弈问题的早期的零星研究。 2、博弈论发展的不同阶段。一般认为博弈论萌芽于20世纪20年代初。博弈论创立的标志是冯·诺伊曼和奥·摩根斯坦(Morgenstern)在1944年的《博弈论与经济行为》这部著作,他们的贡献现在看来主要是创立了博弈论研究的基本概念、二人零和博弈的完全解决和对合作博弈的贡献。现在应用更为普遍的非合作博弈理论的创立,则是以纳什(John Nash)1950年的博士论文《非合作博弈》为标志,该文的主要贡献是提出了纳什均衡的概念。此后(20世纪70年代),美国海萨尼(Harsanyi)和德国塞尔顿(Selten)的不完全信息博弈理论工作进一步完善了非合作博弈理论。当20世纪70年代经济学家开始将注意力由价格制度转向非价格制度时,博弈论逐渐成为经济学的基石。 1944年,冯·诺伊曼(V on Neumann)和奥·摩根斯坦(Morgenstern)合著的《博弈论与经济行为》被认为是博弈理论初步形成的标志。该书在总结以往关于博弈的研究成果的基础上,提出了博弈论的概念术语、一般框架和表述方法,提出了较系统的博弈理论。而且,在该书以前,博弈论主要是数学家们研究的课题,主要是一种数学理论而不是经济学理论。《博弈论与经济行为》极大地促进了博弈论和经济学研究的联系。从此,博弈论开始被经济学家们所接受,对博弈论的发展起了巨大的推动作用。虽然《博弈论与经济行为》的出版标志着博弈论的初步形成,但是这个时候的博弈论还是比较幼稚的,研究的范围也较小,总体影响也很小。研究的主要对象是少数类型的合作博弈和零和博弈。 20世纪的40年代末到50年代初,是博弈论的发展史上一个重要阶段。越来越多的学者进行了博弈理论的研究。1950年,纳什(John Nash)在他的博士论文《非合作博弈》中,将博弈论扩展到了非零和博弈,最终形成了非合作博弈理论的思想源泉,纳什均衡概念的提出以及纳什均衡存在性的纳什定理的证明,

历史的制度分析:博弈论分析方法

历史的制度分析:博弈论分析方法 把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。一种是“进化博弈论方法”(evolutionary game approach)。经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。采用这一方法的研究者认为,社会制度并不是由什么人有意设计出来的,而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。这就是所谓的“适应性进化”过程。进化博弈论的引入,就是为了分析和说明社会制度的这一适应性进化过程。进化博弈论之所以在制度变迁理论中受到重视,主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程,从而在纳什均衡的理性主义解释遇到理论困难时,显示出了通过进化机制实现纳什均衡的可能性。 应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”(repeated game approach),它运用更精细的均衡概念,如“子博弈精炼均衡”(subgame perfect equilibrium)来分析历史与现实中的制度选择与变迁过程。其中最具代表性的,就是格瑞夫进行的“历史的比较制度分析”。 所谓的重复博弈,实际上是指同样结构的博弈重复地进行多次。与一次性博弈不同,它是由若干个阶段博弈(stage game)构成的一个完整的和相对长期的博弈过程。因此,在重复博弈中,各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益,而是他们在整个博弈过程中的总体利益和长期利益。当各博弈方面对不同的策略选择时,他必须考察到其在当前阶段的博弈中所采取的策略,不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。也就是说,他不能像在一次性博弈中那样,毫不顾及其他博弈方的利益。有时,一方若作出一种合作姿态,可能会使其他博弈方在随后的阶段中也采取合作态度,从而实现共同的长远利益。这样,在重复博弈中就存在着比一次性博弈更大的合作的可能性,也有可能实现比一次性博弈更有效率的均衡。重复博弈论的这一特征,为它说明人类之间的合作行为,特别是说明历史与现实社会中体制与制度的演变过程,提供了强有力的支持。 在历史的比较制度分析那里,制度被定义为本身是“自我实施的对行为的非技术决定的约束” ,即所谓的自我实施制度(self-enforcing institution )。自我实施制度的一个最基本的特征,就是它的自发产生和自我实施的性质。与那些由国家和法律强制实施的制度不同,自我实施制度必须是参与人各方经过协商、谈判、讨价还价后自愿达成一致的结果。因此,历史的比较制度分析将自我实施制度视为特定历史条件下制度博弈的一种均衡状态或均衡结果。自我实施制度产生的过程,也就是制度博弈各方在特定的战略局势中,根据自己不同的目标自主地选择各自的最优策略与对手进行博弈,最后求得制度均衡的过程。而所谓的“子博弈精炼均衡”,恰恰是指在构成动态博弈的所有子博弈阶段上都实现了纳什均衡。这就是说,一个子博弈精炼均衡,必须是各博弈方在整个博弈的每个阶段(子博弈)都选择了不愿单独改变的策略(纳什均衡)的最终结果。如果我们从博弈论的角度来观察自我实施制度,就会发现自我实施制度与子博弈精炼均衡之间的内在联系。简单地说,自我实施制度所具有的自发产生和自我实施的基本属性,说明了它必定是制度博弈各方在每个子博弈中都选择了不愿单独改变的最优策略的结果,也即实现子博弈精炼均衡的结果。更直接地说,自我实施制度的产生,必定是一个制度博弈实现了子博弈精炼均衡的结果。反过来说,如果一个制度博弈实现了子博弈精炼均衡的结果,那它也应该是自我实施的。

博弈论在公共决策中的应用(最新)

博弈论在公共决策中的应用 一.领导干部要学点博弈论 1.几个富有启发性的案例 案例1:商家作出最低价格承诺的真相是什么?所谓最低价格承诺是指商家承诺自己的价格比任何对手都低,一旦有对手的价格比自己低,作承诺的商家将退回差额,并且承诺支付一定金额的违约罚金。 思考:商家为什么要作出这种承诺呢?是为了促销或者恶性竞争吗? 案例2:假设有三个候选人或候选方案:x、y 和z;有三个参加投票的人:甲、乙、丙。三个人对候选对象的态度分别如下:甲:x y z;乙:y z x;丙:z x y。(注:候选对象排位越靠前,表示越喜欢) 现在分别有三个投票程序:程序1,x与y先pk,然后胜利者进入下一轮与z进行pk;程序2,x与z先pk,然后胜利者进入下一轮与y进行pk;程序3,z与y先pk,然后胜利者进入下一轮与x进行pk。 思考:(1)上面每个程序的最终获胜者是谁?(2)为了保证丙自己心目中最喜欢的z当选,如果丙能够操纵投票程序,他应该采用哪个投票程序?(3)如果您是甲,为了

避免自己最不喜欢的丙当选,应该怎么办? 案例3:夫妻博弈(又称协调博弈) 妻 夫足球 芭蕾 思考:夫妻博弈最有可能出现的结局是什么?丈夫如何保证获得自己理想的结果——夫妻一起去看足球?妻子有没有办法扭转这一被动局面? 体会:什么是纳什均衡?纳什均衡的特点就是:在均衡状态下没有人愿意单方面改变自己的策略,也就是说,博弈各方所选择的策略互相构成了最优反应。 案例4:开店博弈 假设顾客均匀分布在一条街上,他们总是选择到离自己家最近得的商店购物;现有两位投资者均准备在街上开店,他们都希望到自己商店购物的顾客越多越好。请问:投资者应该

博弈论测试题四

博弈论测试题四 (每题10分) 1、在下面的战略式表述博弈中,说明两个参与人是否有占优战略及其理由,是否有占优战略均衡,若有,说明均衡结果。 2、在下面的战略式表述博弈中,说明战略组合(U, L)不是纳什均衡和(D, R)是纳什均衡的理由。 3、求下面扩展式表述博弈的纳什均衡及结果。 3, 0 7, -1 2, 5 5, 1 L R Column Row U D 9, 5 5, 3 6, 7 9, 5 L R Column Row U D 进入者 (40, 50) (10, 30) (0, 400) (0, 400)

4、求下面战略式表述博弈的混合战略纳什均衡,画出反应对应图。 5、在下面的扩展式表述博弈中,写出两个参与人的战略空间,求其子博弈精炼纳什均衡及结果。 6、求下面扩展式表述博弈的子博弈精炼纳什均衡及结果。 2, 2 4, 3 3, 4 2, 2 L R Column Row U D 在位者 (300, 0) (0, -10) (300, 0) (100, 90) 1 (10, 60, 0) (0, 50, 20)

7、图示以下列战略式表述博弈为阶段博弈的无限重复博弈的纳什威胁点、可行支付集合、个人理性支付集合、个人理性可行支付集合和子博弈精炼可达到的支付集合。 8、写出下列扩展式表述博弈的战略式表述,求出这个博弈的纳什均衡及结果,如何使两个企业既守法又不减少所获收益? 9、在以下静态贝叶斯博弈中,在位者知道自己是低成本的,进入者不知道在位者是高成本还是低成本,但知道在位者是高成本的概率是60%,两个参与人同时行动,画出这个博弈的扩展式表述,说明在进入者选择进入的情况下在位者在两种成本情况下的战略选择,计算进入者两种战略选择的期望支付,写出这个博弈的贝叶斯纳什均衡及结果。 企业1 (1, 1) (-1, 2) (2, -1) (1, 1) 在位者 高成本[0.6] 低成本[0.4] 进入 者 进入 不进入 默许斗争 默许 斗争 8, 8 0, 6 6, 0 2, 2 L R Column Row U D

新版博弈论教学大纲

《博弈论》教学大纲 适用专业:国际经济与贸易课程性质:专业限选课 学时数: 36 学分数:2 开课学期:春季大纲执笔人:王金波大纲审核人:范业刚 一、课程的性质和教学目标(小四号黑体) 课程性质:博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 教学目标:使学生具备博弈论的思维,会使用博弈的方法来分析经济问题,掌握博弈论的基本概念和应用。 二、课程教学内容(小四号黑体) 第一章导论(2学时)(小四号宋体加粗) 1、课程内容 博弈论与主流经济学的新发展/非合作博弈理论的一个非技术性概述/博弈论的分类/完全信息静态博弈/完全信息动态博弈/不完全信息静态博弈/不完全信息动态博弈 2、重点、难点 ⑴教学重点:完全信息静态博弈/完全信息动态博弈/不完全信息静态博弈/不完全 信息动态博弈之间的区别与联系 ⑵教学难点:完全信息静态博弈/完全信息动态博弈/不完全信息静态博弈/不完全 信息动态博弈之间的区别与联系 3、基本要求 了解:博弈论与主流经济学的新发展 理解:完全信息静态博弈/完全信息动态博弈/不完全信息静态博弈/不完全信息动态博弈之间的区别与联系

掌握:完全信息静态博弈/完全信息动态博弈/不完全信息静态博弈/不完全信息动态博弈之间的区别与联系 (按“了解”、“理解”、“掌握”三个层次表述应达到的要求) 第二章:博弈论的基本概念及战略式表述(2学时)(小四号宋体加粗) 1、课程内容 掌握博弈论的基本概念/参与人/行动/信息/完美信息与完全信息/不完美信息与不完全信息的区别与联系/共同知识的概念/战略鱼行动的区别与联系/支付函数。 2、重点、难点 ⑴教学重点:博弈论的基本概念/参与人/行动/信息/完美信息与完全信息/不完美信息与不完全信息的区别与联系/共同知识的概念/战略鱼行动的区别与联系/支付函数⑵教学难点:信息/完美信息与完全信息/不完美信息与不完全信息的区别与联系/共同知识的概念/战略鱼行动的区别与联系 3、基本要求 掌握:信息/完美信息与完全信息/不完美信息与不完全信息的区别与联系/共同知识的概念/战略鱼行动的区别与联系 第三章:纳什均衡及纳什均衡应用举例(2学时) 1、课程内容 掌握纳什均衡的概念/占优策略均衡概念/重复提出均衡概念/古诺模型/豪泰林模型 2、重点、难点 ⑴教学重点:纳什均衡的概念/占优策略均衡概念/重复提出均衡概念 ⑵教学难点:古诺模型/豪泰林模型 3、基本要求 理解:什均衡的概念/占优策略均衡概念/重复提出均衡概念/古诺模型/豪泰林模型第四章:混合策略纳什均衡(2学时) 1、课程内容 掌握混合策略纳什均衡的求解方法

简述运筹学的起源与发展历程

简述运筹学的起源与发展历程——应用博弈论思想分析团队合作中个人理性和集体利益的关系 作者:张舒悦 日期:2015年1月19日 [摘要] 我们说理性表现为参与人为自己的目标进行推理或计算。因此·在博弈对峙的局面中,每个人的理性判断最终导致的行为选择,也许反而会使导致集体利益的最差,当然。也许两个参与者之间不能被看做集体,但是我们可以通过集体特点的分析,从而对每个人理性策略选择所构成的集体后果关联从而对个人理性与集体利益有一个更为全面的认识。 [关键词] 囚徒困境;集体;理性;利己主义 [正文] 一、运筹学科的起源发展与分支概括 运筹学的起源 运筹学(英国用operational research,美国用operations research,简称OR),从它的英文名称和中文翻译可以看出它与作战相关。中文“运筹”一词来源于《史记——留侯世家》,刘邦夸奖张良,“夫运筹帷幄之中,决胜千里之外,吾不如子房”。这一翻译不但传达了运筹学的渊源,而且反映了它的内涵,是翻译“信、达、雅”的最高境界。运筹学是一门内容广泛、应用广泛的交叉学科,它汇聚了数学、物理学、统计学、管理学、心理学、仿生学等众多的学科。有些分支的起源,如图论这一重要的分支的起源甚 至可以追溯到16世纪;即使是在现代通信领域广泛应用的排队论,也可以追溯到20世 纪初。但是,运筹学作为一门学科的出现确实要归功于第二次世界大战。 第二次世界大战是这样一个时期,科学发展从一门独立的学科发展向学科交叉发展,从“形而上学”的研究方法向系统综合研究的方向发展,系统科学、信息科学和计算机 科学开始了它的早期发展。这个良好的发展时期被第二次世界大战暂时中断,大量的科 学家为了国家利益投入到了为战争服务之中。在德国一方,科学家更多地投人各种杀伤 武器的研究;而在英美一方,科学家被组织成为作战研究小组,专门研究作战中的一些 特殊问题,这些问题需要数学模型和方法来解决。如雷达的部署问题、运输船队的护航 问题、反潜深水炸弹投掷问题、飞行员长机僚机配对问题、太平洋岛屿军事物资存储问题、项目管理问题等等。这些研究保障了英伦三岛免遭德军的蹂躏、美军在太平战争的 胜利。

用博弈论分析大国间的政治博弈

大国间的政治博弈 二十年前,世界由美苏主导,对于其他国家而言,只有唯唯诺诺的份儿,因为美苏无论在军事还是经济,对别国都有绝对优势。苏联解体后,超级大国美国也难独霸天下。事实也已证明,不会再有哪一个国家有能力让全世界都对其言听计从(至少今天没有,明天不会)。 分析二十年前,世界几乎是处在一种零和状态中,尤其是大国对小国。小国不听话了,大国可以随便经济制裁你,武力威胁你,甚至揍你,小国基本上只能处于被动状态。虽然,苏联解体后,美国凭其遥遥领先的经济实力,绝对强大的军事实力,仍然可以成为超级大国,但还可以号令天下吗?那只是美国人的一厢情愿罢了!从1991年,美国人的确打了几次漂亮的仗,但打出了美国人一统天下的局面吗?没有。美国人想再次以武力恫吓世界,已经不大可能。眼下的世界,需要的是共赢。没有国家能代表全世界,却又各自想着如何让自己的利益最大化,自然而然的,世界将进入一种非零和博弈状态。 (博弈论简介:The theory of relative balance about the mobile addicts and soul of animals in the nature and in the expectation of decision makers is called the game theory. (quoted from the article “The Blue Files Unknown to Humankind”in Bible of Game Theory。 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的;或者指动物利用大自然移动的瘾魂,在决策人期待的空间里,形成相对均衡的语文学理论。其应用有著名的纳什

尼科尔森《微观经济理论——基本原理与扩展》第11版课后习题详解(博弈论)【圣才出品】

尼科尔森《微观经济理论——基本原理与扩展》第11版课后习题详解 第8章博弈论 1.考虑下面的博弈: (1)找到纯策略纳什均衡(如果存在)。 (2)在均衡中各个参与人只会在前两个行动之间随机选择,找到此时的混合策略纳什均衡。 (3)计算问题(1)、(2)中得到的均衡中各个参与人的期望收益。 (4)画出这个博弈的扩展式。 解:(1)用划线法求解纯策略纳什均衡 当参与人1选择A时,则参与人2会选择E;参与人1选择B时,那么参与人2选择D;参与人1选择C时,参与人2会选择F。 当参与人2选择D时,则参与人1会选择A;参与人2选择E时,那么参与人1选择B;参与人2选择F时,参与人1会选择C。 综合上述,此博弈的纯策略纳什均衡为:(C,F)。 (2)在均衡中各个参与人只会在前两个行动之间随机选择,此时的博弈矩阵如下:

设参与人1选择A的概率为r,参与人2选择D的概率为c,那么参与人1的期望收益为:E1=7rc+5r(1-c)+5(1-r)c+7(1-r)(1-c)=4rc-2r-2c+7 ①若c>1/2,则随着r的增加参与人1的期望收益值增加; ②若c<1/2,则随着r的增加参与人1的期望收益值减小; ③若c=1/2,则参与人1的期望收益值的变化不受r的影响。 同理,参与人2的期望收益为:E2=6rc+8r(1-c)+8(1-r)c+6(1-r)(1-c)=-4rc+2r+2c+6 ①若r>1/2,则随着c的增加参与人2的期望收益值减小; ②若r<1/2,则随着c的增加参与人2的期望收益值增加; ③若r=1/2,则参与人2的期望收益值的变化不受c的影响。 综上所述,该博弈的混合策略纳什均衡为:参与人1选择A、B策略的概率各占1/2;参与人2选择D、E策略的概率也各占1/2。 (3)在(1)中,参与人的纯策略纳什均衡点为(C,F),此时两人的期望收益均为4。 在(2)中,参与人的混合策略均衡为参与人1分别以1/2的概率选择A、B策略;参与人2分别以1/2的概率选择D、E策略,此时,有:

博弈论(整理过名词解释和简答)

一、名词解释: 1、博弈:一些个人、团体或其他组织,在一定的规则约束下,依据所掌握的信息,同时或者先后,一次或者多次从允许选择的行为或战略进行选择并加以实施,并从中各自取得相应结果或收益的过程。 2、囚徒困境:从博弈中的两个利益主体出发选择行为,结果是既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益,比如经济领域的寡头竞争、公共产品的供给。 3、非合作博弈与合作博弈:人们行为相互作用时,当事人能达成一个具有约束力的协议,也就是合作博弈,反之,就是非合作博弈。 4、常和博弈:是指博弈双方的得益总和为非零的常数 变和博弈:是指在不同的策略组合或者结果下,所有博弈方的得益总和一般是不相同的零和博弈:是指在博弈中,一方的得益就是另一方的损失,所有博弈方的得益总和为零5、博弈论:研究决策主体的行为及其相互决策和均衡问题的学科。在经济学中,博弈论是研究经济主体的决策相互影响 6、战略:参与人在给定信息集的情况下的行为规则的完备描述。 7、均衡:所有参与人的最优战略组合。 8、均衡路径:如果一个博弈有几个子博弈,一个特定的纳什均衡决定了原博弈树上唯一的一条路径,或者说是一个纳什均衡结果在博弈树中所形成的路径。 9、占优均衡:无论其他参与人选择什么战略,参与人的某一种战略均是最优的。 10、重复剔除劣战略的占优均衡:首先找到某个参与人的劣战略(假定存在),把这个劣战略删除掉,重新构造一个不包含已删除的劣战略的新的博弈,然后再删除这个新的博弈中的某个参与人的劣战略,一直重复这个过程,直到只剩下唯一的战略组合为止。 11、纳什均衡:给定你的策略,我的策略是最好的策略;给定我的策略,你的策略也是最好的策略,即双方在给定的战略上不愿意改变自己的策略。 12、混合战略:如果一个战略规定参与人在给定信息情况下以某种概率随机选择不同的行为,我们称该战略为混合战略。 13、子博弈:从单结信息集开始至博弈结束的过程,由一个决策结x和所有的后续决策结T(x)构成,满足条件: (1)决策结x是单结信息集; (2)在一个信息集的决策结必须是同一个决策结的后续结。 14、子博弈精炼纳什均衡:如果一个纳什均衡中的各个子博弈的战略在每一个子博弈中都是最优的,即构成纳什均衡,则称该博弈为子博弈精炼纳什均衡。 15、静态博弈:指博弈中的参与人同时选择行为,或者虽非同时但后行动者并不知道前行动者采取了什么具体行动; 动态博弈:指参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。 16、重复博弈:给定一个标准博弈G(动态/静态)重复进行T次,并且每次重复G之前,以前的博弈的结果各个博弈方都能观察到,这样的博弈过程成为“G的T次重复博弈”,记为G(T),G称为G(T)的博弈阶段。同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。 17、不可置信的威胁:在纳什均衡中,不可置信的均衡战略,在博弈的规则下,使自己的支付变小的不理性的选择。 18、完全信息博弈:每一个参与人对所有其他参与人的特征,战略空间以及支付函数有准确知识的博弈。 19、类型:一个参与人所拥有的私有信息,是其个人特征的完备描述,博弈人知道,其他人不知道。

博弈论蒋文华浙江大学

第一讲、博弈论概述 献给诸位 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。 第一章何为“博弈” 博:博览全局弈:对弈棋局→谋定而动 是指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 第一节从一个简单的故事说起 博弈时要搞清楚对手是谁!博弈时要搞清楚和别人比什么! 行为选择既跟对手的情况有关,又跟所遇到的外部环境的变化有关。 特别提示: 博弈既可以是竞争,也可以是合作! 特别提示: 博弈,必须学会换位思考! 特别提示: 博弈,只需领先一步,高人一筹! 博弈就是你中有我,我中有你。由于直接相互作用(互动),每个博弈参与者的得益不仅取决于自己的策略(行动),还取决于其他参与者的策略(行动)。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的

策略(行动),从而选择最有利于自己的策略(行动)。 特别提示: 站在别人的立场上想一想,就是为自己未来的遭遇着想。——米兰·昆德拉 特别提示: 如果因为对方眼中的你的傻,而让对方更愿意和你合作,何乐而不为呢(大智若愚) 特别提示: 请不要在一个充分竞争的市场去追求成功! 特别提示: 选对市场(对手)比选对策略更重要! 特别提示: 在博弈之前,博弈就已经开始了! 第二节博弈的渊源 一、中国的理解 博+弈=下围棋 略观围棋,法于用兵,怯者无功,贪者先亡。 ----汉代刘向,《围棋赋》 二、西方的理解 game(规则) 费厄泼赖(fairplay)

第三节学习博弈论的收益 一、当局者清 更有利的选择 更快速的反应 二、旁观者更清 理解历史与现实 预测未来的发展 三、提出完善游戏规则(制度)的建议 第二章发展简史 第一节最初的探索和应用 一、古诺模型 参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。 二、伯川德模型 该模型与古诺模型的不同之处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。 三、斯塔克尔伯格模型 该模型分析的是这么一种市场竞争:企业A先决定一个产量,然后企业B 可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。 第二节理论的诞生与发展 1、20世纪40年代的社会变化。 2、约翰·冯·诺依曼(JohnVonNeumann,1903-1957)的卓越贡献。1944

博弈论的发展及其应用

博弈论的发展及其应用 【摘要】博弈论主要是研究策略选择问题,强调的是个人理性。纳什均衡在非合作博弈理论中起着不可替代的作用,博弈不仅在日常的生活中司空见惯,而且广泛应用在经济、社会、军事等各个领域中。博弈论对人类最大的贡献就是它的哲学思维方式推动着人类思维方式不断向前发展。 关键词:博弈论纳什均衡应用经济学 引言 博弈论又称对策论、竞赛论,用于分析竞争的形势。在存在利益冲突的竞争及斗争中,竞争的结果不仅依赖于某个参与者的抉择、决策和机会,而且也依赖于竞争对手或其他参与者的抉择。由于竞争结果依赖于所有局中人的抉择,每个局中人都企图预测其他人的可能抉择,以确定自己的最佳对策。博弈论是用数学方法来分析斗争形式的学科,也叫冲突分析。 一、博弈论的概述 1、博弈论的发展 博弈论又称对策论,英文名称是Game Theory,是使用严谨的数学模型研究冲突对抗条件下最优策略的问题的理论,属应用数学的一个分支。主要研究公式化了的激励结构间的相互作用和具有斗争或竞争性质现象的数学理论和方法,也是运筹学的一个重要学科。博弈论经过半个多世纪的短暂发展,目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论的正式提出是由美国经济学家冯·诺依曼在1937年提出来的,他与经济学家奥斯卡·摩根斯特恩于1944年合著的《博弈论与经济行为》被公认为是博弈论诞生的标志,是关于纯粹理论的理论。到50年代,博弈论得到了巨大的发展,Tucker于1950年提出了“囚徒困境”。纳什在1950年和1951 年发表了两篇关于非合作博弈的重要文章,提出了“纳什均衡”的概念,以及证明纳什均衡存在的纳什定理,奠定了现代博弈论学科体系的基础,这个时期的博弈论研究主要集中在对静态博弈模型的研究。 50年代中后期到70年代是博弈论产生重要成果的阶段。泽尔藤将纳什均衡的概念引入了动态分析,提出了“多步政策”,“子博弈完美纳什均衡”和“颤抖均衡”的概念,并发展了倒推归纳法等分析方法。豪尔绍尼开创了不完全信息对策研究的新领地,提出了“贝叶斯纳什均衡”的概念和分析不完全信息博弈问题的标准方法,初步运用随机分析方法解决信息不完全和不对称问题。 80年代以后,博弈论开始走向成熟,理论框架逐渐完整和清晰,和其他学科之间的关系也逐渐深入,并开始受到经济学家真正的重视。1994年著名博弈论专家纳什、泽尔藤、豪尔绍尼因为在非合作博弈均衡领域的开创性贡献获得当年的诺贝尔经济学奖。2005年奥曼和谢林因为“以博弈论分析方法增进了对冲突和合作的理解”而获得诺贝尔经济学奖,这说明博弈论已得到了世界的普遍认可。 2、博弈论的分类 一是分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。企业之间的联合定价就属于合作博弈,而经常挑起价格战的企业采用的便主要是

博弈论(生存智慧大全集)_中国古代博弈思想

作为一门学科,博弈论虽然只有几十年的历史,但在中国,博弈的思想可以追溯上千年。中国历史上虽然没有创造博弈论,但却无时无刻不在运用博弈论的原理。从田忌赛马到庞涓斗智,从运筹帷幄到韬光养晦,从击鼓论战到毛泽东关于打仗的十六字方针,中国人民对博弈论的发展做出了重要的贡献。具有灿烂文明的中国古代文化,是一座正待开发的宝藏,作为其中优秀成果的博弈思想,尽管我们可能只是窥及一角,但在今天看来仍有很多启迪意义。 在政治方面,一部中国史,上下五千年,其中有数不清的政治博弈,让人惊心动魄。不论忠奸善恶,每个人的命运都与形形色色的政治博弈拴在一起,所有身处其中的人或一举成名,或一夜暴富,或一败涂地。 中国王朝的年限少的只有数十年,如秦、隋等;多也不过三四百年,如汉、唐、宋、明等。尽管每一次改朝换代都会带来生灵涂炭,社会文化、经济则随之遭到严重破坏,但无可否认的是,历史在大踏步前进。有人将历史的精微幽深作一总结,得出了若干条中国式王朝衰败的法则,如武装积弱,中央对军队失控;吏乱坏纲,各级官吏腐败;国库断银,积贫致弱;人心向背是决定王朝兴衰的关键;领导者决策上的严重错误,致使无力回天;防御过度或乏力,导致在抵抗外患中走向式微;天灾人祸造成的储备一空;宫廷乱政,后院失火;各民族融合失衡,民族矛盾加剧等等。所有这些,其实都是政治博弈的失败。 对于每一个生活在本朝现实中的人来说,偌大一个国家的衰亡,绝非是一件人人都能承受得起的事件,尤其对于帝国的经营者来说。毛泽东曾对此发表见解说:“我们已经找到新路,我们能跳出这周期率。这条新路,就是民主。只有让人民来监督政府,政府才不敢松懈。只有人人起来负责,才不会人亡政息。”可惜的是,过往帝王们显然由于历史的局限性,都缺乏毛泽东的思想高度,他们没能幸运地找到基业长青的“新路”。相反的是,他们基本上都怀着虔诚之心,不自觉地走向了覆灭之路。 在经济方面,中国古代社会的经济交往,是在小农经济和自给自足的经济条件下进行的。每个人与不属于自己所熟悉的或所居住社会群体中的人进行重复经济交往,这个可能性是很小的。在这种情况下,每个人所关注的是一次性经济交易的结果,也就是行为的短期化。也就是说.经济中进行的还是大量的一次性博弈。只有当大量的一次性博弈重复进行,并经主体认识到短期行为对自己的损害时,诚信才可能最终形成。 当然,不可否定的是,中国历史上也曾有很多阶段有高速的经济增长,问题是不能持续。 信用程度是一个历史的发展过程。这一过程可能是漫长的,而且要付出巨大代价。要实现全社会信用的提升,必须在未来的历史中完成尽管这注定是一个漫长和痛苦的历程。 在军事方面,《孙子兵法》是“兵圣”孙武所著的世界上最早的军事博弈专著,在中国被奉为兵家经典,后世的兵书大多受到它的影响,对中国的军事学发展影响非常深远。它也被翻译成多种语言,在世界军事史上也具有重要的地位。 《孙子兵法》所阐述的博弈思想如谋略思想和哲学思想,被广泛地运用于军事、政治、经济等各领域中。其内容博大精深,思想精邃富赡,逻辑缜密严谨,历代兵学家、军事家无不从中汲取养料,用于指导战争实践和发展军事理论,成为进行军事博弈的典范之书。

2020年最新博弈论心得体会

博弈论心得体会 博弈论心得体会一 我学过一段时间博弈论,一些思维过程中也可能自觉不自觉地使用一些博弈论思想,有两点比较突出的体会。 第一,制订政策或游戏规则,要保证所有人有参与积极性。这来源于纳什均衡概念,说起来当然简单。但我自己觉得,以前所知道的这条道理制订游戏规则要保证所有人有参与积极性是简单接受,没有逻辑,或者,在直觉层次觉得这是对的,但没有认识到它为什么对。 有本书上说,以后的经济学家必须知道一个纳什均衡概念,否则不算经济学家,或者说,玩明白了纳什均衡,就像玩明白了价格一样,是经济学家的基本功。我赞同。协议必须是能够自动执行的。 第二,千万不能把别人当傻瓜。这来自子博弈精炼纳什均衡。合理的行为序列必然在每一步上都合理(当然,这里不去探讨历史理性),即使存在一点缺陷,也要从颤抖手均衡的思路来考虑问题,使自己不要随意使用触发策略,保证你好我好(也可以说是我好,他也好)。如果把别人当傻瓜,吃亏的是自己,就像那个卖猫的故事。

把博弈论这种技术体系当作世界观,似乎有些危险,但其中的道理我必须重视。以上是一点体会,希望能抛砖引玉。 博弈论心得体会二 学习博弈论的目的,不仅是为了赢得更好的结局,也在于享受博弈分析的过程。先给大家猜一个脑筋急转弯,问:在什么情况下零大于二,二大于五,五又大于零。答案是:在玩石头.剪刀.布游戏的时候。 博弈,就是用这种游戏思维来突破看似无法改变的局面,解决现实的严肃问题的策略。在博弈中,每个参与者都在特定条件下争取其最大利益,强者未必胜券在握,弱者也未必永无出头之日。因为在博弈中,特别是多个参与者的博弈中,结果不仅取决于参与者的实力与策略,而且还取决于其他参与者的制约和策略。也就是说在现实生活中屌丝若要逆袭,学习并掌握必要的博弈论的知识是很有帮助和必要的。 事实上,博弈过程本来就不过是一种日常现象。我们在日常生活中经常需要先分析他人的意愿从而做出合理的行为选择,而所谓博弈就是行为者在一定环境条件和规则下,选择一定的行为或策略,实施并取得相应结果的过程。比如你身为博士,当面临老板任务的压力和可爱妹纸的召唤的选择时,必要的博弈论知识

博弈论的发展历程

博弈论的发展历程 虽然早在18世纪初以前便开始了对具有策略依存特点的决策问题的零星研究,但博弈论真正的发展还是在20世纪。20世纪初期是博弈论的萌芽阶段,其研究对象主要是从竞赛与游戏中引申出来的严格竞争博弈,即二人零和博弈。这类博弈中不存在合作或联合行为,对弈两方的利益严格对立,一方所得必意味着存在另一方的等量损失。这符合下棋等二人室内游戏的情形,但应用在经济与政治上,则大多数情况并不合适。此时,关于二人零和博弈理论有丰硕的研究成果,尤其是提出了博弈扩展型策略、混合策略等重要概念,为日后研究对象范围的拓展与研究的深化奠定了基础。这一阶段最重要的成就是泽梅罗定理(1913)与冯·诺伊曼的最小最大定理(1928),后者为二人零和博弈提供了解法,同时对博弈论的发展产生了重大影响,例如非合作几人博弈中的基本概念——纳什均衡就是最小最大定理的延伸与推广。 1944年,美国数学家冯·诺伊曼(Von Neumann)和摩根斯坦(Morgensien)合著的《博弈论与经济行为》一书的出版,标志着系统的博弈理论的初步形成。该巨著汇集了当时博弈论的研究成果,将其框架首次完整而清晰地表述出来,使其作为一门学科获得了应有的地位。同时身为经济学家的摩根斯顿首先清楚而全面地确认,经济行为者在决策时应考虑到经济学上的利益冲突性质。该书详尽地讨论了二人零和博弈,并对合作博弈作了深入探讨,开辟了一些新的研究领域。更重要的是将博弈论加以空前广泛的应用,尤其是在经济学上,由于博弈论数学上的严整性与经济学应用上的广泛性,一些经济学家将该巨著的出版视为数理经济学确立的里程碑。 接下来的一段时期对合作博弈的研究有了长足进步。按豪尔绍尼(1966)的观点,如果一博弈中意愿表示——协议、承诺、威胁——具有完全的约束力并可强制执行,则该博弈是合作的。如意愿表示不可强制执行,则为非合作博弈。非合作博弈随后发展起来,纳什、泽尔滕和豪尔绍尼因此而获奖,但当时注意力主要集中在合作博弈上。事实上,合作博弈可视为非合作博弈的特殊情况,它略去非合作个体之间建立合作关系的过程而着重研究合作的可能性与形式。由于省去从非合作到合作过程中繁复的难以尽述的细节,合作博弈能对合作问题有更清晰的把握。为了解决合作博弈中所遇到的问题,这一期间提出了联盟博弈、稳定集、解概念、可转移效用、核心等重要概念与思想。1950年代是博弈论的成长期,纳什为非合作博弈的一般理论奠定了基础,提出了博弈论中最为重要的概念——纳什均衡,开辟了一个全新的研究领域。非合作理论发展起来,如阿尔·塔克的囚徒困境、重复博弈概念等。合作博弈理论在这个阶段得到进一步发展,如沙普利值概念、核概念等。博弈论的研究队伍开始扩大,兰德公司在圣基尼卡开业,在随后的许多年里,这里成为博弈论的研究中心。此经济学逐渐成为博弈论最重要的应用领域。1960年代是博弈论的成熟期。不完全信息与非转移效用联盟博弈那样的扩充使理论变得更具广泛应用性。常识性的基本概念得到了系统阐述与澄清。博弈论成了完整而系统的体系。更重要的是,博弈论与数理经济及经济理论建立了牢固而持久的关系。例如,等价性原理说明博弈论与经济理论间存在竞争市场经济的价格均衡与相应博弈的重

相关文档