文档库 最新最全的文档下载
当前位置:文档库 › 博弈论原理模型与教程扩展式博弈

博弈论原理模型与教程扩展式博弈

博弈论原理模型与教程扩展式博弈
博弈论原理模型与教程扩展式博弈

《博弈论:原理、模型与教程》

第二部分完全信息动态博弈

第6章扩展式博弈

(已精细订正!)

对博弈问题的规范性描述是科学、系统地分析博弈问题的基础。

前面介绍了一种常用的博弈问题描述方式—战略式博弈,虽然这种博弈模型结构简单,只要给出博弈问题的三个基本构成要素(即参与人、参与人的战略集及参与人的支付),就可完成对博弈问题的建模。

但是,由于战略式博弈假设每个参与人仅选择一次行动或行动计划(战略),并且参与人同时进行选择,因此从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。

虽然战略式博弈也可以对动态博弈问题进行建模,但是从所得到的模型中只能看到博弈的结果,而无法直观地了解到博弈问题的动态特性。

本章将介绍一种新的博弈问题描述方式—扩展式博弈。从扩展式博弈模型中,不仅可以看到博弈的结果,而且还能直观地看到博弈的进程。在介绍扩展式博弈构成的基础上,还将对扩展式博弈的战略和解进行讨论。

6.1 扩展式博弈(文字描述、博弈树描述)

所谓扩展式博弈(extensive form game),是博弈问题的一种规范性描述。与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中所遇到决策问题的序列结构的详细分析。

一般而言,要了解一个博弈问题的具体进程,就必须弄清楚以下两个问题:

(1)每个参与人在什么时候行动(决策、选择);

(2)每个参与人行动时,他所面临决策问题的结构,包括参与人行动时可供他选择的行动方案及所了解的信息(集)。

[注:

行文中频繁出现的“行动”一词,有两义:

其一,动词的“行动”,指选择、决策。

其二,名词的“行动”,指策略、战略、谋略、行动方案、方案。]

上述两个问题构成了参与人在博弈过程中所遇到决策问题的序列结构。对于一个博弈问题,如果能够说清楚博弈过程中参与人的决策问题的序列结构,那么就意味着知道了博弈问题的具体进程。

定义6 – 1 扩展式博弈包括以下要素: (1)参与人集合{1,2,...,}n Γ=;

(2)参与人的行动顺序,即每个参与人在何时行动;

(3)每个参与人行动时面临的决策问题,包括参与人行动时可供他选择的行动方案及他所了解的信息(集); (4)参与人的支付函数,即博弈结束时每个参与人得到的博弈结果。

从上述定义可以看到:如果要用扩展式博弈对一个博弈问题进行建模(或者描述),那么除了要说明博弈问题所涉及的参与人及每位参与人的支付函数以外,还必须对博弈过程中参与人所遇到的决策问题的序列结构进行详细的解释,说清楚每个参与人在何时行动,以及参与人行动时可供选择的行动方案和所了解到的信息。

【例6-1】 考察一个“新产品开发博弈”。试用扩展式博弈对两个企业都知道市场需求且企业同时决策的博弈情形,即完全信息静态的“新产品开发博弈”进行建模。

??

?

?

???

???????????。为):不投入资金,利润不开发(万元开发,赔企业万元不开发,获利润

企业需求小元开发,获利润企业万元不开发,获利润

企业需求大元资金投入)

开发(企业040022002300280022000:1b a 图1-1 新产品开发的投入-产出图

解:

文字描述如下:

根据定义6-1,完全信息静态的“新产品开发博弈”的扩展式博弈包括以下要素: (1)参与人是企业1和企业2;

(2)两个企业同时行动,即同时选择产量;

(3)每个企业行动时有两种选择—“开发”和“不开发”,并且每个企业行动时不知道对方的选择1; (4)两个企业的支付如图1-1所示。

??

?

?

???

???????????。为):不投入资金,利润不开发(万元开发,赔企业万元不开发,获利润

企业需求小元开发,获利润企业万元不开发,获利润

企业需求大元资金投入)

开发(企业040022002300280022000:1b a 图1-1 新产品开发的投入-产出图

【例6-2】 继续考察“新产品开发博弈”。试用扩展式博弈对两个企业都知道市场需求且企业1先决策,企业2观测到企业1的选择后再进行选择的博弈情形,即完全信息动态的“新产品开发博弈”进行建模。 解:

文字描述如下:

根据定义6-1,完全信息动态的“新产品开发博弈”的扩展式博弈包括以下要素: (1)参与人是企业1和企业2; (2)企业1先行动,企业2后行动;

(3)企业1行动时有两种选择—“开发”和“不开发”,企业1行动时不知道企业2的行动;企业2行动时有两种选择—“开发”和“不开发”,但企业2行动时已经知道企业1的行动; (4)两个企业的支付仍然有如图1-1所示。

上述两个例子中,用文字描述的方法给出了博弈问题的扩展式描述。

1

注意,虽然此时每个企业都不知道对方的选择,但用扩展式博弈进行建模时仍然假设参与

人都同时看到了图1-1所示的投入-产出图,即图1-1对两个企业来说为共同知识。

对于一些简单的博弈问题,这种文字表述的方法也许是简单可行的。但可以想象,如果遇到的是更为复杂的博弈问题,如参与人人数大于2,每个参与人可以多次行动且每次行动时可供选择的行动方案不同等,文字描述所给出的模型就会显得繁冗拖沓,极不直观,因此 需要寻找一种简便易行的扩展式博弈的描述方式。

下面就以“新产品开发博弈”为例,介绍一种不仅简单方便,而且十分直观的扩展式博弈的描述方式—博弈树。

所谓博弈树,就是由结和有向枝构成的“有向树”。

图6-1给出的是当市场需求为大时,完全信息动态的“新产品开发博弈”的博弈树。

在图6-1所示的博弈树中,最上端的一个点1x (用空心圆表示)表示博弈的开始,将“企业1”标示在点1x 上,表示博弈开始于企业1的选择。企业1的选择有“开发”和“不开发”,分别用标有“开发”和“不开发”的有向枝表示。若企业1选择“开发”,则博弈从点1x 达到2x (用实心圆表示);若企业1选择“不开发”,则博弈从点1x 达到点3x (用实心圆表示)。点2x (或3x )上标有“企业2”,表示企业2在博弈到达点2x (或3x )时,即企业1选择“开发”(或“不开发”)后,再进行选择;企业2的行动也有“开发”和“不开发”,同样分别用标有“开发”和“不开发”的有向枝表示。若企业2选择“开发”,则博弈从点2x (或3x )达到点4x (或6x )(都用实心圆表示);若企业2选择“不开发”,则博弈从点2x (或3x )达到点5x (或7x )(都用实心圆表示)。由于企业2选择后博弈结束,因此点4x 、5x 、6x 和7x 都表示博弈的结束。在点4x 、5x 、6x 和7x 旁标有支付向量,表示博弈达到该点时企业的所得。其中,支付向量中的第一个数字表示企业1的所得,第二个数字表示企业2的所得1

1

一般情形下,支付向量中数字的顺序与博弈树中参与人的行动顺序相对应。

图6-1中,点1x 、2x 、3x 、4x 、5x 、6x 和7x 称为博弈树的结(node ),其中标有参与人(即企业)的结1x 、2x 和3x 称为决策结(decision node ),表示参与人在此选择行动;标有支付向量的结4x 、

5x 、6x 和7x 表示博弈结束,称为终点结(terminal node )。在决策结中,决策结1x 表示博弈的开始,

亦称为博弈树的初始结或根(root )。结与结的连线称为博弈树的枝(branch ),表示博弈从枝的一个结达到另一个结参与人需要选择的行动。例如,博弈从决策结1x 达到2x ,需要企业1选择行动“开发”,所以在连接1x 和2x 的枝上标有行动“开发”。在博弈树中,枝是有向的,表示博弈只能从枝的一个结达到另一个结。例如,在连接1x 和3x 的枝上,标有行动“不开发”,表示当企业1选择“不开发”时,博弈从1x 达到3x ,因此连接1x 到3x 的枝的方向是从1x 指向3x 。

通过以上介绍,再考察图6-1中的博弈树,可以得到这样的信息: (1)博弈中的参与人是企业1和企业2; (2)博弈中企业1先选择,企业2后选择;

(3)企业1选择时有行动“开发”和“不开发”,企业2选择的行动有“开发”和“不开发”; (4)博弈中企业的支付。

也就是说,除了“企业2行动时是否观测到企业1的选择”这一点暂时无法从图6-1中知道以外,完全信息动态的“新产品开发博弈”的扩展式描述所需要的信息(或要素)都可以从图6-1中得到。

如果还能够直接从博弈树中知道“企业2行动时是否观测到企业1的选择”,那么给出博弈树,就意味着给出了完全信息动态的“新产品开发博弈”的扩展式描述。

下面探讨如何在博弈树中,将“企业2行动时是否观测到企业1的选择”这一信息表示出来。

在完全信息动态的“新产品开发博弈”中,企业2决策时企业1已经做出选择,此时企业2面临的决策情形无非只有以下两种: 第一种:企业2知道企业1的选择; 第二种:企业2不知道企业1的选择。

对于第一种情形,企业2知道企业1的选择,即知道企业1选择“开发”还是“不开发”,因此企业2知道博弈是从1x 到了2x 还是从1x 到了3x 。这就意味着当轮到企业2决策时,他知道自己是在点2x 上还是在点3x 上。对于第二种情形,企业2不知道企业1的选择,即不知道博弈是从1x 到了2x 还是从1x 到了3x 。因此,当轮到企业2决策时,他不知道自己是在点2x 上还是在点3x 上。所以,“企业2行动时是否观测到企业1的选择”这一问题,实际上就等价于“企业2行动时是否知道自己是在博弈树中的点2x 上还是在点3x 上”。

为了将“企业2行动时是否知道自己是在博弈树中的点2x 上还是在点3x 上”这一点说清楚,需要引入“信息集”(information set )的概念。

在博弈树中,参与人i 的一个信息集(用i I 表示)是参与人i 决策结的一个集合,它满足以下条件: (1)i I 中的每个决策结都是参与人i 的决策结;

(2)当博弈到达信息集i I (即博弈到达i I 中某个决策结)时,参与人i 知道自己是在信息集i I 中的决策结上,但不知道自己究竟在i I 中哪个决策结上。

因此,参与人i 的信息集i I 可以用来描述当轮到参与人i 行动时他所了解到的信息,即他知道什么(知

道自己位于哪一个信息集上)、不知道什么(不知道自己位于信息集中哪一个决策结上)。

例如,在“新产品开发博弈”中,假设企业1先行动,企业2后行动,但企业2行动时不知道企业1的行动,那么在如图6-1所示的博弈中当企业2行动时就只知道博弈要么到达点2x ,要么到达点3x ,但具体在哪一点上,企业2不清楚。也就是说,企业2只知道自己位于决策结集合23{,}x x 上,但不知道位于23{,}x x 中哪一个决策结上。在这种情况下,23{,}x x 就是企业2的一个信息集。如果假设企业2行动时知道企业1的行动,那么在如图6-1所示的博弈中,当企业2行动时就知道博弈是到达了点2x ,还是到达了点3x 。此时,企业2的决策结集2{}x 和3{}x 都是企业2 的信息集1

X

为一决策结集合,用

)(X I i 表示参与人i 的由决策结集X

构成的一个信息集。例如,

}{),(322x x I 表示企业2的由决策结集}{3

2,x x 构成的信息集,}{)(2

2

x I 和}{),(3

2

2

x x I 分别表示企业2

的由决结集}{2x 和}{3x 构成的信息集。

为了更好地理解信息集这个概念,考虑如图6-2所表示的博弈情形中参与人3的信息集2

(顺便考虑参与人2、参与人3的信息集)。

由于参与人3选择时,参与人1和参与人2都已经做出选择,因此参与人3选择时可能面临的决策情形就有以下4种:

(1)既知道参与人1的选择,也知道参与人2的选择; (2)知道参与人1的选择,但不知道参与人2的选择; (3)知道参与人2的选择,但不知道参与人1的选择; (4)既不知道参与人1的选择,也知道参与人2的选择。

1

注意,这是一种信息退化了的情况,即信息集中只含有一个决策结(亦称单结信息集)。此时,虽然信息集的定义要求参与人不知道自己在信息集哪一个决策结上,但由于只有一个决策结,实际上也意味着参与人知道自己在哪一个决策结上。

2

在图6-2中,省略了参与人的支付,但这样并不影响对问题的分析。

下面对上述4种情形分别进行考察:

首先考察第二种情形,即参与人3知道参与人1的选择,但不知道参与人2的选择。

参与人3知道参与人1的选择,就意味着当轮到他选择时,他知道博弈进入了博弈的左边(如果参与人1选择L )还是右边(如果参与人1选择R );但由于参与人3不知道参与人2的选择,因此当轮到他选择时,他不知道自己是在4x 上还是在5x 上,或者6x 上还是7x 上。但是,参与人3知道自己要么就在4x 或者5x 上,要么就在6x 或者7x 上,所以参与人3的决策结集

}{5

4

,x x 和}{7

6,x x 都为参与人3的信息

集。在博弈树中,用虚线将属于同一信息集的决策结连起来,表示它们属于同一信息集。例如,6-2中,用虚线将点4x 和5x 连起来,表示它们都属于信息集}{5

4

,x x ,用虚线将点6x 和7

x

连起来,表示它们都

属于与信息集 }{76,x x 。

其次考察第三种情形,即参与人3知道参与人2的选择,但不知道参与人1的选择。

虽然参与人3知道参与人选择了 '

L 还是 '

R ,但由于他不知道参与人1的选择,因此当参与人2选择 '

L 时,参与人3知道自己是在4x 或者6x 上,但究竟在哪一点上参与人3并不清楚,所以决策集合

}{64,x x 是参与人3的一个信息集。当参与人2选择 'R 时,参与人3知道自己是在5x 或者7x 上,但

究竟在哪一个点上并不清楚,所以决策结集合

}{75,x x 是参与人3的另一个信息集。在图中6-3中,用

虚线将点4x 和6x 连起来,表示它们都属于信息集}{64,x x ,用虚线将点5x 和7x 连起来,表示它们都属

于信息集}{75,x x 。

考察第四种情形,即参与人3既不知道参与人1的选择也不知道参与人2的选择。

由于参与人1和参与人2的选择参与人3都不知道,因此当轮到参与人3行动时,他只知道自己位

于点

4x 、5x 、6x 和7x 四点中的某一点上,但究竟在哪一点上参与人

3并不清楚,所以决策结集合

}{7654,,,x x x x 是参与人3的一个信息集。在图6-4中,用虚线将点4x 、5x 、6x 和7x 连起来,表示

它们都属于信息集}{7654,,,x x x x 。

最后考察第一种情形,即参与人3既知道参与人1的选择也知道参与人2的选择。

由于参与人3既知道参与人1的选择,又知道参与人2的选择,因此当轮到参与人3行动时,他知

道自己在点4x 、5x 、6x 和7x 四点中的哪一点上,所以决策集合}{4x 、}{5x 、}{6x 和}{7x 都是参与

人3的信息集(参见图6-5)。

从上面分析可以看到:如果有了信息集这个概念,同时又在博弈中用特定的方式将信息标示出来1

,那么给出一个博弈问题的博弈树时,实际上就意味着给出了这个博弈问题的扩展事描述。例如,如果读者现在看到的是如图6- 2(或者图6-3、图6-4、图6-5)所示的博弈树,那么就应该从图6-2中得到一个博弈问题的扩展事描述,这种描述包含了扩展事博弈的所有要素。

当然,当采用“将参与人属于同一信息集的决策结用虚线连起来”的方式表示参与人的信息集时,在图6-~2

图6-5隐含了参与人2行动时已经观察到参与人1的行动,因为在图6-~2图6-5中,参

与人2的信息集都是单结信息集(即值包含一个决策结的信息集)2

【例6-3】 考察“新产品开发博弈”。试用博弈树描述“两个企业都知道市场要求,且企业1先决策,企业2观察到企业1的选择后在进行选择”的博弈情形。

1

即将属于同一信息集问题结用虚线连起来这种方式来标示博弈中的信息集。

2

在博弈考试时,最先行动的参与人知道自己在博弈树起始结进行选择,所以行动的参与人

的信息集都是单结信息集。

图6-1实际上已经给出了当市场需求为大时,“新产品开发博弈”的博弈树。

图6-6给出的是当市场需求为小时,“新产品开发博弈”的博弈树。

注意,在图6-6的博弈树中没有标示出枝的方向。在以后的讨论中,假设博弈树中的博弈都是从上往下进行的,因此在不引起歧义的情况下,都不标示出博弈树中枝的方向。

以上讨论了博弈问题的扩展式描述,并给出了扩展式博弈的一种直观描述方式—博弈树。由于在博弈分析中,假设博弈的结构(或描述方式)为共同知识,因此在以后的讨论中,如果给出博弈树,就意味着所有的参与人都同时一起看到博弈树。

在博弈分析中,除了前面-再提到的博弈结构和参与人完全理性为共同知识外,对于多阶段的动态博弈问题,一般还假设参与人满足“完美记忆”(perfect recall )的要求,即假设参与人不会忘记以前知道或者做过的事情。

在现实生活中,不满足“完美记忆”要求的情形比比皆是。例如,人们在玩卜克时,往往会忘记自己曾经出过什么牌或者对手曾经出过什么牌;在棋类比赛中,也会出现这种情况。但是,在博弈分析中,如果没有“完美记忆”假设,各种博弈结果都有可能出现,那么也就无法对博弈结果进行预测。

考察图6-7中的博弈树。在图6-7中,当参与人1第二次行动时,他分析不清决策结4x 和5x 及6x 和

7x ,这还容易理解,因为他不知道参与人2的选择。但是,他分不清决策结4x 和5x 及6x 和7x 就让人难

以理解了。这实际上意味着:参与人1第二次行动时忘了他第一次行动时的选择。所以,图6-7所表示博弈不满足“完美记忆”要求。

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

关于定价的博弈论模型

CH13 关于定价的博弈论模型 分析寡头市场的最大困难在于策略问题。在此情形下,市场上仅有几家企业,每一家企业在做决策时,都必须在一定程度上考虑其它企业的行为。博弈论就是用以研究策略选择的一种主要的工具。 一、基本概念 在一些情况下,个人或企业必须作出策略性选择,并且最终的结果依赖于每一个行动者的选择,这种情况就可以看成是一个博弈。 1.博弈的三要素 任何一个博弈都必须具备三个要素: (1)博弈的参与者 参与人的具体身份无关紧要,在博弈中没有“好人”与“坏蛋”之分,我们只是简单地假设每个参与者在考虑到对手行为的前提下,做出最有利的策略性选择。 (2)策略 策略是博弈参与者的行动规则。 在非合作博弈中,参与者之间不能就策略选择达成一个有约束力的协议。 (3)支付(payoffs ) 支付是参与者的最终受益。支付包括了与博弈结果相关的所有方面,既包括显性的货币报酬,也包括隐性的参与者关于结果的心理感受。 2. 符号 两个参与者(A 和B )之间的博弈G 用下式表示 [,,(,),(,A B A B G S S U a b U a b 其中,A S 和B S 分别表示参与者A 和参与者B 的可选策略,(,)A U a b 和(,)B U a b 分别表示当参与者A 和B 分别选择策略a 和策略b 时,各自所得到的支付(,A B a S b S ∈∈)。 二、Nash 均衡 市场均衡:在均衡价格和产量下,买方和卖方都没有动力去改变自己的行为。

Nash 均衡:对于策略组合(**,a b ),如果给定其它参与者的策略,没有一个参与者会选择单方面偏离,那么这个策略组合就构成一个Nash 均衡。也就是说 ** * (,)(,)A A U a b U a b '≥ 对于所有A a S '∈ ** * (,)(,)B B U a b U a b '≥ 对于所有B b S '∈ 对纳什均衡的理解 设想所有参与者在博弈之前达成一个(没有约束力的)协议,规定每个参与人选择一个特定的战略。那么,给定其他参与人都遵守此协议,是否有人不愿意遵守此协议?如果没有参与人有积极性单方面背离此协议,我们说这个协议是可以自动实施的(self-enforcing ),这个协议就构成一个纳什均衡。否则,它就不是一个纳什均衡。 三、一个例子 两个厂商(A 和B )决定自己花多少钱用于做广告。每个厂商可以选择较高的预算(H )或较低的预算(L )。 1.博弈的扩展式表述 图13.1 2.博弈的策略式(规范式)表述 表13.1 3.占优策略和Nash 均衡 从表13.1可以看出,低预算(L )是厂商B 的占优策略,即不管厂商A 选择哪一种策略,L 都是厂商B 的最佳选择。由于该博弈的结构是公共知识,厂商A 也知道L 是厂商B 的占优策略,所以厂商A 将选择L 。因此,该博弈的均衡是(L ,L )。 请验证(L ,L )构成一个Nash 均衡,而其它三个策略组合都不是Nash 均衡。

从博弈论角度看古诺模型

从博弈论角度看古诺模 型 WTD standardization office【WTD 5AB- WTDK 08- WTD 2C】

博弈论的观点看古诺模型 罗思蕴 (华中师范大学数学与应用数学系,武汉430079) 摘要:运用博弈论的研究方法,对古诺模型的几种变式进行分析,给出模型解法的代数表达式,并对结果进行适当的对比分析,最后总结出不同模型对结论的改变情况。 关键词:古诺模型纳什均衡完全信息不完全信息静态博弈动态博弈 古诺模型(Cournot model)是博弈论中最具有代表性的模型之一,也是是纳什均衡最早的版本。它是法国经济学家古诺(Augustin Cournot)在1938年出版的《财富理论的数学原理研究》一书中最先提出的。而古诺的定义比纳什的定义早了一百多年,足以体现博弈论这样一个学科是深深扎根于经济学的土壤中的。从经济学的角度,它的研究价值在于古诺模型是介于两种极端状况完全竞争和垄断之间。 在古诺生活的时代,大多数市场都只有少数的厂商经营,所以这个模型在当时是极具现实意义的。随着时间的推移,古诺模型也演变出了各种不同的版本。如果从博弈论的角度分析,有四种情况极具代表性:完全信息静态博弈的古诺模型、不完全信息静态博弈的古诺模型、完全且完美信息动态博弈的古诺模型、无限次重复博弈的古诺模型。 1 经典古诺模型 古诺模型最初的形态是来自于经济学的。在经济学中,寡头的概念是指那种在某一产业只有少数几个卖者的市场组织形式。古诺模型对寡头具有如下的基本假设。一,

假定一个产业只有两个寡头,每个寡头生产同质产品,并追求利润最大化。二,两个寡头之间进行的是产量的竞争而不是价格竞争,且产品的价格依赖于两者生产的产品总量。三,寡头之间无勾结行为。四,每个生产者都把对方的产出水平视为定值。五,边际成本为常数。 在经典的古诺模型中,每个企业具有相同的不变单位成本: 需求函数为: 第i个企业的利润为: 最优化的一阶条件为: 反应函数为: 解得纳什均衡为: 每个公司的利润为: 古诺模型是在假定寡头具有完全信息的基础上导出的。在这一均衡中,每个寡头都可以准确猜测对手的产量,从而选择自己的最大产出。 最重要的是,古诺均衡解在寡头无勾结的假定下求出的。如果考虑寡头之间相互勾结而达到均衡的情况,那么经过计算可以得到实际产出水平与实际价格上等于完全垄断条件下达到的产量与价格。更广泛的,考虑无勾结寡头市场、垄断市场、自由市场,可以得到:无论是产量还是价格,无勾结寡头市场都是处于中间的位置。也就是说,如果寡头市场不存在勾结的行为,其效率高于完全垄断,低于完全竞争。 2 博弈分类下的两种古诺模型 不完全信息静态博弈的古诺模型 完全信息静态博弈的古诺模型即经济学中最经典的形式,它假设了厂商相互完全

博弈论浅谈

博弈论浅谈 在查找博弈论课题资料的过程中,不禁发现自己已经深深地被这门数学分支吸引住了。我想,这门学问的魅力主要在于它的实用性,数学中很少有一个方面能够被如此广泛地应用到实际生产实践、解释自然界的现象当中。而博弈论无疑是这其中一个既吸引数学家也吸引着数学“门外汉”的“大众科学”了。 博弈论又称对策论,主要研究斗争性或竞争性现象的理论解决方法,是现代数学的分支,也是运筹学的一部分。博弈论会考虑竞争过程中的个体的预测行为和实际行为,并研究它们的优化以达到最优化策略。一般以1928年数学家、计算机专家冯·诺依曼证明了博弈论的基本原理这一事件作为博弈论正式诞生的标志。发展至今已经渐趋完善,此过程中有许多优秀的学者如冯·诺伊曼、约翰·纳什等为之作了卓越贡献。由于博弈论与经济学类相关甚紧,博弈论中某一理论的研究常常会带来经济学领域的一大突破,正如1994年约翰·纳什作为数学家获诺贝尔经济学奖所体现的一样,这种跨学科的效应在博弈论学中淋漓尽致地体现了出来。 “博弈论”该词在现代社会可以说是脍炙人口,在各种大型讲演和授课中经常能听到,但我个人觉得这个词的翻译不如它的英文源词“Game Theory”一样直白。“Game Theory”如果理解为“游戏的理论”更能够清晰地向一位不了解博弈论的人介绍这门科学。至于上升

到“博弈”的层次当然也是有其原因的。“Games”在当代早已将其内涵和外延延伸至社会科学、自然科学的方方面面,已经不仅仅停留在“游戏”的层面上。广义上来说,一个结构中的群体之间的相互作用构成一个博弈。狭义一点,社会中人群之间或集团之间的合作、承诺、互相利用等也是博弈论的体现。从理论上讲,博弈论是研究理性的行动者相互作用的形式理论,因为博弈论的基本假定是博弈各方的行动者具有推理能力,在具体策略选择时的目的是使自己的利益最大化。博弈论研究的是理性的博弈方之间如何进行策略选择的。由此可知,大到社会的发展、生物的繁衍,小至下棋打牌都可以看作是博弈。这么说来博弈论对于我们来说一点也不陌生,这些不正是与我们息息相关的日常事务?中国人对博弈论自古代就有深入的了解,甚至有将其理论系统化。比如《三十六计》就将当时军事上使用的计谋等集中收集到了一起,这种“计谋”其实就是指导人们的博弈理论。 作为数学的一个分支,且不论博弈论对自然科学的重要性,它还对社会科学有着重要的意义,是社科研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。它还深刻地改变着人们的思维,如人们熟知的“囚徒困境”“海盗分宝石”等问题已经作为经济学、心理学的经典案例;成功企业中的高管与智囊团因善于博弈、制定正确的发展战略而使公司利于不败之地;政府公务员在制订法律、颁布政策时也需要不断利用博弈理论,站在人民的角度看问题从而进一步完善规章制度以促进外

豪泰林(hotelling)产品决策模型

豪泰林(hotelling )产品决策模型 对伯特兰德悖论(Bertrand paradox )的一种解释是引入产品差异性。如果不同企业生产的产品是有差异的,替代弹性就不会是无限的,在这种情况下,消费者对不同的产品具有不同的偏好,购买该产品的均衡价格就不会等于边际成本。 产品差异有多种形式,豪泰林(Hotelling ,1929)提出了一个考虑空间差异的产品决策模型。在此模型中,产品在物质性能上是相同的,但在空间位置上存在差异,因为不同位置上的消费者要支付不同的运输成本,这时他们关心的是价格和运输成本之和,而不仅是价格。 假定有一个长度为1的线性城市,消费者均匀地分布于[0,1]区间内,分布密度为1。假定有两个商店,分别位于城市两端,出售的产品性能相同,每个商店提供单位产品的成本为c ,消费者购买商品的旅行成本与距商店的距离成比例,单位距离的成本为t 。这样,住在x 处的消费者若去商店1购买要花费tx 的运输成本;若去商店2去购买,要花费)1(x t -的成本。为简单起见,现假定消费者具有单位需求,即或者消费1个单位,或者消费个0个单位。 假定两个商店同时选择自己的销售价格,现考虑两商店进行价格竞争的纳什均衡。 在该博弈中,两个参与者为商店1和商店2,其可选择的策略分别为各自的价格1p 、2p 。设),(21p p D i 为需求函数,2,1=i 。 若住在x 的消费者在两个商店之间是无差异的,则所有在x 左边的消费者都将在商店1购买,所有住在x 右边的消费者将在商店2购买,需求分别为x D =1,x D -=12,这里,x 满足 )1(21x t p tx p -+=+ (1) 由(1)式得两商店的需求函数分别为 t t p p x p p D 2),(12211+-==

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则 为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消

费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与 人在何时行动; 3、 序列结构:每个参与人行动时面 临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

(数学建模教材)7第七章对策论

第七章 对策论 §1 引言 社会及经济的发展带来了人与人之间或团体之间的竞争及矛盾,应用科学的方法来 解决这样的问题开始于 17 世纪的科学家,如 C.,Huygens 和 W.,Leibnitz 等。现代对 策论起源于 1944 年 J.,V on Neumann 和 O.,Morgenstern 的著作《Theory of Games and Economic Behavior 》。 对策论亦称竞赛论或博弈论。是研究具有斗争或竞争性质现象的数学理论和方法。 一般认为,它既是现代数学的一个新分支,也是运筹学中的一个重要学科。对策论发展 的历史并不长,但由于它所研究的现象与人们的政治、经济、军事活动乃至一般的日常 生活等有着密切的联系,并且处理问题的方法又有明显特色。所以日益引起广泛的注意。 在日常生活中,经常看到一些具有相互之间斗争或竞争性质的行为。具有竞争或对 抗性质的行为称为对策行为。在这类行为中。参加斗争或竞争的各方各自具有不同的目 标和利益。为了达到各自的目标和利益,各方必须考虑对手的各种可能的行动方案,并 力图选取对自己最为有利或最为合理的方案。对策论就是研究对策行为中斗争各方是否 存在着最合理的行动方案,以及如何找到这个合理的行动方案的数学理论和方法。 §2 对策问题 对策问题的特征是参与者为利益相互冲突的各方,其结局不取决于其中任意一方的 努力而是各方所采取的策略的综合结果。 先考察一个实际例子。 例 1(囚徒的困境) 警察同时逮捕了两人并分开关押,逮捕的原因是他们持有大 量伪币,警方怀疑他们伪造钱币,但没有找到充分证据,希望他们能自己供认,这两个 人都知道:如果他们双方都不供认,将被以持有大量伪币罪被各判刑 18 个月;如果双 方都供认伪造了钱币,将各被判刑 3 年;如果一方供认另一方不供认,则供认方将被从 宽处理而免刑,但另一方面将被判刑 7 年。将嫌疑犯 A 、 B 被判刑的几种可能情况列 于表 1。 表 1 表 1 中每对数字表示嫌疑犯 A 、B 被判刑的年数。如果两名疑犯均担心对方供认并希 望受到最轻的惩罚,最保险的办法自然是承认制造了伪币。 从这一简单实例中可以看出对策现象中包含有的几个基本要素。 2.1 对策的基本要素 (i )局中人 在一个对策行为(或一局对策)中,有权决定自己行动方案的对策参加者,称为局 中人。通常用 I 表示局中人的集合.如果有 n 个局中人,则 I = {1,2,L , n }。一般要求 一个对策中至少要有两个局中人。在例 1 中,局中人是 A 、B 两名疑犯。 (ii )策略集 一局对策中,可供局中人选择的一个实际可行的完整的行动方案称为一个策略。参 加对策的每一局中人 i , i ∈ I ,都有自己的策略集 S i 。一般,每一局中人的策略集中 至少应包括两个策略。 -154- 嫌疑犯 B 供认 不供认 嫌疑犯 A 供认 不供认 (3,3) (0,7) (7,0) (1.5,1.5)

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

博弈论的总结|博弈论总结

博弈论学习的个人总结刘艳丽 第一部分基本情况 视频来源耶鲁公开课《博弈论》1----5讲,人人影视 参考资料耶鲁校园网 《博弈论--战略分析入门》,美,罗杰A麦凯恩,原毅军译,机械工业出版社,2006,42元《策略博弈》,阿维纳什迪克西特,蒲勇健译,中国人民大学出版社,第二版,2009,65元班级工商,人力08级学生 课时8节 我的时间投入视频26个小时;书籍,25小时;上网时间,无法统计。 第二部分知识层面 一、The five lessons五个基本的结论 1、Don"t play a strictly dominated strategy

2、Rational choices can lead to bad outcomes 3、You can"t get what you want 4、Put yourself in other people"s shoes 5、Yale students are evil 二、Game 2: "pick a number."数字游戏 Without showing your neighbor what you"re doing, put in the box below a whole number between 1 and a 100 [whole number between 1 and 100--integer.] We will calculate the average number chosen in the class. The winner in this game is the person whose number is closest to two-thirds times the average in the class. 三、The Prisoners" Dilemmasome examples囚徒困境 A joint project Price competition

博弈论

博弈论 是一种处理竞争与合作问题的数学决策方法;研究竞争中参加者为争取最大利益应当如何做出决策的数学方法;根据信息分析及能力判断,研究多决策主体之间行为相互作用及其相互平衡,以使收益或效用最大化的一种对策理论;研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。近代对于博弈论的研究,开始于策墨洛(Zermelo),波雷尔(Borel)及冯·诺伊曼(von Neumann)。 1928年,冯·诺依曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。1950~1951年,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,为博弈论的一般

化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的学科。 博弈的分类根据不同的基准也有所不同。一般认为,博弈主要可以分为合作博弈和非合作博弈。它们的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议,如果有,就是合作博弈,如果没有,就是非合作博弈。从行为的时间序列性,博弈论进一步分为两类:静态博弈是指在博弈中,参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动;动态博弈是指在博弈中,参与人的行动有先后顺序,且后行动者能够观察到先行动者所选择的行动。通俗的理解:"囚徒困境"就是同时决策的,属于静态博弈;而棋牌类游戏等决策或行动有先后次序的,属于动态博弈。按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中,每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。如果参与人对其他参与人的特征、策略空间及收益函数信息了解的不够准确、或者不是对所有参与人的特征、策略空间及收益函数都有准确的准确信息,在这种情况下进行的博弈就是不完全信息博弈。目前经济学家们现在所谈的博弈论一般是指非合作博弈,由于合作博弈论比非合作博弈论复杂,在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为:完全信

博弈论培训心得

博弈论培训心得 -------李佳航 经过两次对博弈论的培训本人感触很深,也看了许多关于博弈的案例也从案例从学习了很多关系学习生活为人方面的博弈。 学习后现在简单总结一下: 1、博弈论中有很多的模型,其实记住模型并不是最重要的东西,掌握将问题变成博弈格局图以及进行优势策略标注法,找到纳什均衡更加重要。世界上的事情千变万化,仅仅靠这几个模型是无法全部解释的,而且模型与模型之间,仅仅变换几个数字,则发生变化。 2、博弈论可以将社会问题变成一个数学模型来计算推理,因此我们运用此模型时,需要相对准确地核定博弈各方的支付大小,解决问题的过程中,可设法改变参数让博弈对自己更加有利。 3、基本博弈模型的作用在于解决问题时更加容易去套,而不需要计算即知道博弈的结果将是什么,因此对于分析问题是有益的。有了模型在,对于一些谈判,容易让人站在博弈论的高度去分析它,这往往让人对谈判更加具有控制力。 4、对于较为简单的事件,完全不需要学习博弈论即能找到问题的答案,我们现实生活中的都自然而然的达到了博弈的均衡结果。 本周培训主要是讲的卡尼曼的前景理论和损失规避。 前景理论: 1、“二鸟在林,不如一鸟在手”,在确定的收益和“赌一把”之间,多数人会选择确定的好处。所谓“见好就收,落袋为安。称之为“确定效应”。 2、在确定的损失和“赌一把”之间,做一个抉择,多数人会选择“赌一把”。称之为“反射效应”。 3、白捡的100元所带来的快乐,难以抵消丢失100元所带来的痛苦。称之为“损失规避”。 4、很多人都买过彩票,虽然赢钱可能微乎其微,你的钱99.99%的可能支持福利事业和体育事业了,可还是有人心存侥幸搏小概率事件。称之为“迷恋小概率事件”。 5、多数人对得失的判断往往根据参照点决定,举例来说,在“其他人一年挣6万元你年收入7万元”和“其他人年收入为9万元你一年收入8万”的选择题中,大部分人会选择前者。称之为“参照依赖”。 损失规避: 如何理解“损失规避”?用一句话打比方,就是“白捡的100元所带来的快乐,难以抵消丢失100元所带来的痛苦”。 前景理论最重要也是最有用的发现之一是:当我们做有关收益和有关损失的决策时表现出的不对称性。对此,就连传统经济学的坚定捍卫者保罗·萨缪尔森,也不得不承认:“增加100元收入所带来的效用,小于失去100元所带来的效用。” 这其实是前景理论的第3个原理,即“损失规避”(lossaversion):

博弈论教材2013-2

第三章 纳什均衡及其应用 3.1 混合策略纳什均衡 1 鹰鸽博弈 我们知道老鹰具有攻击性,而鸽子爱好和平。在原始社会里有两个部落,可以做出两个行动:一是进攻一是和平,分别用鹰和鸽表示。 表1 鹰鸽博弈 乙 甲 鹰 鸽 该博弈的那是均衡为(鹰,鸽),(鸽,鹰)。一些学者研究发现,在同一个地域内,“鹰”和“鸽”的比例为0.36:0.64。事实上,设鹰鸽比为:1z z -,可以得出如下结果: ()2514(1)1439E e z z z =-+-=-; ()95(1)514E d z z z =-+-=- 9 0.3625 z = = 聪明的做法是:当鹰鸽比小雨0.36时,选择鹰策略;否则选择鸽策略。使用混合策略方法分析: 第一步:混合策略型表示: 乙 鹰 鸽 甲 鹰 p 鸽 1-p 第二步:计算期望效用: (925)514(259)514E p q q E q p p =-+-=++-甲乙 第三步:作出最优反应函数

91 259[0,1] 2590 25q p q q ???若若若, 90 259[0,1] 259 1 25p q p p ? ?? 如果如果如果 第四步:作出反应函数的图像 第五步:根据交点,找出纳什均衡:其中( 99 ,2525 )是混合策略纳什均衡。 2 斗鸡博弈 我的老家地处安徽最北部,苏鲁豫皖四省交界之处,东北处有条小河。河边的棉花地里,经常有鹌鹑栖息在其间。秋末冬初的农闲时节,小鹌鹑刚好长成。村民结网捕鹌鹑把玩、斗鸟儿为乐。每天早晨4点多钟出发,大约7点钟回来,雄性的鹌鹑留起来先要整夜整夜的熬鹌鹑、放在手里把鹌鹑,真正熟练了,才拿出来和别人的相斗。设想两只鹌鹑要在场子里一决雌雄。每只鹌鹑都有两个策略:攻击或逃跑。由于两只鹌鹑实力相当,若同时选择进攻会两败俱伤;若一只进攻,一只逃跑,进攻者胜利。逃跑的鹌鹑算是玩完了,以后再也没胆量进场子,主人也不回在把玩它,会用一块黑布把它的笼子蒙起来,培养成“叫子”,以后后捕鹌鹑的时候拎出去吸引同伴。若同时逃跑不会败掉,以后还能斗,但是都会挨饿一天。 1 p q

博弈论与经济模型第10章

第10章机制设计与拍卖 10.1 导论 在本章和下一章里,我们将介绍博弈论中用来处理机制和市场设计的主要工具。存在着许多这样一些类型的例子。政府可能会去规制(regulate)垄断企业,使其行为符合特定的所期望的准则;艺术品收藏家要在出售其手中的画作中获得尽可能高的收益;社会计划者要保证开支在使用者之间有效地分配;学校管理系统要按照某种准则把它的空间在学生之间进行配置,等等。在本章里,我们主要关心销售机制的设计问题;在下一章中,我们将处理两组个体之间的匹配问题。 10.2 拍卖 10.2.1 历史概述 在一个“拍卖”中,物品被卖给出价最高的人。广义的“拍卖”是指对重要的经济资源进行配置,从艺术品到短期政府公债到近海油气田开发权再到无线电频率使用权等等。它采用多种不同的形式。例如,可以用轮流报价的方法(如艺术品拍卖)或密封式提交报价等。支付的成交价可以是最高报价,或某些其它价格;如果拍卖的物品不止一种,则既可以采用所有物品打包式的同时报价,也可用每种物品陆续报价的方式。博弈论分析有助于我们理解各类报价设计的结果;例如,它建议出可以最有效配置资源且带来最高收入的拍卖机制设计。在这一节里,我们来讨论这样的拍卖,其中每个买者知道他自己以及每个其他买者对于物品的估价。在后面的章节里,我们还要发展出允许我们假定买者之间互相不知道别人对物品的估价的情况下,对拍卖进行研究的工具来。 拍卖的现实背景:从巴比伦到网上购物拍卖有着相当长的历史。Herodotus,公元前1500年的古希腊作家,曾与Thucydies一起创立了历史学,曾对巴比伦的拍卖加以了描述。他写道,巴比伦人“最引人注目”的传统就是每个村庄里一年一度的拍卖,这种拍卖是对到了结婚年龄的女子进行的拍卖。对男人最具吸引力的女人首先被出;他们要求一个正的价格,而最不具吸引力的女人则倒过来向娶她的男子支付价格。在每次拍卖中,报价是轮流出价的,出价最高的男子胜出,并支付他报出的价格。 拍卖也出现于公元前1500年和400年的雅典,是出售征税权,对没收的财产的处置权,以及出租土地与矿山等。关于这些拍卖的实质内容的证据很少,但有一些有趣的东西留了下来。例如,雅典政治家Andocides(C.440—391B.C.)曾对一个征税权拍卖中的串谋提出了一个报告。 在古罗马经常开展一些拍卖的活动,且在罗马帝国之后的中世纪欧洲还继续着这种活动(例如,在中世纪和早期现代低地国家中的城镇里,每年都要对征税权进行拍卖)。最早出现英语单

博弈论的基本概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

博弈论经典模型全解析

博弈论经典模型全解析(入门级) 1. 囚徒困境这是博弈论中最最经典的案例了——囚徒困境,非常耐人寻味。“囚徒困境”说的是两个囚犯的故事。这两个囚徒一起做坏事,结果被警察发现抓了起来,分别关在两个独立的不能互通信息的牢房里进行审讯。在这种情形下,两个囚犯都可以做出自己的选择:或者供出他的同伙(即与警察合作,从而背叛他的同伙),或者保持沉默(也就是与他的同伙合作,而不是与警察合作)。这两个囚犯都知道,如果他俩都能保持沉默的话,就都会被释放,因为只要他们拒不承认,警方无法给他们定罪。但警方也明白这一点,所以他们就给了这两个囚犯一点儿刺激:如果他们中的一个人背叛,即告发他的同伙,那么他就可以被无罪释放,同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决,并且为了加重惩罚,还要对他施以罚款,作为对告发者的奖赏。当然,如果这两个囚犯互相背叛的话,两个人都会被按照最重的罪来判决,谁也不会得到奖赏。那么,这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果:自由。但他们不得不仔细考虑对方可能采取什么选择。A犯不是个傻子,他马上意识到,他根本无法相信他的同伙不

会向警方提供对他不利的证据,然后带着一笔丰厚的奖赏出狱而去,让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到,他的同伙也不是傻子,也会这样来设想他。所以A犯的结论是,唯一理性的选择就是背叛同伙,把一切都告诉警方,因为如果他的同伙笨得只会保持沉默,那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了,那么,A犯反正也得服刑,起码他不必在这之上再被罚款。所以其结果就是,这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应:坐牢。企业在信息化过程中需要与咨询企业、软件供应商打交道的。在与这些企业打交道的过程中,我们不可避免地也会遇到类似的两难境地,这个时候需要相互之间有足够的了解与信任,没有起码的信任做基础,切不可贸然合作。在对对方有了足够的信任之后,诚意也是必不可少的,如果没有诚意或者太过贪婪,就可能闹到双方都没有好处的糟糕情况,造成企业之间的双输。 2. 智猪博弈在博弈论(Game Theory)经济学中,“智猪博弈”是一个着名的纳什均衡的例子。假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着控制猪食供应的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时到槽边,收益比是

基于博弈论的恋爱模型

《数学建模》 课程考核论文 姓名:王湘衡齐久坤张程勇 学号:08100225 08100217 08100232 班级:08信息2班 2011年5 月10日

基于博弈论的恋爱数学模型 摘要 本文用数学建模的方法研究博弈论中的问题,从不完全信息静态博弈建立模型建立模型,并利用纳什均衡原理程序来确定纳什均衡点,对不同均衡点进行分析,从而来确定最佳策略。然后通过海萨尼转换将不完全信息静态博弈转换成不完全信息动态博弈,来模拟现实社会中的恋爱,再利用恋爱者不同类型的分布概率,求出恋爱者的期望,最终来决策恋爱者自己下一步的策略。 关键词:恋爱模型博弈论贝叶斯纳什均衡

1、问题重述 随着社会的进步和发展,现在恋爱问题越来越成为生们关注的热门话题,那么如何利用数学知识来确定恋爱中双方能找到适合自己的恋人,成为现在数学建模中研究的一个重要领域。恋爱模型可以用博弈论来确定双方的合适恋人,这其中将恋爱双方都理想化,这样将给我们研究恋爱问题和建立数学模型带来方便,使我们能将恋爱模型数学化,从而确定恋爱者的进一步决定。 2.模型假设及符号说明 模型假设: 1、恋爱双方都有自己明确的恋爱目标 2、恋爱双方从始至终都保持着自己的理性 3、恋爱双方都有自己喜欢类型的人,并且不会随时间变化 4、恋爱的男女通过对方的行为能够明确的判断出对方为哪种类型的人 5、恋爱的参与生都选择的是均衡战略 符号说明: 3. 问题分析与模型建立 3.1 问题分析 谈恋爱作为一个日常生活中最常见的现象要模型化却也并不简单。我们不妨

这样来看,谈恋爱的男女双方,各有不同类型,我们简单将其分为为了寻找真正爱情的人和为了骗财骗色的人。虽然这样不免有所武断,但我们分析的是一般现象,寻求的是一般解释。有了这样的分类便有了不同的组合,有了我们这个世界的爱恨情仇。我们的分析中有现代版的陈世美,却不会让他得逞,原因是理性经济人的假设。有人说这一点说不通,我不这样认为,经济学说所有人都是理性的并不影响不理性家伙们的存在,能解释一切的理论只能是没有内容的套套逻辑。一个理论的解释力只不过是它一般化的程度罢了。 简单的博弈理论己深入人心,显然上面的问题是不完全信息博弈,无论是男追女还是女追男,信息的不完全或是不对称是显而易见的,用博弈论的话说是对对方的了解不够精确。因此,我们依据博弈论理论可以将其分为静态博弈和动态博弈。静态分析是找出其静态均衡,动态分析是揭示现实中生的行为。 3.2 模型的建立 3.2.1不完全信息静态博弈模型 所谓静态是指所有参与生都同时行动,不会以别人行动的信息来更改自己的行动。我们以最常见的男追女为例,一个男生追求一个女生,在此情况下女生最苦恼的是不知男生是A类型的人还是B类型的人,虽然自己可以从各种渠道了解男生,但知生知面不知心,风险还是存在的。在这种情况下女生所遇到的就是不确定性条件下的选择问题,因为女生不仅不知道男生的类型(A还是B),而且还不知道不同类型的分布概率,但她对自己所属的类型是清楚的,这是她的私人信息。同理男生也是这样。 下面来设定支付函数的权值,以便求出纳什均衡点,设男A类追求者,只要他追求A类女生就得到10,他不追求A类女生就得到-10,A类女生接受得到10,拒绝得到-10;男B类追求者,他追求A类女生得到10,不追求得到-10,A类女生接受得到-10,拒绝得到10;男A类追求者,他追求B类女生得到-10,不追求得到10,B类女生接受得到10,拒绝得到-10;男B类追求者,他追求B类女生得到10,不追求得到0,B类女生接受得到10,拒绝得到0;他们的支付函数的权值依赖追求者的类型。这里用下面四张表说明:

(完整word版)博弈论给我的心得

博弈论给我的心里体会 潘慧明 201202034049 12金融数学 我是大学第二学期开始选修学习《博弈论》的,并且以前对它停留在表面意思。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过这个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述。那么什么是“博弈论”?所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。并且学习后我还有个感受就是:博弈论有两个比较enlightening的观点,一是more information can hurt you(掌握更多的信息可能是一件坏事),二是more options can hurt you(拥有更多的选择可能是一件坏事).虽然博弈论主要用于研究经济问题,但是我觉得这些原理在我们现实生活中同样是适用的。 而且经过这段时间的学习,我现在对《博弈论》有了些比较肤浅的认识。诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。因此在生活中我们要懂得学以致用,要会灵活的去使用这门学科。 人生就是在弈棋,学会博弈。虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 社会生活中,共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。拥抱双赢,拥抱明天。双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。但是双方都得到了满意的结果。这些双赢的事例,在商务上经常可以看到的。如:商务上的谈判,完完全全的运用到了《博弈论》的知识与原理来分析问题,并且从而找到最佳的均衡点,也就是最好的解决方法。 在所有的对抗和较量中,其胜负成败常常取决于三个基本的因素:机会或者说运气、体能和智能。头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每

相关文档
相关文档 最新文档