文档库 最新最全的文档下载
当前位置:文档库 › 博弈树与逆向归纳法1

博弈树与逆向归纳法1

博弈树与逆向归纳法1
博弈树与逆向归纳法1

动态博弈与逆向归纳法

假如欺负他人可以获得快乐,那你会欺负他人吗?大多数人的回答是不会,原因正如他们所指出的,欺负他人会担心他人的报复,这抵消了从欺负他人的行为中所能得到的快乐。这个答案至少表明,你之所以现在没有欺负他人,并不因为不想欺负他人,而是因为你知道欺负他人会在将来给自己造成麻烦。同样,当我们面临一些博弈对局的时候,我们应如何采取现在的行动,常常取决于每个行动在将来会产生什么后果,或者说在将来别人将如何反应。

在前面各章内容中,博弈是静态的——或者说是同时行动的。而现实中的博弈常常是动态的、依序行动的,这就要求我们必须考虑人们在将来对我们的行动反应。分析序贯行动博弈的一个重要思路就是:向前展望,向后推理(looking forward and reasoning backward),即面向未来,思考现在,站在未来的立场来确定现在的最优行动。本章我们将通过一些例子来说明这一分析思路,其中有些例子很有趣,也很有挑战性。

§5-1 逆向归纳法

1、美中军事政治博弈

我们通过一个简单的例子来说明序贯博弈的(离散策略的)扩展式表达和逆向归纳法求解方法。这个例子可以称做美中军事政治博弈,或者叫“毛泽东的对外军事政治战略”。

故事模型

在我国解放初期,美国一直试图对我国实施打击。此时,我国必须对美国采取应对之策。就我国对美国可以采取的行动而言,无非是回击或不回击。用更符合毛泽东的话来说,美国可以“犯我”或“不犯我”,而我们可以“犯人”或“不犯人”。

由此我们可以刻画出一个动态博弈:

●博弈方:美国、中国;

●行动空间:美国可选择的行动是“犯我”或“不犯我”;中国的选择是“犯人”或“不犯人”;

●行动顺序:美国先行动;中国观察到美国的行动后再选择自己的行动;

●赢利:我们这样假设赢利状况(数字是虚拟的);

●如果美国“犯我”,中国“犯人”,恶战再所难免,则美国亏损2,中国

亏损2;

●如果美国“犯我”,中国“不犯人”,那么中国沦为美国的附庸,丧失国家主权,则美国获得2,中国亏损4;

●如果美国“不犯我”,中国“犯人”,那么就是中国挑起战事,美国正好有借口纠合国际力量打击中国,则美国得3,中国亏损5;

●如果美国“不犯我”,中国“不犯人”,各自和平地发展经济,则美国得1,中国得1。

2、博弈树

对于上述动态博弈,我们可以用博弈树(game tree)表达如下(图5-1):

(-2,-2)(2,-4)(3,-5)(1,1)

图5-1 美中军事政治博弈

图5-1的博弈树是这样解读的:美国先选择“犯我”或“不犯我”,然后中国观察美国的选择后选择“犯人”或“不犯人”;最右边的括号内数字是各种情况下双方的赢利状况,前一个数字代表第一个行动人(美国)的赢利,第二个数字代表第二个行动人(中国)的赢利。依此类推,如果有更多的参与人序贯行动,则赢利的排列顺序与行动顺序一致。

3、逆向归纳法

究竟什么是图5-1博弈的均衡呢?在完美信息动态博弈中,我们要找的均衡实际上是一条路径,即从第一个行动人决策结点出发,一直到某一个终点之间的路径。所谓均衡路径就是在每一个决策阶段,没有人会偏离这条路径。这条路径所代表的策略均衡被称做子博弈完美均衡。

下面我们介绍如何用逆向归纳法来求解博弈的均衡。逆向归纳的步骤是这样的:

●首先,从最后阶段行动的参与人决策开始考虑。在图5-1的博弈中,最后行

动的是中国,因此我们先考虑中国怎么决策。在考虑中国的决策时,我们假

定美国已经选了“犯我”或“不犯我”;

◆如果美国选择了“犯我”,在图5-1中可发现,中国选择“犯人”会

得到-2,选择“不犯人”会得到-4;因此中国必然选择“犯人”——

我们就在中国“犯人”的分枝上画上一个短短的横线标记;

◆如果美国选择了“不犯我”,从图5-1中可发现,中国选择“犯人”

会得到-5,选择“不犯人”会得到1,因此中国必然选择“不犯人”

——我们就在中国“不犯人”的分枝上画上一个短短的横线标记。

●然后,考虑次后阶段行动的人(例子中只有两个阶段,因此实际上就是第一

阶段行动的人)——美国。美国决策时会考虑中国的反应,而现在它已预见到中国将选择的行动就是两条划了双横线的分枝。所以,它很容易推出自己面临的情况是:

◆若选择“犯我。,则必然导致中国“犯人”,则美国得到-2;

◆若选择“不犯我”,则中国必选择“不犯人”,则美国得到1;

◆结果美国宁愿选择“不犯我”。照规矩,我们在美国“不犯我”的一个分

枝上画上横线。

●如果存在一个路径,其每个分枝都画上了横线,那么这条路径就是均衡路径。

可发现,在图5-1的例子中,均衡路径将是美国选择“不犯我”,而中国选择“不犯人”。

因此,美中博弈的子博弈完美均衡结果是:美国不侵犯中国,而中国也不侵犯美国。

逆向归纳法对于求解子博弈完美均衡之所以适用,其原因就在于它的解过程很好地体现了子博弈完美均衡的定义:一个策略组合只有在其路.既满足是整个博弈的均衡又满足该路径上每一个子博弈的均衡时候,‘才是子博弈完美均衡。

§5-2 逆向归纳法的应用

掌握了逆向归纳方法,现在我们就可以来看一些序贯行动博弈的例子。这些例子既充满趣味,也是对大家使用逆向归纳技术的一种训练,同时也可能是一种智力上的测试。

1、私奔博弈

故事模型

在我国汉代,有个青年作家叫司马相如,有个年轻的寡妇叫卓文君。卓文君的父亲喜欢附庸风雅,经常请一些所谓的才子到家里吟诗作赋,其中就包括司马相如。日情,并打算结婚。但是,这门亲事遭到文君父亲的反对。父亲对文君

说,你若跟司马结婚,那么就将脱离父女关系。

现在,卓文君应该怎样选择?是屈从父亲,还是跟心上人结婚?

我们可用如下一个博弈(图5-3)来表示卓文君与她父亲的博弈。

(2,-1)

(-1,1)(0,-2)

图5-3 私奔博弈

图5-3的博弈中,卓文君先选择“与司马断绝关系”或者“结婚”。若与司马断绝关系,则她失去一个心爱的人,得到-1的赢利(她父亲则得到赢利1,因为他终于如愿以偿让女儿没能跟司马结婚);若选择结婚,则由文君的父亲做出反应。他可以选择真的断绝父女关系——这种情况下,文君得到0(因为她虽然跟爱人结婚得到1,但是却因此失去了父亲得到-1,总计得到0),父亲得到是-2(因为看到文君与司马结婚心中不快得到-1,又失去了一个女儿其所得再增加-1);当然,既然生米煮成了熟饭,父亲可以默认——此时文君既得到爱人又没有失去父亲故获得赢利2,而父亲心中不快得到-1,但毕竟没有失去女儿。

使用逆向归纳法不难得到,第二阶段父亲将选择默认(因为默认的赢利为-1,而断绝父女关系的赢利为-2);给定第二阶段父亲会默认,第一阶段文君将选择结婚(结婚赢利为2,与司马断绝关系赢利为—1)。所以,私奔博弈的均衡结果是,文君选择结婚,而文君的父亲选择默认。

历史上的故事正是如此。卓文君不顾父亲的反对和司马相如私奔。两个人在成都靠开酒吧为生。文君的父亲不忍女儿受苦,最后还是接纳了他们的婚姻。

私奔博弈刻画了一个很重要的道理,那就是有些时候威胁并不可怕,因为那些威胁仅仅是威胁而已。就像父母亲反对儿女婚姻时常常摆出一副要断绝父子(女)关系的样子,但一旦木已成舟,他们也只好默认,并不会真的跟儿女断绝关系。学习了博弈论的人,更容易看出这些威胁是不可置信的。

2、海盗分赃

再来看一个逆向归纳法的经典例子,其原型来自I.Stewart在《科学美国人》杂志上的一篇文章《凶残海盗的逻辑》。这个例子曾经被作为微软公司招募员工的面试题目,你也可以尝试着可以在几分钟之内求解出正确答案。

故事模型

话说有5个海盗ABCDE抢来了100枚金币,大家决定分赃的方式是:依次由海盗ABCD提出一种分配方案,如果同意这种方案的人达到半数,那么该提议就通过并付诸实施;若同意这种方案的人未达半数,则提议不能通过且提议人将被扔进大海喂鲨鱼,然后由接下来的海盗继续重复提议过程。假设每个海盗都绝顶聪明,也不相互合作,并且每个海盗都想尽可能多得到金币,那么,第一个提议的海盗将怎样提议既可以使得提议被通过又可以最大限度得到金币呢?

我曾好几次在学生中做过调查,如果他们就是第一个海盗会提出怎么分?答案五花八门,但是大多数是表示平均分(每人20颗)——这可能是现实中的情况,公平观念在博弈中发挥着作用。但是标准博弈论是研究人们完全理性的情况下极端复杂的策略互动后果,这里的平均分配并不符合标准博弈论的逻辑。

那么答案究竟是什么呢?使用边向归纳法可以求解如下:

★首先,考虑只剩下最后的海盗E,显然他会分给自己100枚并赞成自己。

★再回溯到只剩下海盗D和海盗E的决策,海盗D可以分给自己100枚并赞成自己;海盗E被分得0枚,即使反对也无用。

★回到海盗C。海盗C可以分给海盗E 1枚金币得到海盗E的同意;分给自己99枚,自己也同意;分给海盗D 0枚,海盗D反对但无用。

★回到海盗B。海盗B可以分给海盗D 1枚得到海盗D同意;分给自己99枚,自己也同意;海盗C、E各分得0枚,他们会反对但反对没有用。

★回到海盗A。他可以分给海盗C、E各1枚,获得海盗C、E的同意;分给自己98,自己也同意;分给海盗B、D各0枚,他们会反对但反对不起作用。

因此,这个海盗分赃问题的答案是(98,0,1,0,1):海盗A提出分给自己98枚,分给海盗B、D各O,分给C、E各1枚,该提议会被通过。因为海盗A、C、E会投赞成票。我们可以把这个逆向决策的过程用如下矩阵表达出来(如图5-4,其中画下划线的数字表示海盗对该方案投了赞成票,未加下划线对应于反对票)。

如果你是海盗A,你会这样提方案吗?

对于上述海盗分赃问题,我们还可以演化出不同的版本。比如说:(1)如果要求包括提议海盗在内的所有海盗过半数(超过1/2)同意才能使提议通过,那么海盗A应该怎么提方案? (2)如果要求提议海盗之外的海盗过半数同意才能

通过,那么海盗A又该怎么提方案? (3)或者海盗的数目增加到10个、100个,海盗A又怎么提方案?大家可以把这个当做练习题来做一做。

分配给各位海盗的金币数目

分配者

海盗A B C D E

海盗E 100

D 100 0

C 99 0 1

B 99 0 1 0

A 98 0 1 0 1

图5-4 海盗分赃逆向推理过程(全部海盗半数同意即可通过)

答案:变种问题(1)中,海盗A提出的分配方案是(97,0,1,2,O)或(97,0,1,0,2);变种问题(2)中,海盗A提出的分配方案应是(97,0,1,1,1);变种问题(3)中,大家可尝试逐渐增加海盗的数量,将会发现答案是有规律可循的。

§5-3 理性的局限与非理性行为

逆向归纳方法是一个非常美妙的思想,但是它对人们的理性要求可能会太高。然而,也可能正因为人们的理性程度是不一样的,才有了博弈的高下之分。关于参与人理性不对称下的博弈理论研究,至今仍是博弈论研究的一个努力方向。按照博弈论大家鲁宾斯坦( A.Rubinstein)的说法:“对不同参与人的能力及形势洞察力的不对称性建模在将来的研究中将是一个吸引人的挑战。”

1、序贯理性

所谓序贯理性,通俗地说就是每个参与人在其每一个行动时点上都将重新优化自己的选择,并且会把自己将来会重新优化其选择这一点也纳入当前的优化决策当中。换句话说,一个具备序贯理性的参与人很清楚自己在每一个需要做出决定的时刻都需要重新对已有的决策进行优化,而且在做这种优化的时候必须把未来需要重新优化的这一事实考虑在现有的优化决策当中。

显然,序贯理性下将不会有“后悔出现”——因为满足序贯理性所形成的路径,无论从后向前看,还是从前向后看,都将是一条最优的道路。那么,只凭我们在日常生活的决策中有那么多的“悔不该当初”,我们就知道其实人们常常难以达到序贯理性的要求。

为什么人们常常难以达到序贯理性的要求呢?至少有两个原因:一是人们的算计能力是有限的;二是人们的理性本身也是有限的(比如感情用事、冲动行事、冒险倾向等)。

2、算计能力与策略技巧

从臥理论上来说,有限的离散策略,只要其可能的结果状态是有限的,我们就可以通过逆向归纳方法,来求解出均衡路径上的策略。按照这样的一个想法,我们在下下象棋、围棋等时可能就分不出高下。因为,每个人都通过逆向归纳法已经知道如何应对每一步棋,最后大家可能永远只会下成平手。

但现实中,下棋的胜负是很常见的结果。而且,我们明显发现更有经验的棋手显然更能“老谋深算”,一个新手常常目光短浅、漏洞百出,老手下赢新手是最普遍的结果。为什么会这样呢?下棋之所以能分出胜负,其实就在于对手之间的序贯理性是不一样的,他们对于局势的洞察力是不一样的。有经验的老手,眼光显然比一个新手强上不止几百倍。

读者可能会问,下象棋不过32颗棋子,为什么人们的算计能力会如此有限呢?这里实际上涉及到序贯博弈中策略的数量是成几何级数增加的。当你下象棋的时候,32颗棋子,第一阶段你就至少有32种行动选择(其实还不止,因为某些棋子可行的步骤不止一种),那么,哪怕是只要求进行几个回合的厮杀,其策略组合都远远超越了人脑通过逆向归纳来进行算计的能力。

存在众多可选行动和行动阶段的博弈中,策略组合的数量之巨大、情况之复杂似乎会给人一种悲观的结论:既然如此,我们还研究博弈论干什么呢?对此我想说的是,这并不悲观,反而有趣。人与人之间的理性程度的差异造就了胜负之分,才使得棋艺对抗如此令人着迷,难道不是这样吗?而且新老棋手的棋艺高低,不正是说明了理性程度的提升策略技巧的改善是可以通过学习和训练来达到的吗?难道这不正是一个应该学习和研究博弈论的最好理由吗?此外,还有一个更为乐观的事实是,由于计算机技术的发展,过去许多以人脑难以完成算计并分析的博弈,现在已经可以通过电脑辅助计算来完成。可以想像,随着人类计算技术的发展,人类的算计能力也会迅速得到发展,并日益可以分析更为复杂的博弈。

3、操纵理性的博弈

现实的博弈与标准博弈理论存在差距的另外一个事实是,现实中博弈的参与人很清楚各个参与人的理性程度和对现实的洞察力是有差异的,从而他们完全有可能策略性地使用“理性”。比如,如下的一个博弈(图5-5):

图5-5的博弈中,大家使用逆向归纳法很容易发现,第三阶段,甲将选择“左”(获得100);但是在第二阶段乙宁愿选“上”(获得1);回到博弈之初,甲将选择“前”直接结束博弈(获得2)。这是标准的逆向归纳解。

图5-5 非理性的博弈

但是在现实中,这个均衡结果会出现吗?很可能不会,尤其是当两个参与人对对方的理性有所质疑的时候。比如说,甲可能会想:我如果选“后”,那么即便乙选择了“上”,我也得到1个单位,只比我选“前”少得到1个;但是,如果他认为我是个傻瓜,而要冒一次险选择“下”(如果甲真是傻瓜,“下”对乙是有诱惑力的,地选择“右”而使得乙得到100),那么我就赚了。这样,不管是由于侥幸心理,或是真的使用装傻策略,甲可能真的会选“后”。

同样,乙看到甲选了“后”,也许乙很高兴地认为甲是个傻瓜(完全理性的人不会这么选的嘛),那么乙的侥幸心理也被诱导出来了,既然他是傻瓜,那我为什么不冒险选下呢——这样,要么我只比选“上”少得到1个单位,但也有可能多得到100-1 = 99个单位呢。于是乙可能真的会选“下”。

正因为乙可能有上述的心理和行为,所以甲在第一阶段就更有可能会选择“后”。只要乙敢于冒险选“下”,那么甲就可以毫不费力地得到100单位收入了。当然,甲选择“后”是有风险的,因为如果乙的理性程度很高,没有侥幸心理,或者能够洞悉甲的企图,那么甲就会“偷鸡不成反而蚀把米”。

在现实中,这样的利用对手理性不足的博弈还少见吗?一点也不!有些博弈高手,就是抓住对手的侥幸心理(完全理性的人是不会有侥幸心理的)故意卖一个破绽,从而诱对方上钩,大获其利。

故事模型

譬如元朝末年朱元璋灭陈友谅就是一个典型的博弈战例。其时,各地起义军已混战多年,最后只剩下了朱元璋、陈友谅等几支大队伍。陈友谅为了吞掉朱元璋,勾结朝廷太尉张士诚,向朱元璋占据的建康(今江苏南京)进攻。但陈友谅与朱元璋打过多年交道,深知朱元璋足智多谋,手下兵多将广,故小心翼翼,步步为营,慢慢推进。消息传到建康,朱元璋思谋破敌之策,觉得想灭陈友谅,必须诱敌深入,然后围歼之。这样一步步地打消耗战,久了必会腹背受敌,被陈友谅和张士诚两面夹击就危险了。但如何引陈友谅孤军深入呢?朱元璋想起了黄盖降曹的赤壁之战,觉得可以仿效办理,以诱惑敌人。于是朱找到过去与陈友谅

交情甚厚的属将康茂才,问他是否有把握诱陈友谅来攻。康茂才说:“陈友谅胸无大志,缺乏战略眼光,急功近利,可以诱其前来。”于是他修书一封,说自己在元璋手下干得很不痛快,出力不少,不得重用,今将军前来进攻,愿投降。并说:自己负责防守建康西边的大桥,是水路攻建康的必经之路,若将军到来,愿献桥投降。陈友谅虽然担心有诈,但认为自己力量雄厚,带大兵前来,即使有诈也不用太担心。结果,他一来就未能回去,被朱元璋所灭。在这个例子中,朱元璋等人就是利用了陈友谅的侥幸心理,故事中的关键词“可以诱其前来”和“愿献桥投降”,深刻地说明了朱元璋如何用尽心计试图利用对方的侥幸心理。

当然,这种试图利用对方理性不足而操纵对方的谋略也可能被对方识破而不能得逞。通常,这种策略性运用“理性”的失败与低估对方的理性有关。三国演义“东吴招亲”的故事中,孙权和周瑜就是低估了诸葛亮的理性,结果被诸葛亮将计就计,赔了夫人又折兵。

总之,“理性”本身可能就是现实中人们进行博弈时的一个可操纵策略变量。但是,博弈理论在这一方面并没有多大的进展。下一节我们还会谈到一些非理性博弈,比如非理性的报复——我们会发现“非理性”有时也会给参与人带来好处。可能正因为如此,物竞天择——大自然才让人类在演化中保留了非理性吧。

§5-4 威胁、承诺与报复

§5-4-1威胁和承诺

在博弈中,威胁、承诺与报复,都是惯用的伎俩,这些内容也是本节要探讨的主题。大家会发现,博弈论思维的确有助于我们洞悉某些局势中的不可置信的威胁、不可置信的承诺等。

1、威胁与空洞威胁

在生活中,人们惯用威胁和恐吓来达到自己的目的。但是,理性的参与者会发现某些博弈中威胁是不可置信的,即塞尔顿(Selton,1994年经济学诺贝尔奖得主)所谓的“空洞威胁”(empty threat)。威胁不可置信的一个重要原因是:将威胁所声称的策略付诸实践对于威胁者本人来说比实施非威胁声称的策略更不利。既然如此,我们就没有理由相信威胁者会选其威胁所声称的策略。

比如有一个垄断市场,唯一的垄断者独占市场每年可获得100万的利润。现在有一个新的企业准备进入这个市场,如果垄断者对进入者采取打击政策,那么进入者就将每年亏损10万元,同时垄断者的利润也下降为30万元;如果垄断者对进入者实行默认政策,那么进入者和垄断者将各自得50万元利润。现在,

为了防止进入者进入,在位的垄断企业宣称:如果进入者进入,那么它就会选择打击政策。

但是,如果我们把这个市场进入博弈的博弈树画出来,再用逆向归纳方法求出均衡路径,就会发现这是一个“空洞威胁”。

(-10,30)

(0,100)(50,50)

图5-6 市场进入博弈中的空洞威胁

我们会发现均衡路径是进入者进入,而在位者默认。在位者的威胁将是不可置信的,因为给定进入者真的进入了,在位者选择默认而不是打击将更符合其利益,所以在位者宣称要实施打击,也只是说说而已。

实际上,在很多时候,威胁都是不可置信的,尤其是口头的威胁。比如在第4章的“私奔博弈”中,卓文君的父亲以脱离父女关系威胁文君与司马相如分手也是一个空洞威胁的例子。在家庭里,经常出现不可置信的威胁。因为家庭的成员彼此利害相关,惩罚一个家庭成员也会给惩罚者带来负效用,结果就使得惩罚常常并不是很可信。

在公司里,员工常常会策略性地提出加薪,而威胁老板加薪的一个常见版本就是“如果不给我加薪,那我就将离职”。问题是,老板会不会理踩员工的威胁呢?一个显然的事实是,老板可不像小孩那样缺乏理性。如果员工并没有其他的去处,老板就不会理睬员工的加薪要求。只有老板相信员工会离去,并且他觉得多花点钱留住员工是值得的时候,他才会给员工加薪。

在师生之间,有时也会存在不可置信的威胁。教师为了让学生更加努力学习,有时会故意夸大命题和阅卷的严格程度。但是,学生很清楚的问题是教师不可能让大面积的学生不及格,所以他们就不会理会试题的难度。如果他们预计95%的学生会及格,那么他们就只需要让自己进入那95%就行了,并不会担心绝对分数是否会达到60分。如果教师真的想通过考试压力来迫使学生努力学习,那么他应当公布更低的相对及格标准,比如无论考多少分,都只有70%的同学才算作及格。但是,几乎没有老师会这样公布,因为如果他真的公布了这样一个过低的相对及格率,那么学生会向校方投诉教师强行规定了不合理的及格率。

2、通过承诺行动使威胁变得可信

为了使威胁变得可信,人们可以采取承诺行动。承诺行动的基本思想是:

通过限制自己的某些策略选择,从而使得其选择特定策略的宣称或意图变得可信。或者说,承诺行动是局中人通过减少自己在博弈中的可选行动来迫使对手选择自己所希望的行动。其中的道理在于:既然对方的最优反应行动依赖于我的行动,那么限制我自己的某些行动实际上也就限制了对方采取某些行动。如果某些承诺行动只是增加了选择某些行动的成本,而不是使该行动完全不可能被选取,则被称为不完全承诺。

虽然语言也可以作为一种承诺,但我们这里讲的承诺行动更注重要落实在“行动”上。“行胜于言”是博弈论的基本教条。一个人嘴巴上可以说得天花乱坠,而理性的人却只看他的行动。

§5-4-2现实中的威胁与承诺

1、爱的承诺

故事模型

有一位小伙子在给心爱的姑娘的信中写道:“爱你爱得如此之深,以至愿为你赴汤蹈火;我是那么地想见到你,任凭艰难险阻也挡不住我的脚步。本周六如不下雨,我一定来找你!”

这个女孩子能相信这个男青年的誓言吗?“我会爱你一生一世”这句话,太容易说了。因此,这样的承诺,难以置信。

那么,如何才可以让你对她的爱是可以置信的?为了表明你的心迹,你需要付出代价。而且代价越沉重,才能表明你越爱她。不过,这代价并不一定是金钱,因为金钱对于某些人来说也是廉价的。一个百万富翁为一个女孩子一掷千金,为另一个女孩子则不惜生意代价付出大量时间来陪伴她,你说他更爱哪一个女孩子呢?

在高度情感化的领域,人们的博弈依然充满了理性。为什么婚前要送昂贵的彩礼?为什么要举行高档的婚宴?过去,人们习惯于批评这是讲排场,面子风光。而在博弈论看来,这是一种承诺行动。昂贵的彩礼和高档的婚宴一方面表明了愿意为对方做出牺牲,另一方面实际上也是向外界传递了他们把这段感情看得有多重的信号,而排斥了潜在的婚姻竞争者,从而限制了自己的选择以承诺对爱情的忠贞。或者可以这样理解,男青年高额下聘,实际上使得其财富减少不可能再去找另外一个婚姻对象,这就是典型的承诺行动了。可能有些人会不赞同这样的看法,但是如果我们把婚姻看做是婚姻市场上交易的产品,那么下聘礼与其他产品市场交易中的交纳订金或抵押物在本质上其实并无不同,都是承诺而已。

同样的道理,为什么恋人会乐于把彼此介绍给自己的父母亲朋?这也是一种

承诺。一个人将恋人介绍给自己的父母亲朋时,实际上就对自己再选择其他的婚恋对象做出了限制。这样的一种放弃潜在婚恋机会的做法是向对方做出了一种感情上的承诺。的确,如果你谈了很久的恋人一直拒绝让你进入他的家人和朋友圈子,这只能说明他的感情仍处在游弋不定之中。

2、商业中的承诺

商业界的承诺更多。刚才讲到的订金、抵押物都是常见的承诺行动。先发制人使市场达到饱和也是一种承诺行动。为了防止竞争者的进入,在位的企业可以通过过度的投资和生产来占据市场,尽管这会使得其利润下降,但是比竞争者进入的状况要好,那么企业就可能采取提前使市场饱和的策略来阻止竞争者进入。

生产耐用消费品的企业常常推出最惠条款,这也是一种承诺。耐用消费品因其使用时限较长,生产耐用品的企业会经常被“降价预期”所困扰:如果消费者预期企业将降价,他们便会等待,结果,企业只能降价。比如国内汽车行业,入世之后大家认为汽车必然降价,结果就持币待购,汽车就真的只有降价(当然,这里只是说汽车价格受到了价格预期的影响,并不是说降价完全来自预期。汽车价格下降原因并不止此)。而最惠条款则可以起到承诺的作用:企业不会降价了。

企业的所有权也是一种承诺。大家都知道,企业实际上是资本与劳动缔结的合约。但是为什么企业中是资本雇用劳动而不是劳动雇用资本呢?一种可行的解释在于,资本所有者的承诺比劳动力所有者的承诺更值得信赖,更不易采取机会主义行为。如果非人力资本所有者不能兑现自己的承诺,其他人可以将他的资本拿走,甚至以毀灭相威胁。对比之下,如果人力资本所有者违约,其他人对他实在没有什么好办法。常言道“跑得了和尚跑不了庙”,没庙的和尚谁能信任?而资本所有者投入资本就是修建了一座庙,以此承诺获取信任。

3、声誉与承诺

前面我们一直在表达一种观点:仅仅留于口头的承诺是非常廉价的。现实中却有一些困境——没有什么其他的行动可以使其承诺变得坚实,即使其承诺变得坚实的成本很高。这个时候,建立声誉将是增强其承诺可信性的好手段。

比如绑架事件中,绑匪和人质家属之间的博弈是非常微妙的:绑匪要求拿到赎金才愿意释放人质;对于家属来说,如果给出赎金能换回人质的话是不错的结果,但问题是,家属如何能相信绑匪拿到赎金后就会释放人质呢?要知道,绑匪们可都是铤而走险之辈,他们也完全可以在拿到赎金后将人质干掉,让人质家属人财两空。因此,绑匪们说见钱放人的承诺是很廉价的,难以让人们产生足够的信任。

既然家属不相信绑匪,那么是不是可以倒过来解决问题呢?比如,绑匪先释放人质,然后家属按照承诺将赎金交给绑匪。聪明的你其实马上也会意识到,家属支付赎金的口头承诺是廉价的,绑匪们也不会幼稚得相信人质家属,因为人质

家属在取回人质后完全可以不支付赎金,反而报警对付绑匪。

正因为绑匪和家属之间的信任是那么的脆弱,因此撕票的事情在现实中也确实有所发生。那么如何避免呢?

在现实中,职业绑匪将有动力树立起遵守诺言的“声誉”。他们通过这样的方式告诉人质家属,只要你付钱,我就一定会放人。所以经常出现的情况是,—旦遭遇职业绑匪,家属将愿意先交钱然后绑匪也会放人。撕票的事件其实常常发生于那些非职业绑匪的身上。这其中的原因,仅仅是因为职业绑匪要长期从事这个有“钱”图的职业,所以他们更看重“江湖规矩,一诺千金”。

用绑匪来讨论博弈论,可能会令人不快。但是,现实就是如此,比如一些公司企业,实际上也就像一个个的绑匪,他们把持在手中的“人质”是产品质量。消费者好比人质的家属,他们付出钱去买一件产品,但是购买的时候并不知道产品质量的高低(人质的死活)。于是理性的消费者会去选择那些类似于职业绑匪的公司(有些公司花巨额的金钱宣传自己的商标,实际上就是告诉消费者自己是一个“职业绑匪”)并跟他们交易,因为这些公司希望从长期的声誉中获取好处,它们将不愿意为了目前的一点蝇头小利而砸掉自己的招牌。

§5-4-3 报复的作用

1、报复能力的重要性

故事模型

谢林在《冲突的战略》中曾提到一个窃贼的故事:一天,一个持枪的窃贼潜入一所房子行窃,房主听到楼下的响动之后,同样持枪一步步向楼下走来。于是,危机和冲突发生了。不排除一种可能结果是窃贼成功逃逸,双方均没有伤亡和财产损失。但是,也有可能出现这样的结果:主人担心窃贼会先开抢而率先向窃贼射击,致使窃贼身亡;另一种可能的结果是,窃贼担心主人会开枪射击,而首先射杀主人。但是,还有一种通常的形势是双方拔枪对峙,互相探测着对方的意图,谁也没有先开枪。毕竟,主人只是想赶走窃贼而不是要其性命,只要他相信窃贼不会对他下毒手,那么他就没有必要把窃贼推上绝路——要知道,窃贼的行为正好是跟他对主人的意图判断联系在一起的:如果他发现主人试图置其于死地,那么他就会尝试先置主人于死地;而如果他发现主人仅仅是想赶走他,那么他一般就并不会想射杀主人,毕竟盗窃未遂的罪名比杀人抢劫罪名要轻得多,何况他可以安全离开呢。即便主人想要窃賊的性命,那么他也必须对自己的枪法充满自信(确信可以一枪打死窃贼),他才可能表示出射杀窃贼的意图,否则一旦他表示出这种意图(即先开枪),那么窃贼也有机会对主人进行报复性射杀。同样的逻辑推理过程也适用于窃贼。

在这样的对峙中,除非一方确有把握一招制敌,否则谁也不想先动——没有一个人先动,那么危机就不会升级,这对双方都是相对较好的结果。任何一方都很清楚,一旦自己先动而又未能一招制敌,那么随即就会遭到对方的疯狂反扑,危机就此升级。此时不管谁胜谁负,结果其实都比大家不动的状态要糟糕。

在这样的拔枪对峙中,对枪法自信的一方率先开枪的可能性的确是有的,但这对其本人来说实际上增加了危险,因为对方可能也会因为担心他会开枪而率先开枪。相比较而言,如果双方只是手中持刀,那么对峙就更容易形成,因为谁都明白自己难以一刀令对方毙命,只要一方先挥刀,那么结果就是双方都会受伤。还不如在对峙下逐渐缓和,而窃贼慢慢退向门外并逃逸。

在这个例子中,对峙的危机常常并不会演化成血案,原因在于每个局中人都知道对方具有报复能力,从而谁也不愿去加剧危机。正因为如此,所以谢林认为,在博弈中,报复能力常常比攻击能力更重要。因为报复能力所形成的震慑往往约束了局中人,使其不会去采取攻击行为来恶化对峙危机。比如,在幼儿园中,力气大的小朋友可能会欺负力气小的小朋友,但是,如果力气小的小朋友有一个能力更大的哥哥会在他受欺负时出来为他出头,那么力气大的小朋友实际上就不会去欺负力气小的小朋友,因为他知道这样做无异于找揍。

在影视作品中经常可以看到借助于报复能力来增加谈判筹码的情况。比如两个人,其中叫张三的人掌握着叫李四的人的某些不可告人的秘密证据,足以令李四终身入狱。然后张三提出一笔交易,若李四给他100万,他就会销毁证据。然而李四在约见张三时常常会设下圈套,试图杀人灭口。电影中常见的结果是,聪明的张三并不会带去证据,而是把它保管在第三方,并且他告诉李四,如果自己死在他手上,那么秘密证据马上就会出现在警察局——这就是一种报复力量。因为这种报复威胁的存在,李四将无法处置张三,而只好将钱给张三,让他销毁证据。当然,你也许会问,他怎么可以轻信张三会销毁证据而将钱付给张三呢?原因在于,一方面张三要在道上长期混,就有动机实践自己的诺言而保住其在江湖上的诚信;更重要的是另一方面,李四也会告诉张三,如果张三拿了钱但是又没销毁证据的话,那么他会将张三碎尸万段——这也是一种报复力量。

2、为什么不宽恕

人们在教育孩子的时候常常告诉他们要学会容忍和宽恕。因为,当一个人伤害了你的时候,你即便报复了他也不能消除他已经对你形成的伤害。如果你还希望两个人的关系能够继续,那么最好是宽恕他。但是,从博弈论的角度来说,这并不是一个好的解决问题的策略,更好的策略应该是不宽恕。

其中的原因,一方面在于宽恕某个对手等于向其他人宣布你的“报复”是不可置信的,因为你不会采用它;另一方面在于,这个被宽恕的对手在以后就会得寸进尺,可能一直有意无意地、不停地伤害你。为了使你的报复可信,为了使你

避免遭受无休止的伤害,因此你应当学会不宽恕。

有许多教授一直被学生认为“心太狠”——因为教授常对学生说没有按时交作业或参加考试,那就铁定不及格了。事实上,绝大多数教授其实是宅心仁厚、宽大为怀的。那么,究竟是什么让教授变得铁石心肠呢?原因在于,聪明的教授知道,如果他原谅了一个迟交作业的学生,那么这个学生下一次作业也可能迟交,而且其他的学生都有可能仿效这个学生,不断编造美丽的借口来获取教授的原谅。既然教授无法区别哪些理由是事实、哪些理由只是借口,所以“概不留情”成为教授避免麻烦的一个最好的策略。

就像我们在一些影片中看到某些心地善良却遇人不淑的女子,她们一次又一次原谅胡作非为的丈夫,丈夫反而得寸进尺,因为他知道无论如何只要一些花言巧语扮可怜就会获得宽恕。

所以有时候,人们会对伤害选择报复。当别人打你一拳,你若打回一拳,这本身并不能减轻你已挨那一拳的疼痛,而且用力打回一拳通常也得不到快感。那为什么还要回击呢?原因在于,你知道打不还手只会让对手更加猖狂,而选择回击是遏制对方进一步侵犯的方式。

有人曾经主张废除死刑,理由是处死一个杀人犯并不能挽回被害者的性命,即犯罪的后果已经无法事后补救,因此这个杀人犯不必也去死。若是为了这样的理由,我是反对的。死刑对犯罪后果的确于事无补,但作为对犯罪行为的报复力量,至少让那些犯罪的念头会多权衡几次。作为一种震慑力量,它至少在一定程度上遏制了潜在的犯罪。

虽然宽恕是一种美德,但是人们有时采取绝不原谅对其的确是更有利的——当然,这并不绝对如此,因为有时绝不原谅也有麻烦的时候。比如说:××大学对博土生教育的规定是:凡是有一门学位课不及格就自动退学。很多人认为这样的规定太过分,而且对学生的压力也太大了。但事实是,学生的压力反而轻了,因为不及格足以让学生退学,所以教师在评判时通常就更为宽松。相反,倒是那些允许补考的学校,看来规定宽松,但教师评判正考成绩时往往并不留情。

所以,有些时候宽大为怀不一定好,有些时候毫无回旋余地也不见得佳。这就是奇奇妙妙的人类互动世界。

高一数学归纳法分析及解题步骤

高一数学归纳法分析及解题步骤 当我第一遍读一本好书的时候,我仿佛觉得找到了一个朋友;当我再一次读这本书的时候,仿佛又和老朋友重逢。我们要把读书当作一种乐趣,并自觉把读书和学习结合起来,做到博览、精思、熟读,更好地指导自己的学习,让自己不断成长。让我们一起到一起学习吧! 高一数学归纳法 《2.3数学归纳法》教学设计 青海湟川中学刘岩 一、【教材分析】 本节课选自《普通高中课程标准实验教科书数学选修2-2(人教A 版)》第二章第三节《2.3数学归纳法》。在之前的学习中,我们已经用不完全归纳法得出了许多结论,例如某些数列的通项公式,但它们的正确性还有待证明。因此,数学归纳法的学习是在合情推理的基础上,对归纳出来的与正整数有关的命题进行科学的证明,它将一个无穷的归纳过程转化为有限步骤的演绎过程。通过把猜想和证明结合起来,让学生认识数学的本质,把握数学的思维。本节课是数学归纳法的第一课时,主要让学生了解数学归纳法的原理,并能够用数学归纳法解决一些简单的与正整数有关的问题。 二、【学情分析】 我校的学生基础较好,思维活跃。学生在学习本节课新知的过程中可能存在两方面的困难:一是从骨牌游戏原理启发得到数学方法的

过程有困难;二是解题中如何正确使用数学归纳法,尤其是第二步中如何使用递推关系,可能出现问题。 三、【策略分析】 本节课中教师引导学生形成积极主动,勇于探究的学习精神,以及合作探究的学习方式;注重提高学生的数学思维能力;体验从实际生活理论实际应用的过程;采用教师引导学生探索相结合的教学方法,在教与学的和谐统一中,体现数学的价值,注重信息技术与数学课程的合理整合。 四、【教学目标】 (1)知识与技能目标: ①理解数学归纳法的原理与实质,掌握数学归纳法证题的两个步骤; ②会用数学归纳法证明某些简单的与正整数有关的命题。 (2)过程与方法目标: 努力创设愉悦的课堂气氛,使学生处于积极思考,大胆质疑的氛围中,提高学生学习兴趣和课堂效率,让学生经历知识的构建过程,体会归纳递推的数学思想。 (3)情感态度与价值观目标: 通过本节课的教学,使学生领悟数学归纳法的思想,由生活实例,激发学生学习的热情,提高学生学习的兴趣,培养学生大胆猜想,小心求证,以及发现问题、提出问题,解决问题的数学能力。 五、【教学重难点】

归纳法基本步骤

归纳法基本步骤 (一)第一数学归纳法: 一般地,证明一个与自然数n有关的命题P(n),有如下步骤: (1)证明当n取第一个值n0时命题成立。n0对于一般数列取值为0或1,但也有特殊情况; (2)假设当n=k(k≥n0,k为自然数)时命题成立,证明当n=k+1时命题也成立。 综合(1)(2),对一切自然数n(≥n0),命题P(n)都成立。 (二)第二数学归纳法: 对于某个与自然数有关的命题P(n), (1)验证n=n0时P(n)成立; (2)假设n0≤nn0)成立,能推出Q(k)成立,假设 Q(k)成立,能推出 P(k+1)成立; 综合(1)(2),对一切自然数n(≥n0),P(n),Q(n)都成立。 应用 (1)确定一个表达式在所有自然数范围内是成立的或者用于确定一个其他的形式在一个无穷序列是成立的。 (2)数理逻辑和计算机科学广义的形式的观点指出能被求出值的表达式是等价表达式。 (3)证明数列前n项和与通项公式的成立。 (4)证明和自然数有关的不等式。 数学归纳法的变体 在应用,数学归纳法常常需要采取一些变化来适应实际的需求。下面介绍一些常见的数学归纳法变体。

博弈论课程概要(I)

交通大学博弈论课程概要 (I) 周林 二零零四年十二月 主要教材:博弈论(Fudenberg & Tirole ) 引言: 博弈论与决策论的差别. 例子:田忌赛马,换钱. 第一部分:完全信息策略式博弈 — 静态博弈 1. 策略式博弈的基本三要素:博弈者,策略空间,收益函数 2. 策略式博弈的基本三解法: a. 占优策略. 例子: 囚徒困境,二价拍卖(Ebay , 易趣网) b. 重复剔除劣策略. 例子:双寡头Cournot 竞争(线性需求) c. Nash 均衡 (最重要的概念) 三种解法的合理性依次减低,而三种解法的适用范围(存在性)依次增加. 3. Nash 均衡存在性定理:如果策略空间是凸紧集,收益函数连续和自拟凹,至少存在一个Nash 均衡. 证明基本思路:最佳反应映射是从策略空间到策略空间的(上半)连续映 射(Berge 定理), 最佳反应映射的不动点就是Nash 均衡. 利用(Kakutani 不动点定理)Brouwer 不动点定理找出不动 点.(注意:这里的最佳反应映射不是一个压缩映射, 因 此不能用迭代法逼近不动点.) 推论:任何有限策略博弈至少有一个混合策略Nash 均衡. 4. Nash 均衡一般非唯一,非Pareto 最优. 可以通过外在信号机制改善收益. 相关均衡:公共信号仅将不同的Nash 均衡混合,私人信号更为有效. 作业:1.1,1.2, 1.5, 1.7, 1.10, 1.12, 2.2 (F&T ). 以及下面的题目: A . 证明任何一个满足Nash 均衡存在性定理的对称博弈(首先给出一个合 理的定义)一定存在一个对称的Nash 均衡. B . 画出下列博弈中所有的相关均衡生成的收益向量: 博弈者 2 博弈者 1 T W

高中数学归纳法大全数列不等式精华版

§数学归纳法 1.数学归纳法的概念及基本步骤 数学归纳法是用来证明某些与正整数n有关的数学命题的一种方法.它的基本步骤是: (1)验证:n=n0 时,命题成立; (2)在假设当n=k(k≥n0)时命题成立的前提下,推出当n=k+1时,命题成立. 根据(1)(2)可以断定命题对一切正整数n都成立. 2.归纳推理与数学归纳法的关系 数学上,在归纳出结论后,还需给出严格证明.在学习和使用数学归纳法时, 需要特别注意: (1)用数学归纳法证明的对象是与正整数n有关的命题; (2)在用数学归纳法证明中,两个基本步骤缺一不可. 1.用数学归纳法证明命题的第一步时,是验证使命题成立的最小正整数n,注意n不一定是1. 2.当证明从k到k+1时,所证明的式子不一定只增加一项;其次,在证明命题对n=k+1成立时,必须运用命题对n=k成立的归纳假设.步骤二中,在 由k到k+1的递推过程中,突出两个“凑”:一“凑”假设,二“凑”结论.关键是明确n=k+1时证明的目标,充分考虑由n=k到n=k+1时命题 形式之间的区别与联系,若实在凑不出结论,特别是不等式的证明,还可以应用比较法、分析法、综合法、放缩法等来证明当n=k+1时命题也成立,这也是证题的常用方法. 3.用数学归纳法证命题的两个步骤相辅相成,缺一不可.尽管部分与正整数 有关的命题用其他方法也可以解决,但题目若要求用数学归纳法证明,则必须 依题目的要求严格按照数学归纳法的步骤进行,否则不正确. 4.要注意“观察——归纳——猜想——证明”的思维模式,和由特殊到一般的数学思想的应用,加强合情推理与演绎推理相结合的数学应用能力.

5.数学归纳法与归纳推理不同.(1)归纳推理是根据一类事物中部分事物具有某种属性,推断该类事物中每一个都有这种属性.结果不一定正确,需要进行严格的证明.(2)数学归纳法是一种证明数学命题的方法,结果一定正确. 6.在学习和使用数学归纳法时,需要特别注意: (1)用数学归纳法证明的对象是与正整数n 有关的命题,要求这个命题对所有的正整数n 都成立; (2)在用数学归纳法证明中,两个基本步骤缺一不可. 数学归纳法是推理逻辑,它的第一步称为奠基步骤,是论证的基础保证,即通过验证落实传递的起点,这个基础必须真实可靠;它的第二步称为递推步骤,是命题具有后继传递的保证,即只要命题对某个正整数成立,就能保证该命题对后继正整数都成立,两步合在一起为完全归纳步骤,称为数学归纳法,这两步各司其职,缺一不可.特别指出的是,第二步不是判断命题的真伪,而是证明命题是否具有传递性.如果没有第一步,而仅有第二步成立,命题也可能是假命题. 证明:12+122+123+…+12 n -1+12n =1-1 2n (其中n ∈N +). [证明] (1)当n =1时,左边=12,右边=1-12=1 2,等式成立. (2)假设当n =k (k ≥1)时,等式成立,即 12+122+123+…+12k -1+12k =1-12k , 那么当n =k +1时, 左边=12+122+123+…+12k -1+12k +1 2k +1 =1-12k +12k +1=1-2-12k +1=1-1 2k +1=右边. 这就是说,当n =k +1时,等式也成立. 根据(1)和(2),可知等式对任何n ∈N +都成立. 用数学归纳法证明:1-12+13-14+…+12n -1- 1 2n

数学归纳法经典练习及解答过程

数学归纳法经典练习及 解答过程 文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

第七节数学归纳法 知识点数学归纳法 证明一个与正整数n有关的命题,可按下列步骤进行: (1)(归纳奠基)证明当n取第一个值n0(n0∈N*)时命题成立. (2)(归纳递推)假设n=k(k≥n0,k∈N*)时命题成立,证明当n=k+1时命题也成立. 只要完成这两个步骤,就可以断定命题对从n0开始的所有正整数n都成立.易误提醒运用数学归纳法应注意: (1)第一步验证n=n0时,n0不一定为1,要根据题目要求选择合适的起始值. (2)由n=k时命题成立,证明n=k+1时命题成立的过程中,一定要用到归纳假设,否则就不是数学归纳法. [自测练习] 1.已知f(n)=1 n + 1 n+1 + 1 n+2 +…+ 1 n2 ,则( ) A.f(n)中共有n项,当n=2时,f(2)=1 2 + 1 3 B.f(n)中共有n+1项,当n=2时,f(2)=1 2 + 1 3 + 1 4 C.f(n)中共有n2-n项,当n=2时,f(2)=1 2 + 1 3 D.f(n)中共有n2-n+1项,当n=2时,f(2)=1 2 + 1 3 + 1 4 解析:从n到n2共有n2-n+1个数,所以f(n)中共有n2-n+1项,且f(2)=1 2 + 1 3 + 1 4 ,故选D. 答案:D

2.(2016·黄山质检)已知n 为正偶数,用数学归纳法证明1-12+13-14+…+1 n +1 = 2? ???? 1n +2+1n +4 +…+12n 时,若已假设n =k (k ≥2为偶数)时命题为真,则还需要用归纳假设再证n =( )时等式成立( ) A .k +1 B .k +2 C .2k +2 D .2(k +2) 解析:根据数学归纳法的步骤可知,则n =k (k ≥2为偶数)下一个偶数为k +2,故选B. 答案:B 考点一 用数学归纳法证明等式| 求证:(n +1)(n +2)·…·(n +n )=2n ·1·3·5·…·(2n -1)(n ∈N *). [证明] (1)当n =1时,等式左边=2,右边=21·1=2,∴等式成立. (2)假设当n =k (k ∈N *)时,等式成立,即(k +1)(k +2)·…·(k +k )=2k ·1·3·5·…·(2k -1). 当n =k +1时,左边=(k +2)(k +3)·…·2k ·(2k +1)(2k +2) =2·(k +1)(k +2)(k +3)·…·(k +k )·(2k +1) =2·2k ·1·3·5·…·(2k -1)·(2k +1) =2k +1·1·3·5·…·(2k -1)(2k +1). 这就是说当n =k +1时,等式成立. 根据(1),(2)知,对n ∈N *,原等式成立. 1.用数学归纳法证明下面的等式: 12-22+32-42+…+(-1)n -1·n 2=(-1)n -1n ?n +1? 2 . 证明:(1)当n =1时,左边=12=1, 右边=(-1)0 ·1×?1+1? 2 =1, ∴原等式成立. (2)假设n =k (k ∈N *,k ≥1)时,等式成立,

逆向归纳法的认知基础

逆向归纳法的认知基础 崔晓红 1.引言 逆向归纳法是博弈论中一个比较古老的概念,它的提出最早可以追溯到泽梅罗(1913)针对国际象棋有最优策略解的证明,后来人们将其推广到了更广泛的博弈中,例如,在有限完美信息扩展型博弈中,就是用逆向归纳法(BI)来证明子博弈完美均衡(SPE)的存在以及求解SPE,其基本思路是从动态博弈中的最后一个阶段开始,局中人都遵循效用最大化原则选择行动,然后逐步倒推至前一个阶段,一直到博弈开始局中人的行动选择,其逻辑严密性毋庸置疑。然而,当从终点往前推到某一决策点时,BI完全忽略了到达该决策点的以往历史行动,而这一历史行动当然会影响处于该决策点的局中人有关其对手将来如何采取行动的信念,例如,一个局中人如果观察到对手在过去没有按照BI进行行动选择,那么他就有理由相信他的对手仍会采取同样的模式进行下去,但是通过这种信念修正以后所做的选择就会与BI矛盾。为了达到均衡解,为了能按BI进行推理求解,我们需要对局中人的信念或者说知识增加一些限制性条件,也就是说在什么样的前提下,BI是合理的,显然,仅仅要求每个局中人都理性是不够的,所有的局中人都必须知道所有的局中人都是理性的,所有的局中人都必须知道所有局中人都知道所有局中人都是理性的……等等以至无穷,在这样的认知条件基础下,我们就不会偏离BI,即,“在完美信息扩展型博弈中,理性的公共知识蕴含了BI”(Aumann 1995)。本文旨在通过构造完美信息扩展型博弈的认知模型来考察BI的这一认知条件。文章第二部分先通过一些简单例子对一些问题进行非形式上的讨论;第三部分介绍Aumann结构如何表达知识和信念;第四部分给出完美信息扩展型博弈的认知模型并用形式化的方给出BI的认知条件。 2. 实例分析 2.1 蜈蚣博弈 图1是一个长度为3的蜈蚣博弈,博弈每前进一个阶段,桌子上就增加一美元,局中人1,2轮流采取行动,轮到某个局中人采取行动时,他可以拿走桌子上的钱,博弈结束,或者钱留在桌子上继续博弈,另外,局中人都是理性的,也就是说都遵循期望效用最大化原

北京交通大学《交通运输学院》2020年考研专业课初试大纲

交通运输学院硕士研究生入学考试自命题科目考试范围 一、806电子商务系统分析与设计 1. 了解关于电子商务的三种理解;理解信息系统、电子商务系统与互联网产品之间的关系;理解信息系统的组成; 2. 理解软件的特点及软件危机的主要表现;了解软件工程的基本原则;掌握瀑布模型、SDLC、RUP、RAD等过程模型;理解敏捷方法及极限编程;了解互联网产品研发过程。 3. 了解电子商务系统建设项目管理的目标及主要工作内容;掌握项目计划的方法及主要工具;了解项目执行过程中的变更管理及配置管理。 4. 理解电子商务系统规划的主要内容;理解明确市场定位、估计市场规模的基本方法及竞品分析的目的与内容;理解进行产品(服务)设计的基本原则与方法;理解MECE法则并掌握思维导图的绘制方法;理解电子商务生态圈的构成。 5. 理解传统信息系统分析的目的、内容、方法、成果;理解需求的分类及其内涵;理解需求分析的内容、过程、成果及原则。 6. 理解系统分析设计的两种思路及其可视化建模;了解UML的组成;理解用例的概念,掌握用例间的关系;理解类、对象的概念,掌握类之间的关系;掌握用例图、状态图、活动图、交互图、类图的绘制,了解包图、构件图与部署图;了解基于UML的分析设计过程。 7. 了解系统设计的内容;理解架构设计的成果形式;理解常见的软件系统架构;掌握电子商务系统的性能指标;掌握提高响应能力、可用性、可伸缩性、可扩展性的主要架构设计技术;了解数据库设计的内容及基本原则;理解面向品牌建设的门户设计要点;理解云计算的基本概念;理解Cookie在互联网广告业务中的应用原理及主要方式。8. 了解电子商务系统实现阶段的主要任务;理解系统测试的基本评价指标及分类;理解电子商务系统切换的主要方式;了解电子商务系统维护的主要内容;理解应用软件维护的分类。 二、871运筹学理论与方法 1.线性规划。掌握和理解线性规划问题特点和基本模型、单纯形法、改进单纯形法、对偶问题、线性规划的对偶理论、影子价格的含义、对偶单纯形法、灵敏度分析的主要内容和计算。 2.运输问题。掌握运输问题的数学模型及表上作业法,熟悉产销不平衡运输问题及求解方法。 3.整数规划。重点掌握整数规划问题求解的分枝定界法、0-1整数规划的表示及指派问题的求解方法,理解并掌握割平面法。 4.动态规划。理解动态规划的基本概念和基本方程,掌握典型动态规划应用如资源分配问题与生产与存贮问题。 5.图与网络分析。理解并掌握图的基本概念、最短路问题、网络最大流问题、最小费用最大流问题。 6.排队论。理解并掌握排队论的基本概念、到达时间和服务时间分布、单服务与多服务台负指数分布排队系统、一般服务时间M/G/1模型。 三、942管理运筹学 1.线性规划 (1)线性规划模型的特点; (2)线性规划标准型; (3)线性规划的可行解、基、基解、基可行解、可行解、最优解; (4)线性规划解的四种情况; (5)线性规划的基本定理; (6)单纯形表的结构;检验数的概念和计算;最优性判断; (7)影子价格;对偶问题;对偶定理; (8)对偶单纯形法的基本原理; (9)灵敏度分析; 2.运输问题 (1)产销平衡的表上作业法 初始解的求解方法:最小元素法、差值法; 解的最优性判断:闭回路法、位势法; 解的改善:换入变量的确定、换出变量的确定、调整量的确定、解的调整;

数学归纳法

“数学归纳法”教学设计 一、教材与内容解析 (一)内容与内容解析 数学归纳法是人教B版普通高级中学教科书数学选修2-2第二章第三节的内容。本节课的主要内容是介绍数学归纳法的原理。 由于正整数具有无穷无尽的特点,有些关于正整数n的命题,难以对n进行一一的验证,从而需要寻求一种新的推理方法,以便能通过有限的推理来证明无限的结论,这是数学归纳法产生的根源。 数学归纳法是一种证明与正整数n有关命题的重要方法。它的独到之处便是运用有限个步骤就能证明无限多个对象,而实现这一目的的工具就是递推思想。 数学归纳法的两个步骤中,第一步是证明的奠基,第二步是递推。递推是实现从有限到无限飞跃的关键,没有它我们就只能停留在对有限情况的把握上。 数学归纳法是以归纳为基础、以演绎为手段证明结论的一种方法,是归纳法与演绎法的完善结合.这也许是数学归纳法不是归纳法但又叫“数学归纳法”的原因. (二)地位与作用解析 从应用上看,数学归纳法是解决与正整数有关命题的一种推理方法,它将无限多个归纳过程转化为一个有限步骤的演绎过程,是证明与正整数有关问题的重要工具。数学归纳法本质是归纳递推,但它与归纳法有着一定程度的关联。在数学结论的发现过程中,不完全归纳法发现结论,最终利用数学归纳法证明解决问题。 从思想方法上看,数学归纳法蕴含了无限转化为有限的思想,体现了奠基、递推、总结一体的整体思想。 从美学上看,数学归纳法展现了无限与有限的统一美;揭示了有限推证无限,把无限“沦为”有限的思维美;数学归纳法的发展历程展现了数学文化美。 二、教学问题诊断 1.学生已有的经验和基础:(1)学生已有数学归纳法的萌芽和相关经验.虽然学生没有正式学过数学归纳法,但小学的数数、找一列数的规律、高中等差数列和等比数列通项公式的推导过程等等,都蕴含着数学归纳法的萌芽和基础.(2)学生已经有用具有代表性的元素来代替任意的、无穷多的元素的经验.如在线面垂直的定义和证明中,用“平面内

第四章 完全信息动态博弈的基本理论(新)

第四章 完全信息动态博弈的基本理论 一.回顾如何用标准型表述、刻画博弈?回顾如何用扩展型表述、刻画博弈? 二.信息集 1.观察下列两个扩展型博弈在结构上有什么区别? 2.参与人i 的信息集是指由这样一些决策节点组成的集合,第一,i 的信息集中每个节点都是i 的决策节点,即如果博弈进行到这一步,轮到i 行动;第二,当博弈到达i 的某个信息集,参与人i 并不知道自己究竟已经到了信息集中的哪个节点。 3.对信息集的进一步理解 A 信息集用于表示博弈参与人在轮到他行动时所掌握的信息。 B 信息集定义的第二点意味着在同一个信息集的节点有着相同的可行的行动集(思考:为什么?)。 C 同一个信息集的节点不能相互构成前续节点与后续节点的关系。 4.思考:画出下列博弈的博弈树或扩展型表示。 第一步,参与人甲从行动集(L ,R )中进行选择;第二步,参与人乙观察到参与人甲的行动选择后从自己的行动集(M ,N )中进行选择;最后一步,参与人甲只能观察到过去的选择是否是(R ,N ),并从行动集(V ,W )中进行选择。 5.完全完美信息(complete and perfect )博弈与完全不完美信息(complete and imperfect)博弈 (1)完全信息与不完全信息:区分完全信息与否的标准就看每个博弈参与人的支付函数是否是博弈的公共知识。 (2)完美信息与不完美信息:区分完美信息与否的标准就看该博弈的每个信息集是否都是单点的(singleton )。完美信息意味着该博弈的每个信息集都是单点集。思考:完美信息博弈意味着博弈参与人对所参与的博弈究竟知道些什么?意味着在博弈的每个行动时刻轮到行动的参与人知道博弈迄今为止的全部历史。 夫 夫

逆向归纳法

一个逆向归纳法的经典例子,其原型来自I.Stewart在《科学美国人》杂志上的一篇文章《凶残海盗的逻辑》。这个例子曾经被微软公司作为招募员工的面试题目。 话说有五个海盗抢来了100枚金币,大家决定分赃的方式是:由海盗1提出一种分配方案,如果同意这种方案的人数达到半数,那么该提议就通过并付诸实践;若同意这种方案的人数未达半数,则提议不能通过且提议人将被扔进大海喂鲨鱼,然后由接下来的海盗继续重复提议过程。假设每个海盗都聪明绝顶,也不互相合作,并且每个海盗都想尽可能多的得到金币,那么,第一个提议的海盗将怎样提议既可以使得提议被通过又可以最大限度得到金币呢? 使用逆向归纳法可以求解如下: ●首先,考虑只剩下最后的海盗5,显然他会分给自己100枚,并且赞成自己●再回到只剩下海盗4和海盗5的决策,海盗4可以分给自己100枚并赞成自 己;海盗5被分得0枚,即使反对也无用。 ●回到海盗3,海盗3可以分给海盗5一枚得到海盗5的同意;分给自己99 枚,自己也同意;分给海盗4零枚,海盗4反对但无用。 ●回到海盗2,海盗2可以分给海盗4一枚得到海盗4的同意;分给自己99 枚,自己也同意;海盗3,5分得0枚,他们会反对但反对没有用。 ●回到海盗1,他可以分给海盗3,5各一枚,获得海盗3,5的同意;分给自己 98,自己也同意;分给海盗2,4各零枚,他们会反对但反对没有作用。 因此,这个海盗分赃的问题答案是(98,0,1,0,1):海盗1提出分给自己98枚,分给海盗2,4各零枚,分给海盗3,5各一枚,该提议会被通过。因为海盗1,3,5会投赞成票。 对于上述海盗分赃问题,我们还可以演化出不同的版本。比如说:(1)如果要求包括提议海盗在内的所有海盗过半数(超过1/2)同意才能使提议通过,那么海盗1应该怎么提方案?(2)如果要求提议海盗之外的海盗过半数同意才能通过,那么海盗1又该怎样提出方案?(3)或者海盗的数目增加到10个,100个,海盗1又怎么提方案? 答案:变种问题(1)中,海盗1提出的分配方案是(97,0,1,2,0)或(97,0,1,0,2);变种问题(2)中,海盗1提出的方案应是(97,0,1,1,1);变种问题(3)中,奇数号海盗各得一枚,偶数号海盗不得金币。 这学期选修的益智数学,颇觉有意思。一向知道数学是一门严谨严格的学科,这特点本已让数学充满了神奇,而这神奇而演绎出来的灵活与实用,也为数学带来了足具艺术的气质。不得不让人为数学折服,为数学无怨无悔,尽情尽意奉献一生。 海盗分赃这类问题虽说简单,却也能锻炼人的逆向思维能力,思维的灵活程度一般说来也是可以锻炼强化的。通过诸多数学游戏,也慢慢能够熟悉一些数学模型,而思维的模型化能够让人更加快捷的熟悉并掌握新的事物,也能为探索未知的模型奠定一定的思维技巧。

数学归纳法教案(新)

教材背景: 归纳是一种由特殊事例导出一般规律的思维方法.归纳推理分完全归纳推理与不完全归纳推理两种.不完全归纳推理只根据一类事物中的部分对象具有的共同性质,推断该类事物全体都具有的性质,这种推理方法,在数学推理论证中是不允许的.完全归纳推理是在考察了一类事物的全部对象后归纳得出结论来.数学归纳法是用来证明某些与正整数n有关的数学命题的一种推理方法,在数学问题的解决中有着广泛的应用. 教学课题:数学归纳法 教材分析: “数学归纳法”既是高中代数中的一个重点和难点容,也是一种重要的数学方法。它贯通了高中代数的几大知识点:不等式,数列,三角函数……在教学过程中,教师应着力解决的容是:使学生理解数学归纳法的实质,掌握数学归纳法的证题步骤(特别要注意递推步骤中归纳假设的运用和恒等变换的运用)。只有真正了解了数学归纳法的实质,掌握了证题步骤,学生才能信之不疑,才能用它灵活证明相关问题。本节课是数学归纳法的第一节课,有两大难点:使学生理解数学归纳法证题的有效性;递推步骤中归纳假设的利用。不突破以上难点,学生往往会怀疑数学归纳法的可靠性,或者只是形式上的模仿而不知其所以然。这会对以后的学习造成极大的阻碍。根据本节课的教学容和学生实际水平,本节课采用“引导发现法”和“讲练结合法”。通过课件的动画模拟展示,引发和开启学生的探究热情,通过“师生”和“生生”的交流合作,掌握概念的深层实质。 教学目标 1、知识和技能目标 (1)了解数学推理的常用方法(归纳法) (2)了解数学归纳法的原理及使用围。 (3)初步掌握数学归纳法证题的两个步骤和一个结论。 (4)会用数学归纳法证明一些简单的等式问题。 2、过程与方法目标 通过对归纳法的复习,说明不完全归纳法的弊端,通过多米诺骨牌实验引出数学归纳法的原理,使学生理解理论与实际的辨证关系。在学习中培养学生探索发现问题、提出问题的意识,解决问题和数学交流的能力,学会用总结、归纳、演绎类比探求新知识。

博弈论基础作业及答案()

博弈论基础作业 一、名词解释 纳什均衡占优战略均衡纯战略混合战略子博弈精炼纳什均衡 贝叶斯纳什均衡精炼贝叶斯纳什均衡共同知识 见PPT 二、问答题 1.举出囚徒困境和智猪博弈的现实例子并进行分析。 囚徒困境的例子:军备竞赛;中小学生减负;几个大企业之间的争相杀价等等; 以中小学生减负为例:在当前的高考制度下,给定其他学校对学生进行减负,一个学校最好不减负,因为这样做,可以带来比其他学校更高的升学率。给定其他学校不减负,这个学校的最佳应对也是不减负。否则自己的升学率就比其他学校低。因此,不论其他学校如何选择,这个学校的最佳选择都是不减负。每个学校都这样想,所以每个学校的最佳选择都是不减负,因此学生的负担越来越重。 请用同样的方法分析其他例子。 智猪博弈的例子:大企业开发新产品;小企业模仿;股市中,大户搜集分析信息,散户跟随大户的操作策略 以股市为例:给定散户搜集资料进行分析,大户的最佳选择是跟随。而给定散户跟随,大户的最佳选择是自己搜集资料进行分析。但是不论大户是选择分析还是跟随,散户的最佳选择都是跟随。因此如果大户和散户是聪明的,并且大户知道散户也是聪明的,那么大户就会预见到散户会跟随,而给定散户跟随,大户只有自己分析。 请用同样的方法分析其他例子。 2.请用博弈论来说明“破釜沉舟”和“穷寇勿追”的道理。 破釜沉舟是一个承诺行动。目的是要断绝自己的退路,让自己无路可退,让自己决一死战变得可以置信。也就是说与敌人对决时,只有决一死战,这样才可以取得胜利。否则,如果不破釜沉舟,那么遇到困难时,就很有可能退却,也就无法取得胜利。穷寇勿追就是要给对方一个退路,由于有退路,对方就不会殊死抵抗。否则,对方退无可退,只有坚决抵抗一条路,因而必然决一死战。自己也会付出更大的代价。 3.当求职者向企业声明自己能力强时,企业未必相信。但如果求职者拿出自己的各种获奖证书时,却能在一定程度上传递自己能力强的信息。这是为什么? 由于口头声明几乎没有成本,因此即便是能力差的求职者也会向企业声明自己能力强。当然能力强的人也会声明自己的能力强。也就是说不同类型的求职者为了赢得职位

数学归纳法(有答案解析)

数学归纳法 2015高考会这样考 1.考查数学归纳法的原理和证题步骤;2.用数学归纳法证明与等式、不等式或数列有关的命题,考查分析问题、解决问题的能力. 复习备考要这样做 1.理解数学归纳法的归纳递推思想及其在证题中的应用;2.规范书写数学归纳法的证题步骤. 一、知识梳理 数学归纳法 一般地,证明一个与正整数n 有关的命题,可按下列步骤进行: (1)(归纳奠基)证明当n 取第一个值n 0 (n 0∈N *)时命题成立; (2)(归纳递推)假设n =k (k ≥n 0,k ∈N *)时命题成立,证明当n =k +1时命题也成立. 只要完成这两个步骤,就可以断定命题对从n 0开始的所有正整数n 都成立.上述证明方法叫作数学归纳法. [难点正本 疑点清源] 1.数学归纳法是一种重要的数学思想方法,主要用于解决与正整数有关的数学问题.证明时步骤(1)和(2)缺一不可,步骤(1)是步骤(2)的基础,步骤(2)是递推的依据. 2.在用数学归纳法证明时,第(1)步验算n =n 0的n 0不一定为1,而是根据题目要求,选择合适的起始值.第(2)步,证明n =k +1时命题也成立的过程,一定要用到归纳假设,否则就不是数学归纳法. 小试牛刀 1.凸k 边形内角和为f (k ),则凸k +1边形的内角和为f (k +1)=f (k )+________. 答案 π 解析 易得f (k +1)=f (k )+π. 2.用数学归纳法证明:“1+12+13+…+1 2n -1 1)”,由n =k (k >1)不等式成立,推证 n =k +1时,左边应增加的项的项数是________. 答案 2k 解析 n =k 时,左边=1+12+…+1 2k -1,当n =k +1时, 左边=1+12+13+…+12k -1+…+1 2k +1-1. 所以左边应增加的项的项数为2k . 3.用数学归纳法证明1+a +a 2+…+a n +1=1-a n +2 1-a (a ≠1,n ∈N +),在验证n =1成立时, 左边需计算的项是 ( )

静态与动态博弈分析

目录 摘要 (2) 一、完全信息静态博弈 (2) 1、背景 (2) 2、博弈的假设与建模 (2) 3、结合案例博弈分析 (3) 4、结论与思考 (4) 5、建议 (4) 6、小结 (5) 二、完全信息动态博弈 (5) 1、背景 (5) 2、模型的建立与假设 (6) 3、分析过程 (7) 4、结论 (8) 5、建议 (8) 6、小结 (9)

完全信息问题的博弈分析 摘要: 通过用博弈分析方法对日常生活中具有现实意义的社会现象和人力资源管理专业问题分析事件发生的本质,从而在各种复杂因素的影响下,找到利益最大化的均衡策略,不仅可以预测参与人的策略选择,更重要是提高自身决策水平和决策质量,实际即是博弈论在现实的运用。本文选取两个案例作为完全信息静态和动态分析的背景。 关键词:博弈论、现实运用、社会现象、招聘 一、完全信息静态博弈 完全信息:每个参与人对其他所有参与人的战略选择和支付收益完全了解。 静态博弈:所有参与人在共同决策环境中同时选择行动策略,每个参与人只选择一次。 纳什均衡:在给定的其他参与人选择的前提下,参与人根据自身收益选择的最优战略。 1、背景: “除非有人证物证,否则我不会再去扶跌倒的老人!”广东肇庆的阿华在扶起倒地的70多岁阿婆却遭诬陷后表示。事发7月15日早上,阿华开摩托车上行人道准备买早餐,看到路边有位老太太跌倒在求救,阿华立刻停下来,扶起老奶奶,殊不知却遭到阿婆的诬陷,随后和阿婆的女婿发生争执。阿婆被送到医院住院观察。为调查真相,交警暂扣了阿华的摩托车。事发后几天,阿华说没睡过一次好觉,还向单位请了几天假,天天在附近找证人,就是为了证实自己清白。 这起社会事件引发了我们的深思:阿婆在路边跌倒,路人是否应该扶起?在这个过程中,跌倒的阿婆是否讹钱与是否采取帮忙的路人构成博弈问题,以下通过完全信息静态博弈模型分析,解析这一社会现象。 2、博弈的假设与建模: 假设:参与博弈的双方是理性人,都会选择个人利益最大化的行动。

数学归纳法

备课 时间 教学 课题 教时 计划 1 教学 课时 1 教学 目标 1.了解归纳法的意义,培养学生观察、归纳、发现的能力. 2.了解数学归纳法的原理,能以递推思想作指导,理解数学归纳法的操作步骤. 3.抽象思维和概括能力进一步得到提高. 重点难点 重点:借助具体实例了解数学归纳的基本思想,掌握它的基本步骤,运用它证明一 些与正整数n (n 取无限多个值)有关的数学命题。 难点:1、学生不易理解数学归纳的思想实质,具体表现在不了解第二个步骤的作 用,不易根据归纳假设作出证明; 2、运用数学归纳法时,在“归纳递推”的步骤中发现具体问题的递推关系。 教学过程 (一)创设情景 对于数列{an},已知11=a , a a a n n n +=+11(n=1,2,…), 通过对n=1,2,3,4前4项的归纳,猜想其通项公式为n a n 1= 。这个猜想是否正确需要证明。 一般来说,与正整数n 有关的命题,当n 比较小时可以逐个验证,但当n 较大时,验证就很麻烦。特别是n 可取所有正整数时逐一验证是不可能的。因此,我们需要寻求一种方法:通过有限个步骤的推理,证明n 取所有正整数都成立。 (二)研探新知 1、了解多米诺骨牌游戏。 可以看出,只要满足以下两条件,所有多米诺骨牌就都能倒下: (1)第一块骨牌倒下; (2)任意相邻的两块骨牌,前一块倒下一定导致后一块倒下。 思考:你认为条件(2)的作用是什么? 可以看出,条件(2)事实上给出了一个递推关系: 当第k 块倒下时,相邻的第k+1块也倒下。 这样,要使所有的骨牌全部倒下,只要保证(1)(2)成立。 2、用多米诺骨牌原理解决数学问题。 思考:你认为证明数列的通过公式是n a n 1= 这个猜想与上述多米诺骨牌游戏有相似性吗?你能 类比多米诺骨牌游戏解决这个问题吗? 分析: 多米诺骨牌游戏原理 通项公式 n a n 1= 的证明方法 (1)第一块骨牌倒下。 (1)当n=1时a1=1,猜想成立 (2)若第k 块倒下时,则相邻的第k+1块也倒下。 (2)若当n=k 时猜想成立,即 k a k 1= ,则当n=k+1时猜想也成立,即 111+=+k a k 。

高鸿业-微观经济学-第七版-课后答案-西方经济学18第十章博弈论初步教学内容

学习-----好资料 第十章 博弈论初步 第一部分 教材配套习题本习题详解 一、简答题 1.什么是纳什均衡?纳什均衡一定是最优的吗? 解答:(1)所谓纳什均衡,是参与人的一种策略组合,在该策略组合上, 任何参与人单独改变策略都不会得到好处。 (2)不一定。如果纳什均衡存在,纳什均衡可能是最优的,也可能不是最优的。例如,在存在多个纳什均衡的情况下,其中有一些纳什均衡就不是 最优的;即使在纳什均衡是唯一时,它也可能不是最优的,因为与它相对应的支付组合可能会小于与其他策略组合相对应的支付组合。如:囚徒 困境。 2.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下, 纯策略的纳什均衡最多可有几个?为什么? 解答:在只有两个参与人 (如 A和 B)且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡最多可有四个。例如,当A与B的支付矩阵可分别表示如下时,总的支付矩阵中所有四个单元格的两个数字均有下划线,从而,总共有四个纳什均衡。 A 的支付矩阵=??????22211211a a a a B 的支付矩阵=??? ???2221 1211b b b b 例如:a 11=a 12=a 21=a 22,b 11=b 12=b 21=b 22就会得到以上四个纳什均衡。 具体事例为: 73737373?? ????

3.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的纳什均衡可能有三个。试举一例说明。 解答:在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,纯策略的 纳什均衡可能有4个、3个、2个、1个和0个五种情况,所以可能有3个。例如,当参与 人A与B的支付矩阵可分别表示如下时,总的支付矩阵中恰好有三个单元格的两个数字均有下划线,从而,总共有三个纳什均衡。 A 的支付矩阵= ??? ???22211211a a a a B 的支付矩阵=11122122b b b b ??????? ? A 、B 共同的支付矩阵=1111121222222121a b a b a b a b ???????? 具体事例为: 76157323?? ?? ?? 4.在只有两个参与人且每个参与人都只有两个策略可供选择的情况下,如何找到所 有的纯策略纳什均衡? 解答:可使用条件策略下划线法。具体步骤如下:首先,把整个博弈的支付矩阵分解 为两个参与人的支付矩阵;其次,在第一个 (即位于整个博弈矩阵左方的)参与人的支付矩阵中,找出每一列的最大者,并在其下画线;再次,在第二个 (在位于整个博弈矩阵上 方的)参与人的支付矩阵中,找出每一行的最大者,并在其下画线;然后,将已经画好线的两个参与人的支付矩阵再合并起来,得到带有下划线的整个博弈的支付矩阵;最后,在带有下划线的整个的支付矩阵中,找到两个数字之下均画有线的支付组合。由该支付组合 代表的策略组合就是博弈的纳什均衡。 5.设有A、B两个参与人。对于参与人A的每一个策略,参与人B的条件策略有无 可能不止一个?试举一例说明。 解答:例如,在如表10—1的二人同时博弈中,当参与人 A选择上策略时,参与人 B 既可以选择左策略,也可以选择右策略,因为他此时选择这两个策略的支付是完全一样 的。因此,对于参与人A的上策略,参与人B的条件策略有两个,即左策略和右策略。 表10—1

数学归纳法典型例题分析

数学归纳法证题步骤与技巧 1.数学归纳法的范围 因此,数学归纳法的适用范围仅限于与自然数有关的命题。它能帮助我们判断种种与自然数n 有关的猜想的正确性。 2.数学归纳法两个步骤的关系 第一步是递推的基础,第二步是递推的根据,两个步骤缺一不可。 3.第一、二数学归纳法 第一数学归纳法可以概括为以下三步:(1)归纳奠基:证明n=1时命题成立;(2)归纳假设:假设n=k 时命题成立;(3)归纳递推:由归纳假设推出n =k+1时命题也成立。从而就可断定命题对于从所有正整数都成立 第二数学归纳法的证明步骤是: 1、证明当n =1时命题是正确的; 2、k 为任意自然数,假设n1(n ∈N *,n >1). 8.求证:()()()() 222n n 112n 13352n 12n 122n 1+++?+= ??-++,(n ∈N * ) 9.用数学归纳法证明an+1+(a+1)2n-1能被a 2 +a+1整除(n∈*N ) 答案解析 2.【解析】选D .当n =k 时,左端=1+2+3+…+k2 , 当n=k+1时,左端=1+2+3+…+k 2+(k 2+1)+(k2+2)+…+(k +1)2 , 故当n =k +1时,左端应在n=k 的基础上加上(k 2+1)+(k 2+2)+…+(k+1)2 ,故应选D.

数学归纳法证题步骤与技巧实战篇

数学归纳法证题步骤与技巧 在数学问题中,有一类问题是与自然数有关的命题。自然数有无限多个,不可能就所有自然数—一加以验证,所以用完全归纳法是不可能的。但就部分自然数进行验证即用不完全归纳法得到的结论,又是不可靠的。这就需要寻求证明这一类命题的一种切实可行而又满足逻辑严谨性要求的新方法——数学归纳法。1.数学归纳法的范围 数学归纳法是以自然数的归纳公理做为它的理论基础的。因此,数学归纳法的适用范围仅限于与自然数有关的命题。它能帮助我们判断种种与自然数n有关的猜想的正确性。 2.数学归纳法两个步骤的关系 第一步是递推的基础,第二步是递推的根据,两个步骤缺一不可,有第一步无第二表,属于不完全归纳法,论断的普遍性是不可靠的;有第二步无第一步中,则第二步中的假设就失去了基础。只有把第一步结论与第二步结论联系在一起,才可以断定命题对所有的自然数n都成立。 3.第二数学归纳法 第二数学归纳法的证明步骤是: 证明当n=1时命题是正确的; ②k为任意自然数,假设n<k时命题都是正确的,如果我们能推出n=时命题也正确,就可以肯定该命题对一切自然数都正确。数学归纳法和第二归纳法是两个等价的归纳法,我们把数学归纳法也叫做第一归纳法。有些命题用第一归纳法证明不大方便,可以用第二归纳法证明。 4.数学归纳法的原理 数学归纳法证明的是与自然数有关的命题,它的依据是皮亚诺提出的自 然数的序数理论,就是通常所说的自然数的皮亚诺公理,内容是: (1)l是自然数。 (2)每个自然数a有一个确定的“直接后继”数a’,a也是自然数。 (2)a’≠1,即1不是任何自然数的“直接后继”数。 (4)由a’=b’,推得a=b,即每个自然数只能是另外的唯一自然的“直接后继” 数。 (5)任一自然数的集合,如果包含1,并且假设包含a,也一定包含a的“直接后继”数a’,则这个集合包含所有的自然数。皮亚诺公理中的(5)是数学归纳法的依据,又叫归纳公理数学归纳法的应用及举例。 2k+1k+2 因为由假设知4 +3能被13整除,13·42k+1也能被13整除,这就是说,当n=k +1时,f(k+l)能被13整除。根据(1)、(2),可知命题对任何n∈N都成立。下面按归纳步中归纳假设的形式向读者介绍数学归纳法的几种不同形式以及它们的应用。 (l)简单归纳法。即在归纳步中,归纳假设为“n=k时待证命题成立”。这是最

相关文档
相关文档 最新文档