文档库 最新最全的文档下载
当前位置:文档库 › 博弈论

博弈论

博弈论
博弈论

博弈论

博弈论又被称为对策论(Game Theory)既是现代数学的一个新分支,也是运筹学的一个重要学科。

博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。

博弈论已经成为经济学的标准分析工具之一。在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。

基本概念中包括局中人、行动、信息、策略、收益、均衡和结果等。其中局中人、策略和收益是最基本要素。局中人、行动和结果被统称为博弈规则。

概念:

博弈论定义:我们把动物利用大自然移动的瘾魂,在决策人期待的空间里,形成相对均衡的语文学理论,称为博弈论。(摘自《博弈圣经》中《人类未知的蓝色

档案》一文)。

博弈论(Game Theory)又被称为对策论(Game Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。博弈论又被称为对策论

(Game·Theory),它是现代数学的一个新分支,也是运筹学的一个重要组成内容。

在《博弈圣经》中写到:博弈论是二人在平等的对局中各自利用对方的策略变换自

己的对抗策略,达到取胜的意义。

博弈论就是研究互动决策的理论,所谓互动决策,即各行动方(即局中人[player])的决策是相互影响的,每个人在决策的时候必须将他人的决策纳入自己

的决策考虑之中,当然也需要把别人对于自己的考虑也要纳入考虑之中……在如此

迭代考虑情形进行决策,选择最有利于自己的战略(strategy)。

博弈论的应用领域十分广泛,在经济学、政治科学(国内的以及国际的)、军事战略问题、进化生物学以及当代的计算机科学等领域都已成为重要的研究和分析

工具。此外,它还与会计学、统计学、数学基础、社会心理学以及诸如认识论与伦

理学等哲学分支有重要联系。

博弈基本概念·博弈要素:

1.决策人:在博弈中率先作出决策的一方,这一方往往依据自身的感受、经验

和表面状态优先采取一种有方向性的行动。(博弈圣经)

2.对抗者:在博弈二人对局中行动滞后的那个人,与决策人要作出基本反面的

决定,并且他的动作是滞后的、默认的、被动的,但最终占优。他的策略可能依赖于决策人劣势的策略选择,占去空间特性,因此对抗是唯一占优的方式,实为领导人的阶段性终结行为。(博弈圣经)

3.生物亲序:所有生物在恶劣、未知的环境中都有寻找规律和有序的本能。在

博弈中指参与者有从混乱的环境中等待、寻找有序的亲近行为。(博弈圣经)

4.局中人(players):在一场竞赛或博弈中,每一个有决策权的参与者

成为一个局中人。只有两个局中人的博弈现象称为“两人博弈”,而多于两个局中人的博弈称为“多人博弈”。

5.策略(strategiges):一局博弈中,每个局中人都有选择实际可行的完

整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。

6.得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局

博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。

7.次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止

一次的决策选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。

博弈的类型

(1)合作博弈——研究人们达成合作时如何分配合作得到的收益,即收益

分配问题。

(2)非合作博弈——研究人们在利益相互影响的局势中如何选决策使自己

的收益最大,即策略选择问题。

(3)完全信息不完全信息博弈:参与者对所有参与者的策略空间及策略组

合下的支付有充了解称为完全信息;反之,则称为不完全信息。

(4)静态博弈和动态博弈

静态博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者不知道先行动者的策略。

动态博弈:指双方的的行动有先后顺序并且后行动者可以知道先行动者的策略。

财产分配问题和夏普里值(Shapley value)

考虑这样一个合作博弈:a、b、c、投票决定如何分配100万,他们分别拥有50%、40%、10%的权力,规则规定,当超过50%的票认可了某种方案时才能通过。那么如何分配才是合理的呢?按票力分配,a50万、b40万、c10万c向a提出:a70万、b0、c30万b向a提出:a80万、b20万、c0……

权力指数:每个决策者在决策时的权力体现在他在形成的获胜联盟中的“关键加入者”的个数,这个“关键加入者”的个数就被称为权利指数。

夏普里值:在各种可能的联盟次序下,参与者对联盟的边际贡献之和除以各种可能的联盟组合。

次序 abc acb bac bca cab cba

关键加入者 a c a c a b

由此计算出a,b,c的夏普里值分别为4/6,1/6,1/6

所以a,b,c应分别获得100万的2/3,1/6,1/6。

企业博弈

博弈论是分析寡头垄断企业市场行为的有力工具。博弈论研究机智而又理性的经济活动主体,在其行为相互影响时的决策以及这种决策的均衡问题。

猎鹿博弈:两个猎人合作猎鹿获得的收益将远大于分别猎兔的收益,战略联盟将开始。这或许是件好事,不过有取决于最后猎获的鹿——这一公共资源的分配,如果分配得当,整体的效率将增加。如果一方主导,另一方受损,那么帕累托改善无法进行,合作可能终将破裂。

另外一个问题,更加大局的问题。合作的示范性将使得更多的猎人加入,猎获的鹿将大大增加,人类的利益短期内将呈几何级数增长。但是最后,确是生态失衡,鹿群灭群。短暂的繁华之后,猎人将再一次回归于原始猎兔生活。尽管为了避免这一悲剧,人类还有最后的希望:制度经济学的法宝——科斯定理以产权归属来解决外部经济问题。但由于谈判成本以及可行性,人类社会的公共悲剧仍将不断上演。

智猪博弈:混沌之前最后的博弈。小猪和大猪住在猪圈的一边(食槽在这里),开启食物的开关在另一头,谁去踩,谁丧失先机。结果怎样?是小猪选择“搭便车”,大猪勤跑。因为小猪无论跑还是停,大猪的最优策略都是策略都是去踩机关。不过在实际生活中。这里依旧存在两种策略。

小猪的“搭便车”。大猪有的时候,自觉或不自觉地自封“侠之大者,为国为民”,并因此承受一些不能承受之重。《博弈论的诡计》指出美国战后的行为极似大猪,战后的美国竭力宣传自己的普世价值观,并深入到海外事务,甚至不惜重金协助小国防务。这样小国不自觉地对大国进行了“剥削”。

大猪在击破模型的一个假设之后,仍然有一个后发制人的机会。因为大猪和小猪的耐饿能力不一样,大猪完全有能力撑得更久,小猪如果不想饿死,那只有一条豪赌的路子:龟兔赛跑式的豪赌,

但愿大猪打了个盹儿,他回来的时候,还能吃上一两口,要不然真是赔了夫人又折兵了。据此,再也不难解释为什么很多人切齿的腾讯,毫无顾忌地跟风,做QQ旋风,做拍拍,做滔滔。因为不甘心的小猪早早把新技术研发的前期搞定了,大猪们只需要悄悄跟随,适当的时候踢开挡路的,就可以了。

大猪在这里的后发制人和枪手博弈的后发并不一致,枪手后发是建立在他人恶斗的基础上,大猪后发完全是以自身实力为基础。而且大猪完全不必采取任何激进措施,只要跟随就好。因为小猪获胜的条件不是接近,还是距离。

警察与小偷:令人沮丧的博弈结局。警察和小偷各只有一个机会去巡查或者偷盗A地或B 地。A地的价值大于B地,那么警察应该为了保护价值大而一直保护A地吗。博弈论认为当然不是,警察的合理策略应当是有倾向于A以一定概率的随机巡查。这个概率就是:p=A地价值/AB地总价值。这种情况下才能使小偷最大得手几率降至最低。但是很不幸的是,此时的小偷谋求的是,最小得手几率的最大化。也就是说,警察的最优策略将把小偷的最差策略改良!这个便是冯〃诺伊曼提出的“最小最大定律”。

我们必须再一次感谢这个不完美的世界,因为现实之中,类似的现象,对于一方仍然可以设法找到对手致命的规律性行动(当然必须考虑到对方是不是一个更加老练的猎手,故意放出的诱饵)。而保持自己的行动的无序性,则有可能成为欺骗策略的武器,这倒似张三丰所言道的:无招胜有招。

斗鸡博弈:两只斗鸡在决斗的时候,无论选择进或退都是一个难题,因为纳什均衡已经给出了一胜一败的最优策略。在很多较量下,死拼将是得不偿失的,因为很可能给第三者机会。因此,两个已经在战场的强势力很可能自觉的遵循纳什均衡,当一方攻击时,另一方暂退。虽然可能某方暂时受损,但较之于两败俱伤是好得多的。不过,要维持这一状况,必须保证下一次先期受损的一方发动攻势的时候,另一方同样的后退。于是这样的攻击性行为开始变得“仪式化”,没有人真正流血。这只不过

是两个巨头玩弄的游戏,目的是警告后来者,想进来,那么也得陪我们一起玩,可是你玩的起么?这正是百事的广告,即使暗含挑衅也最多只到“敢为中国红”这样的地步的原因。

协和谬误:欧洲政府在大量投资协和飞机后,终于不能自拔。即使前景黯淡,也撑着面子投下去,非要走头无路才放弃。而这时投入的成本已经全打水漂了。如果,发现不能继续的时候,就果敢放手,损失会小得多。可是他们会、能这么做么?壮士断腕,是何等的壮烈,却也是何等的艰难!

沉没成本很可能会延续人们无畏的坚持。已经沉没的本该放弃,可惜大部分有赌徒式的心理,相信阿基米德的杠杆终将启动。可惜他们在爬到足够撬动杠杆的支点之前,已经窒息了。

协和谬误,倒是给了人们半途而废的理由,会不会有人担心它的滥觞会左右一些本该坚持的目标?的确有这个可能,但是应该相信人们足够理智,完全可以比较沉没成本、机会成本与未来收益的关系。看清了的,必定会坦然地走出协和谬误。

蜈蚣博弈:一场颠前倒后的博弈。蜈蚣博弈的机理是以最终的结果倒退至开始。这是一个睿智的策略,因果相报,把握好因缘,自有好结果。它的另一个好处,就是使得未来的计划明晰化,是你不再徘徊。只可惜,很多时候,碌碌无为的我们并没有看透迷局的眼睛。我们黑色的眼睛只习惯于黑夜。

蜈蚣博弈也有一个致命的悖论,仍旧是个人利益和集体利益的冲突,因为最后一次的背叛收益始终优于合作。可悲的是,这一次背叛将由于人性的理智,穿越时光隧道,回到原始的地点:人们将从开始就拒绝合作。还是感谢我们这个不完美的世界吧,事实上人们很少这样做。当然合作到最后的也很少,这意味着,倒推法只在中间阶段突然发生了作用,只不过谁也不能预测,中间一步在哪里。在那里,我们只有冀望信任、道德、良知等等。

分蛋糕博弈:两个小孩怎么分蛋糕?经典的故事,经典的解答:一个分,一个选。现实多如此,权利的合理分配将有效促进公平与效率。经营权与所有权的分臵的确使得经济更加活力。不过分蛋糕的进阶模型却强调了讨价还价的策略,分蛋糕不是一次性的,而是多回合的,而且出现成本:蛋糕在融化。

时间称本的加入,将使得分配变得复杂化。双方如果不能及时达成交易,不仅集体的收益将减量,而且个体的收益也将减少。在此情况下,利用时间称本以及威胁、承诺将对其中一方极其有利。顾客可能迫于情势,必须尽快结束谈判,这时卖方却不慌不忙,故意拖延,顾客一方将不得不在价格上作出妥协。

顾客一方当然也有策略,它的策略就是货比三家,要求承诺或威胁。这个前提是买方市场的存在。顾客还应当保护自己讨价还价的能力,这就是顾客有权投诉商家。

鹰鸽博弈:这个博弈很多人等同于斗鸡博弈。不过,斗鸡是两个兼具侵略性的个体,鹰鸽却是两个不同群体的博弈,一个和平,一个侵略。在只有鸽子一个苞谷场里,突然加入的鹰将大大获益,并吸引同伴加入。但结果不是鹰将鸽逐出苞谷场,而是一定比例共存,因为鹰群增加一只鹰的边际收益趋零时(鹰群发生内斗),均衡将到来。

由此产生了ESS进化上的稳定策略,也就是说一旦均衡形成,偏离的运动会受到自然选择的打击。也就是鹰群饱满后,再试图加入的鹰将会被鹰群排挤。

进化上的稳定均衡最大的好处莫过于保持稳定。但问题在于形成强势的路径依赖,也就是胜出的不一定是最好的。因为最好的会被当作出头鸟干掉,这是个体的失败,集团的胜利以及集体的止步不前。

脏脸博弈:恍然大悟的博弈。三个人在屋子里,不许说话。美女进来说:你们当中至少一个人脸是脏的。三人环看,没有反应。美女又说:你们知道吗?三人再看,顿悟,脸都红了。为什么?因为美女后一句废话点破天机,三个人都知道脏脸的存在,而且推测知道对方也知道了脏脸的存在(因为另两人脸没红,说明他们看到脏脸了),而且知道对方知道自己已经想到上一步……循环开始,知识开始共同化,真相大白:三个人都是脏脸,所有人都脸红了。

这就是共同知识的作用,它的作用显得有点可怕的强大。几乎是一招无影腿,杀人不见血。在台面上的博弈之前,私下的算计已经臵对手于死地。不过,很可能对方也预料到这一点,早也想到这一点,同时杀来。终于,形成双死局面。

当然,现实虽然存在类似现象,不过共同知识更大的作用在于减少交易成本。因为某些规则人尽皆知,双方只要各自依之行事就可以了。

信息均衡:很想然,信息的作用在博弈之中非常重要。将博弈论还原到现实,人们不再完全理性,信息存在不对称,博弈就需要在抢占信息高地上作出努力。

信息不对称,是一个很大的障碍。信息的不对称会造成“逆向选择”和“道德风险”,前者事前,后者事后。信息不对称短期内对某一方会有利,但最终会破坏整个市场。于是有两个解决策略。

信息传递:传达你的正面的信息的策略,也就是说吸引顾客走到你的柜台面前。它的要点是保持有效、减低成本。

信息甄别:诱导对手暴露其私下拥有的真实信息。就是给顾客一个放大镜,保证顾客不会走到其他柜台去。这种策略显然更加有效,不过风险也更大:万一顾客用放大镜看出了了自己的瑕疵怎么办?

博弈论在管理制度中的应用

博弈论在管理中的应用

————————————————————————————————作者:————————————————————————————————日期:

博弈论在管理中的应用 不知道大家有没有为这些事情困惑过:为什么员工技能竞赛,技能比拼很难开展,即便开展了,为什么工作效率也没有像预想的那样提高?为什么企业中总有些人拖大家的后退而不努力工作?为什么有的领导手段强硬,有的领导风格怀柔?你是否为“办公室政治”烦恼不已?你有没与遇到过和你看法不一致,总是与你针锋相对的下属?遇到强硬的下属你该怎么办?为什么酒店联盟或者企业间的联盟总是很难做?你是否在做决策之时衡量反复却不知道选择何种策略?。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理?你如何提出科学而又合理解决方法? 以上种种问题,你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识,并以隐藏在我们身边的博弈为例子,给大家提供解决某些实际问题的思路。 那么什么是博弈论呢?所谓博弈论,就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式,既谋略性思考问题的方式。对博弈论通俗的理解就是,关于人与人的斗争中“老谋深算”的学问。 假如你正跟恋人用手机通电话,突然信号断了。这时你是会立即拨电话过去,还是等你的恋人拨电话过来?很显然,你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨,那么另一方最好是等待;如果一方等待,那么另一方最好拨过去。如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中消逝。 这,就是博弈。

博弈论经典例子

博弈论经典例子 篇一:《博弈论三大经典案例》 经典的囚徒困境 1950年,由就职于兰德公司的梅里尔弗拉德(MerrillFlood)和梅尔文德雷希尔(MelvinDresher)拟定出相关困境的理论,后来由顾问阿尔伯特塔克(AlbertTucker)以囚徒方式阐述,并命名为"囚徒困境"。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: 若一人认罪并作证检举对方(相关术语称"背叛"对方),而对方保持沉默,此人将即时获释,沉默者将判监xx年。若二人都保持沉默(相关术语称互相"合作"),则二人同样判监半年。若二人都互相检举(互相"背叛"),则二人同样判监2年。 用表格概述如下: 甲沉默(合作) 乙沉默(合作)二人同服刑半年甲认罪(背叛)甲即时获释;乙服刑xx 年乙认罪(背叛)甲服刑xx年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即"囚徒")都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为"严格劣势",理性的参与者绝不会选择。另外,没有任何

其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 若对方沉默、背叛会让我获释,所以会选择背叛。若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是"困境"所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。由囚徒困境可以写出类似的员工困境: 一名经理,数名员工;前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

《经济博弈论》期末考试复习

《经济博弈论》期末考试复习资料 第一章导论 1.博弈的概念: 博弈即一些个人、队组或其他组织,面对一定的环境条件,在一定的规则下,同时或先后,一次或多次,从各自允许选择的行为或策略中进行选择并加以实施,并从中各自取得相应结果的过程。它包括四个要素:参与者,策略,次序和得益。 2.一个博弈的构成要素: 博弈模型有下列要素:(1)博弈方。即博弈中决策并承但结果的参与者.包括个人或组织等:(2)策略。即博弈方决策、选择的内容,包括行为取舍、经济活动水平或多种行为的特定组合等。各博弈方的策略选择范围称策略空间。每个博弈方各选一个策略构成一个策略组合。(3)进行博弈的次序:次序不同一般就是不同的博弈,即使博弈的其他方面都相同。(4)得益。各策略组合对应的各博弈方获得的数值结果,可以是经济利益,也可以是非经济利益折算的效用等。 3.合作博弈和非合作博弈的区别: 合作博弈:允许存在有约束力协议的博弈;非合作博弈:不允许存在有约束力协议的博弈。主要区别:人们的行为互相作用时,当事人能否达成一个具有约束力的协议。 假设博弈方是两个寡头企业,如果他们之间达成一个协议,联合最大化垄断利润,并且各自按这个协议生产,就是合作博弈。 如果达不成协议,或不遵守协议,每个企业都只选择自己的最优产品(价格),则是非合作博弈。 合作博弈:团体理性(效率高,公正,公平) 非合作博弈:个人理性,个人最优决策(可能有效率,可能无效率) 4.完全理性和有限理性: 完全理性:有完美的分析判断能力和不会犯选择行为的错误。 有限理性:博弈方的判断选择能力有缺陷。 区分两者的重要性在于如果决策者是有限理性的,那么他们的策略行为和博弈结果通常与在博弈方有完全理想假设的基础上的预测有很大差距,以完全理性为基础的博弈分析可能会失效。所以不能简单地假设各博弈方都完全理性。 5.个体理性和集体理性: 个体理性:以个体利益最大为目标;集体理性:追求集体利益最大化。 第一章课后题:2、4、5 2.设定一个博弈模型必须确定哪几个方面? 设定一个博弈必须确定的方面包括:(1)博弈方,即博弈中进行决策并承担结果的参与者;(2)策略(空间),即博弈方选择的内容,可以是方向、取舍选择,也可以是连续的数量水平等;(3)得益或得益函数,即博弈方行为、策略选择的相应后果、结果,必须是数量或者能够折算成数量;(4)博弈次序,即博弈方行为、选择的先后次序或者重复次数等;(5)信息结构,即博弈方相互对其他博弈方行为或最终利益

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息)等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博 弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则 为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信 息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P,I),其中P为市场价格,I为消

费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 2、 参与人的行动顺序,即每个参与 人在何时行动; 3、 序列结构:每个参与人行动时面 临的决策问题,包括参与人行动时可供选择的行动方案、所了解的信息; 4、 参与人的支付函数。 比较: 1、战略式博弈从本质上来讲是一种静态模型。 2、扩展式博弈从本质上来讲是一种动态模型。 {1,2,...,} n Γ={1,2,...,}n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论在管理中的应用

管理中的博弈论 在博弈中,你必须考虑对方的选择来确定你的最优选择,而对方也必须考虑你的选择来确定他的最优选择,你从博弈中得到的赢利——或者说是利益,不仅取决于你自己的行动,也取决于对方的行动,而对对方来说也是如此,你们当中的每一方都试图尽可能的使自己的利益最大化。总之,你们的行动既互相影响又相互依赖,这正是博弈最本质的特征。 在一场博弈中,每个人的目标都是其利益的最大化。在博弈理论中,有一个基本的假设,就是人们不会有道德,良心和情感上的考虑,所有的一切都只以是否符合自身利益作为选择标准。不过我们有时候也会从心理上、情感上对这一假设进行修正。不过,这种假设在绝大多数情况下是成立的。虽然我们研究的是对抗性行为,但是我们不要寄希望于博弈论可以使你所向无敌,不过博弈论确实可以增强你对某些局势的洞察力,因为它有自己独特而又保持逻辑内在一致性的思考方法。 我们来看一个现实的例子。 一个经理,为了提高工作效率而让手下有两个主管进行比赛,获胜者将得到一笔奖金。如果这两个员工都拼命工作,那么每人都有1/2的概率得到奖金,但是每个人也都会承受艰苦工作而带来的负效用,而经理自然可以得到好处。但是这两个员工实际上也可以合谋而皆不努力,这时他们两个得到奖金的概率仍然是1/2,但是谁也不需要承担艰苦劳动所带来的负效用,这使得每个员工都从合谋中得到了好处。不过,经理遭殃了,因为预期的工作效率下降了。假如你是这个经理,你会怎么做? 有什么办法来防范合谋呢?大家可能会想到监督。监督的确可以防范合谋,但是进行有效的监督是很困难的,一是监督者也有可能与被监督者合谋,二是对于隐性的默契合谋,监督对此无能为力。那么有什么办法来防范合谋呢?一个办法就是对员工进行歧视。比如,两名员工是一男一女,那么这个歧视的方案是男员工在比赛中胜出将获得100元,而女员工则只能获得50元。这个方案会导致女员工不努力,而男员工为了胜出将努力而不与女员工合谋。实际上,组织正是通过打击某些员工而拉拢另一些员工来瓦解员工之间的合谋行为的。 不过,这个方案有个问题,她会使被歧视员工不再努力,另外由于法律的相关因素,这样的显性歧视方案不会被广泛采用。我们可以借鉴的是隐形歧视理论。比如在组织中两个员工为了争夺一个更高的职位而竞争。显然,两个员工也可以合谋而不努力,让老天来决定谁来得到这个岗位,并且约定,不管是谁得到这个岗位都需要对对方进行补偿。这个问题仍然

管理博弈论

管理博弈论 管理博弈论(Game Theory of Management) [编辑] 什么是管理博弈论[1] 管理博弈论也称管理激励与约束机制设计理论,是指管理博弈论是对近年来的管理激励与约束机制设计中不同模型、不同方法研究成果的概括和提炼。所以可以说管理博弈论就是围绕管理激励与约束机制设计的一系列理论与方法,是博弈论在管理学领域的运用与发展。 [编辑] 管理博弈论的产生[1] 现代管理的核心职能是激发人最大限度地发挥主观能动性,创造性地开展工作,这其中自然包含了管理者和被管理者之间的博弈。但由于管理对象是有限理性的社会人,不是理性的经济人;由于管理环境是复杂多变而组织目标是相对稳定的,因而管理活动更具多阶段特性;由于被管理者的需求是多方面的,因而管理激励与约束是多因素的;还由于管理活动通常具有多目标、多层次的特点,使博弈论方法在管理学中的应用远比在其他领域的应用更为复杂、多样。由于引入了管理激励与约束机制设计的概念,使得管理和博弈有了结合部,博突论在管理学的应用有了切入点。之所以说管理激励与约束机制是管理博弈论产生和发展的载体,是由于它既切合管理实践发展需要,又能将个人理性与非理性、优化结果的定量与定性描述、需求的单因素与多因素、管理的单目标与多目标、单阶段与多阶段、单一管理层次与多管理层次有机地结合起来,从而为博弈论在管理学中的应用与发展开辟了道路。 [编辑] 管理博弈论的基本内容 管理博弈论的基本内容包括:需要激励,目标激励,榜样激励,压力约束,纠偏约束。 [编辑] 管理博弈论管理的核心[2]

管理博弈论管理的核心是如何最大限度地发挥主观能动性创造性地开展工作,这其中就包含了管理者与被管理者之间的博弈。现代管理是以人为中心的管理,一个组织内部的效率取决于全体员工的努力水平。因此,激励与约束就成了管理的核心职能。在企业中如何提高员工的素质,如何创造出使员工感到上下级平等的环境,如何达成组织目标和个人目标的统一,这都是一个组织在进行管理的时候考虑如何运用管理激励与约束手段的问题。从社会现实来看,假冒伪劣产品的出现,污染问题,体育比赛中的黑哨问题,运动员的违规问题等等都是管理激励与约束措施不当造成的。建立有效的管理与约束机制已经成为现代管理实践的迫切需要。管理博弈论就是一门关于激励与约束机制体系设计的新学科,它是博弈论在管理应用中的一个重要的、新的分支,管理博弈论进行定量化.模型化研究的基本数学基础就是博弈论。 [编辑] 管理博弈论的学科特点[1] 管理博弈论作为一门以管理激励与约束机制设计为研究对象的新兴学科,有自己产生的时代背景,有自己明确的研究对象与范围,有自己的理论基础,是应管理实践需要而生的。具体而言这门新学科具有如下一些特点: (1)管理博弈论是一门新兴综合性交叉学科。管理博弈论研究的对象是管理激励与约束机制设计,管理激励与约束机制问题往往非常复杂。由于管理者与被管理者之间一般信息是不对称的,他们既可能是合作关系,也可能是非合作的关系,管理激励与约束机制设计中需要综合运用合作博弈、非合作博弈、非对称信息博弈的理论与方法,还可能用到各种现代数学最优化理论,还要以管理学激励与约束理论为指导。因此,管理博突论是由众多学科理论交叉形成的,以特定的管理激励与约束机制设计为研究对象的综合性新学科。 (2)管理博弈论是一门应用性管理类新学科。管理博弈论是根据管理实践的需求而产生发展的,它的问题来源于管理实践,它的研究服务在于管理实践,故而它是一门理论与实践紧密结合的应用性管理类新学科。 (3)博弈模型的机制式表述。博弈论中博弈模型的基本表述形式有战略式表述、扩展式表述;非对称信息博弈论中博弈模型的基本表述形式为特征函数式表述。这些博弈模型的表述形式都是管理博弈论中博弈模型可采用的表述形式,但是,由于对复杂的多目标、多样因素、多阶段博弈难以表述,故其应用具有很大的局限性。为此,管理博弈论提出了适应于解决多目标、多因素、多阶段复杂的管理激励与约束机制模型的基本表述形式——机制式表述。 (4)定性要素研究与定量要素研究相结合。博弈论与非对称信息博弈论中博弈模型不仅可容纳的要素较少,而且要求要素只能是定量的。管理问题中涉及的资源要素不仅多,而且定性要素占的比重很大。不能反映定性要素作用的模型,显然不足以反映问题的全貌,设计出的模型必然是有缺陷的。管理博弈论强调定性要素研究与定量要素研究相结合,在其机制式表述中,通过定性因素定量化,将定性因素纳入模型,研究其作用与影响,力图达到充分全面反映问题的目的。

博弈论与社会科学方法论(潘天群)

通识课 课程中文名称:博弈论与社会科学方法论 课程英文名称:Game Theory and Methodology of Social Sciences 课程代号:开课学期:第一学期(秋学期) 主讲教师:潘天群职称:教授、博导 研究专长:博弈论、逻辑学、科学方法论 所在院系:哲学联系电邮:tqpan@https://www.wendangku.net/doc/136281294.html, 授课对象:全校二、三年级本科生(不限专业) 一、主讲教师简介: 潘天群,哲学博士,现为南京大学哲学系、南京大学现代逻辑与逻辑应用研究所教授、博士生导师。兼任中国逻辑学会常务理事、中国逻辑学会经济逻辑专业委员会副主任委员。教育部新世纪人才(2006)。曾于2001年9月-2002年2月在美国纽约大学政治学系从事“博弈论中的方法论问题”的访问研究。 主要研究领域为:逻辑学、哲学、博弈论。在《哲学研究》等国内外学术杂志发表学术论文约70余篇。独立出版著作5部:《行动科学方法论》,《博弈生存——社会现象的博弈论解读》、《博弈思维——逻辑使你决策制胜》、《社会决策的逻辑结构》与《合作之道——博弈中共赢方法论》。其中《博弈生存——社会现象的博弈论解读》,自2002年出版以来深受读者欢迎,为畅销书与长销书,已出版第三版。 主持国家社会科学基金项目“博弈论的哲学基础与应用功能研究”(2009)。 二、课程简介 由于“他人”与“我”是既合作又竞争的关系,研究冲突与合作的博弈论自上一世纪由冯?诺依曼等人创立与发展以来,对社会现象表现出强大的解释力,已经成为社会科学的一个通用工具。迄今至少有五位博弈论专家获得诺贝尔经济学奖,许多诺贝尔经济学奖获得者其研究与博弈论相关。博弈论也也渐渐渗透到自然科学(如生物学、人工智能)之中。 本课程突破数理博弈论的框架,结合主讲教师十年来的研究工作,构建适合

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论在管理中的应用

博弈论在管理中的应用 不知道大家有没有为这些事情困惑过:为什么员工技能竞赛,技能比拼很难开展,即便开展了,为什么工作效率也没有像预想的那样提高?为什么企业中总有些人拖大家的后退而不努力工作?为什么有的领导手段强硬,有的领导风格怀柔?你是否为“办公室政治”烦恼不已?你有没与遇到过和你看法不一致,总是与你针锋相对的下属?遇到强硬的下属你该怎么办?为什么酒店联盟或者企业间的联盟总是很难做?你是否在做决策之时衡量反复却不知道选择何种策略?。。。。。。。。等等等等这些问题、困惑你是否明白其中的原理?你如何提出科学而又合理解决方法? 以上种种问题,你都能从博弈理论中得到合理而科学的解释。而大家是否了解博弈论呢。我们这次分享就是和大家一起了解博弈论的一些知识,并以隐藏在我们身边的博弈为例子,给大家提供解决某些实际问题的思路。 那么什么是博弈论呢?所谓博弈论,就是一套研究互动决策行为的理论。它实际上也可以看做是一种方式,既谋略性思考问题的方式。对博弈论通俗的理解就是,关于人与人的斗争中“老谋深算”的学问。 假如你正跟恋人用手机通电话,突然信号断了。这时你是会立即拨电话过去,还是等你的恋人拨电话过来?很显然,你是否拨电话过去取决于你的恋人是否会拨过来。如果你们其中一方拨,那么另一方最好是等待;如果一方等待,那么另一方最好拨过去。如果双方都拨,那么就会出现线路忙;如果双方都等待,那么时间就会在等待中消逝。 这,就是博弈。

“要在现代社会做一个有文化的人,你必须对博弈论有大致的了解。” ——萨缪尔森 在博弈中,你必须考虑对方的选择来确定你的最优选择,而对方也必须考虑你的选择来确定他的最优选择,你从博弈中得到的赢利——或者说是利益,不仅取决于你自己的行动,也取决于对方的行动,而对对方来说也是如此,你们当中的每一方都试图尽可能的使自己的利益最大化。总之,你们的行动既互相影响又相互依赖,这正是博弈最本质的特征。 在一场博弈中,每个人的目标都是其利益的最大化。在博弈理论中,有一个基本的假设,就是人们不会有道德,良心和情感上的考虑,所有的一切都只以是否符合自身利益作为选择标准。不过我们又是也会从心理上,情感上对这一假设进行修正。不过,这种假设在绝大多数情况下是成立的。虽然我们研究的是对抗性行为,但是大家不要寄希望于博弈论可以使你所向无敌,不过博弈论确实可以增强你对某些局势的洞察力,因为他有自己独特而又保持逻辑内在一致性的思考方法。 我们来看一个现实的例子。 一个经理,为了提高工作效率而让手下有两个主管进行比赛,获胜者将得到一笔奖金。如果这两个员工都拼命工作,那么每人都有1/2的概率得到奖金,但是每个人也都会承受艰苦工作而带来的负效用,而经理自然可以得到好处。但是这两个员工实际上也可以合谋而皆不努力,这时他们两个得到奖金的概率仍然是1/2,但是谁也不需要承担艰苦劳动所带来的负效用,这使得每个员工都从合谋中得到了好处。不过,经理遭殃了,因

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

博弈论的经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

1.3.7 博弈论分析方法的主要特征

博弈论分析方法的主要特征 博弈论已形成一套完整的思想体系和方法论体系。其分析方法具有下列特征: 1. 研究对象的普遍性和应用范围的广泛性 人们的行为之间存在相互作用与相互依赖,不同的行为主体及其不同的行为方式所形成的利益冲突与合作,已成为一种普遍现象,这使博弈论的研究对象具有普遍性。一切涉及到人们之间利益冲突与一致的问题、一切关于竞争或对抗的问题都是博弈论的研究对象。 现实社会中广泛存在的合作与非合作博弈、完全信息与不完全信息博弈的事实,使博弈论的研究内容和应用范围十分广泛,涉及到政治学、社会学、伦理学、经济学、生物学、军事学等诸多领域,在经济学中的应用尤为突出。 2. 研究方法的模型化、抽象化以及涉及学科的综合性 一是运用数学模型来描述所研究的问题,使博弈论的分析更为精确。 二是研究方法具有抽象化的特征,由于博弈论分析大量使用了现代数学,使它所描述和分析的过程及所揭示的结论都带 有抽象、一般化的特点。 三是博弈论分析方法所体现的模式化特征,博弈论为人们提供了一个统一的分析框架或基本范式,从而使博弈论能够分 析和处理其它数学工具难以处理的复杂行为,成为对行为主 体间复杂过程进行建模的最适合的工具。

四是博弈论方法所涉及的学科的综合性。在博弈论分析中,不仅要应用现代数学的大量知识,还涉及到经济学、管理学、 心理学和行为科学等学科。 3. 研究方法的实证性与研究结论的真实性 博弈论中的最佳策略是经济学意义上的最优化,它只回答是什么导致博弈均衡,均衡的结果是什么,所遵循的基本原则是科学结论的客观性和普遍性。从实践上看,博弈论突破了传统的完全竞争、完全信息假定,更加强调决策者的个人理性,强调不完全信息、不完全竞争条件下的经济分析,强调决策个体之间的相互影响和相互作用等外部性,强调通过规则、机制和制度的设计和优化在个人理性得到满足的基础上达到个人理性和集体理性的一致,等等。作为一门方法论科学,除了提供分析和解决博弈问题的独特和新颖的具有战略思维的思想方法以外,还提供了更加贴近现实的分析工具并填补了传统经济分析的许多空白。从这个意义上说,博弈论方法具有实证的特征,使研究结果更具有真实性。

历史的制度分析:博弈论分析方法

历史的制度分析:博弈论分析方法 把博弈论作为研究方法和分析工具应用于经济体制与制度问题的研究,目前主要有两种方法。一种是“进化博弈论方法”(evolutionary game approach)。经济学中的进化博弈论是在生物学的进化博弈论的基础上产生、发展起来的。它将人类的经济活动和竞争性经济行为同生物的进化相类比,研究人类经济行为中的策略和行为方式的均衡,以及向均衡状态调整、收敛的过程与性质。采用这一方法的研究者认为,社会制度并不是由什么人有意设计出来的,而是在那些适应环境和社会变化的新的制度结构不断被发现、更为理想的制度结构不断被保存的过程中产生的。这就是所谓的“适应性进化”过程。进化博弈论的引入,就是为了分析和说明社会制度的这一适应性进化过程。进化博弈论之所以在制度变迁理论中受到重视,主要是因为它是在不严重依赖决策者计算能力的前提下来说明均衡选择过程,从而在纳什均衡的理性主义解释遇到理论困难时,显示出了通过进化机制实现纳什均衡的可能性。 应用博弈论研究制度变迁的另一种新方法是“重复博弈论方法”(repeated game approach),它运用更精细的均衡概念,如“子博弈精炼均衡”(subgame perfect equilibrium)来分析历史与现实中的制度选择与变迁过程。其中最具代表性的,就是格瑞夫进行的“历史的比较制度分析”。 所谓的重复博弈,实际上是指同样结构的博弈重复地进行多次。与一次性博弈不同,它是由若干个阶段博弈(stage game)构成的一个完整的和相对长期的博弈过程。因此,在重复博弈中,各博弈方的着眼点就不是其在某一阶段上的局部利益或短期利益,而是他们在整个博弈过程中的总体利益和长期利益。当各博弈方面对不同的策略选择时,他必须考察到其在当前阶段的博弈中所采取的策略,不致在随后阶段中引起其他博弈方的对抗、报复或恶性竞争。也就是说,他不能像在一次性博弈中那样,毫不顾及其他博弈方的利益。有时,一方若作出一种合作姿态,可能会使其他博弈方在随后的阶段中也采取合作态度,从而实现共同的长远利益。这样,在重复博弈中就存在着比一次性博弈更大的合作的可能性,也有可能实现比一次性博弈更有效率的均衡。重复博弈论的这一特征,为它说明人类之间的合作行为,特别是说明历史与现实社会中体制与制度的演变过程,提供了强有力的支持。 在历史的比较制度分析那里,制度被定义为本身是“自我实施的对行为的非技术决定的约束” ,即所谓的自我实施制度(self-enforcing institution )。自我实施制度的一个最基本的特征,就是它的自发产生和自我实施的性质。与那些由国家和法律强制实施的制度不同,自我实施制度必须是参与人各方经过协商、谈判、讨价还价后自愿达成一致的结果。因此,历史的比较制度分析将自我实施制度视为特定历史条件下制度博弈的一种均衡状态或均衡结果。自我实施制度产生的过程,也就是制度博弈各方在特定的战略局势中,根据自己不同的目标自主地选择各自的最优策略与对手进行博弈,最后求得制度均衡的过程。而所谓的“子博弈精炼均衡”,恰恰是指在构成动态博弈的所有子博弈阶段上都实现了纳什均衡。这就是说,一个子博弈精炼均衡,必须是各博弈方在整个博弈的每个阶段(子博弈)都选择了不愿单独改变的策略(纳什均衡)的最终结果。如果我们从博弈论的角度来观察自我实施制度,就会发现自我实施制度与子博弈精炼均衡之间的内在联系。简单地说,自我实施制度所具有的自发产生和自我实施的基本属性,说明了它必定是制度博弈各方在每个子博弈中都选择了不愿单独改变的最优策略的结果,也即实现子博弈精炼均衡的结果。更直接地说,自我实施制度的产生,必定是一个制度博弈实现了子博弈精炼均衡的结果。反过来说,如果一个制度博弈实现了子博弈精炼均衡的结果,那它也应该是自我实施的。

《博弈论及其在管理中的应用》问题

2013-2014(II)《博弈论及其在管理中的应用》问题 第I部分 A1.(1)《孙子兵法》与《孙膑兵法》出自什么年代?(2)作者是谁?(3)说出“知彼知己,百战不殆”、“不战而屈人之兵,善之善者也”、“上屋抽梯”及“围魏救赵”这四个成语和典故的出处。(4)以上四个成语中选出至少一个从博弈论及企业管理的角度解释其含义及现实意义。(20分) A2.(1)现代博弈理论——非合作博弈的纳什均衡理论是在什么年代建立的?(2)纳什均衡理论的创立者是谁?他的贡献主要体现在哪些方面?他因什么获得经济学诺贝尔奖? A3(1)试述由两个人两个策略集合组成博弈的纳什均衡的定义(写出两个不等式)。(2)纳什均衡与划线法及反应函数法之间有什么关系?(20分) 第II部分 B1.囚徒困境。(20分) B2智猪博弈(Boxed Pigs Game)(20分) 假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有10个单位的猪食进入猪食槽,供两头猪食用。两头猪面临两个策略的选择:自己去按按钮或等待另一头猪去按按钮。如果某一头猪做出自己去按按钮的选择,它必须付出如下代价:第一,它需要消耗相当于2个单位的成本;第二,由于猪食槽远离按钮,它将比另一头猪后到猪食槽,从而减少吃食的数量。假定:若大猪先到(小猪按按钮),大猪将吃到9个单位的猪食,小猪只能吃到1个单位的猪食;若小猪先到(大猪场按按钮),大猪将吃到6个单位的猪食,小猪吃到4个单位的猪食;若两头猪同时按按钮,大猪吃到7个单位的猪食,小猪吃到3个单位的猪食;若两头猪同时到(两头猪都选择等待),则两头猪都吃不到猪食。如表1所示,对应不同战

博弈论三大经典案例

经典的囚徒困境 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ?若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ?若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ?若二人都互相检举(互相“背叛”),则二人同样判监2年。 用表格概述如下: 甲沉默(合作)甲认罪(背叛) 乙沉默(合作)二人同服刑半年甲即时获释;乙服刑10年 乙认罪(背叛)甲服刑10年;乙即时获释二人同服刑2年 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ?若对方沉默、背叛会让我获释,所以会选择背叛。 ?若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 由囚徒困境可以写出类似的员工困境: 一名经理,数名员工; 前提,经理比较苛刻; 如果所有员工都听从经理吩咐,则奖金等待遇一样,不过所有人都超负荷工作 如果某人不听从吩咐,其他人听从吩咐,则此人下岗。其他人继续工作 如果所有人都不听从经理吩咐,则经理下岗 但是,由于员工之间信息是不透明的,而且,都担心别人听话自己不听话而下岗,所以,大家只能继续繁重的工作. 囚徒困境是博弈论的非零和博弈中具代表性的例子,反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质,但现实中的价格竞争、环境保护等方面,也会频繁出现类似情况。

论文-博弈论方法在经济学中

经济生活中的博弈论应用 摘要:博弈,这个原来只是在学术圈出现的名词,如今已经越来越多地走进了我们的生活。博弈论是运筹学的一个重要分支,其中,非合作博弈(non- cooperative game)是现代博弈理论中的核心内容和重要基础,下面通过对经典案例囚徒困境和智猪博弈的分析,对纳什均衡相关定义的研究,得到了在经济决策中行为人如何决定最优决策的方法。在此基础上,以纳什均衡作为理论支撑点,结合得益矩阵分析解决了经济生活中商家价格战的一些实际问题。 关键词:博弈论;均衡点;得益矩阵;纳什均衡

目录 一.引言 (3) 二.博弈论与纳什均衡的主要内容 (3) 2.1博弈论的主要思想 (3) 2.2博弈论的分类 (4) 2.3纳什均衡 (4) 2.4 纳什均衡的分类 (4) 三.案例分析 (5) 3.1 囚徒困境(1950年,图克) (5) 3.1.1案例分析 (5) 3.1.2案例应用 (6) 3.2 智猪博弈(1950年,约翰.纳什) (6) 3.1.1 案例分析 (7) 3.1.2 案例应用 (7) 四.价格战博弈 (8)

一.引言 近代对于博弈论的研究,开始于策墨咯(Zermelo),波雷尔(Borel)以及冯·诺伊曼(V on·Neumann)。1928年冯·诺伊曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺伊曼和摩根斯坦共同撰写了时代巨著《博弈论与经济行为》并将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学期的基础和理论体系。1950-1951,约翰·福布斯·纳什(John Forbes Nash Jr)利用不动点定理证明了均衡点的存在,以此为博弈论的一般化奠定了坚实的基础。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼等人的研究也对博弈论的发展起到了不小的推动作用。 二.博弈论与纳什均衡的主要内容 2.1博弈论的主要思想 书上是这样定义的:博弈是指一些个人或者组织面对一定的环境条件,在一定的规则下同时或者先后一次或者多次从各自允许选择的行为或策略中进行选择并加以实施,进而各自取得相应结果的结果。现代科学将这种“对策论”、“对局理论”称之为博弈论,主要研究公式化了的激励结构间的相互作用。从上述定义中可以看出,一个完整的博弈一般由以下几个要素组成:博弈的参加者,各博弈方各自选择的全部策略或行为的集合、博弈方的得益(得益矩阵)、结果、均衡等。 1、参与人指的是博弈中选择行动以最大化自己效用的决策主体(可以是个人,也可以是团体)。 2、行动是指参与人在博弈进程中轮到自己选择时所作的某个具体决策。 3、策略是指参与人选择行动的规则,即在博弈进程中,什么情况下选择什么行动的预先安排。 4、信息指的是参与人在博弈中所知道的关于自己以及其他参与人的行动、策略及其得益函数等知识。 5、得益是参与人在博弈结束后从博弈中获得的效用,一般是所有参与人的

相关文档