文档库 最新最全的文档下载
当前位置:文档库 › 博弈论的基本概念

博弈论的基本概念

博弈论的基本概念
博弈论的基本概念

博弈论的基本概念

?博弈论是研究两人或多人谋略和决策的理论。

?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。

?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。

参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。

?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。

?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。

?均衡:均衡是所有参与者的最优策略组合,记为s*。

几个经典的博弈实例

?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

? 例二 海滩占位 甲、乙两个冷饮摊贩,他们在一个直线状的海滩上,以同样的价格,相同的质量向均匀散布在海滩上的众多游客销售冷饮。既然是做生意,目的总是多赚钱,甲乙两人有时在同一地点做同样的生意,竞争是难免的,这两个摊贩应该怎样安排自己的摊位,才能相安无事的做自己的生意?(假定游客总是到据自己最近的摊位购买冷饮)。

? 例三 智猪争食 猪圈里有一头打猪和一头小猪。里面有一个猪食槽,槽的对面装有控制开关。只要去拱开关,就会有一次6个单位的饲料流进槽里。如果它们都不去拱开关,那么它们都吃不到饲料;如果小猪去拱,那么等到它跑回来时,大猪已把饲料吃光了;如果大猪去拱,等它回来时可以吃到1个单位的饲料;如果他们一起去拱,在一起跑回来,那么大猪可以抢到4个单位的饲料,小猪也能吃到2个单位的饲料。假定每拱一次开-1,-1 -9,0 0,-9 -6,-6 坦白 沉默 坦白 沉默 囚徒一

关需要消耗0.5个单位的饲料能量。它们长期一起进食,上面所说的情况两只猪都知道。它们应该如何选择?

完全信息静态博弈

? 静态博弈:静态博弈指的是博弈的参与者同时选择各自的行动,即便是选择行动有先后的话,后行动者也不知道先行动者所采取的行动。

? 博弈的标准表述(策略表述)含有三个要素(1)博弈参与者集合i ∈ N ;

(2)每个参与者的策略空间S i ;(3)每个参与者的收益函数ui 。

? 定义:在一个有n 个参与者的博弈中,参与者的策略空间S 1,S 2,…,S n ,收益函数为u 1,u 2,…,u n ,称G={S 1,S 2,…,S n ;u 1,u 2,…,u n }为此博弈的一个标准表述。

? 定义:如果对任一s i ’ ∈ S i ,s i ’ ≠ s i *, 不等式u i (s 1,…,s i-1, s i *, s i+1,…,s n )> u i (s 1,…,s i-1, s i ’ ,s i+1,…,s n )对所有的策略组合(s 1,…,s i-1, s i+1,…,s n )都成立,那么 si*称为参与者i 的严格占优策略。

? 定义:在博弈的标准表述中,如果对所有的参与者i ∈N , s i * 是i 的严格0,0

6,-0.5 0.5,5 3.5,1.5 拱 不拱 拱 不拱 大猪 小猪

占优策略,那么策略组合s*=(s 1*, …,s n *)称为严格占优策略均衡。

? 定义:在标准表述的博弈中,设s i ’和s i ’’是参与者i 的两个可选策略,若u i (s 1,…,s i-1, s i ’,s i+1,…,s n )

2,0 0,1 0,3 0,1 1,2 1,0 上 下 左 中 右 参与者1 参与者2 0,1 0,3 1,2 1,0 上 下 左 中 参与者1 1,2 1,0 上 下 左 中 参与者1

? 定义:在博弈G={S 1,S 2,…,S n ;u 1,u 2,…,u n },策略s*= (s 1*,…,s i-1*, s i *,s i+1*,…,s n *)满足条件:对每一个参与者i ,都有对所有的s i ∈ S i , u i (s 1*,…,s i-1*, s i ,s i+1*,…,s n *) ≤ u i (s 1*,…,s i-1*,

s i *,s i+1*,…,s n *) 成立, 则称s*为该博弈的一个纳什均衡。

? 严格占优策略均衡、逐步剔除严格劣策略均衡与纳什均衡的关系:严格占优策略均衡是纳什均衡;逐步剔除严格劣策略均衡是纳什均衡;反之不然。

完全信息动态博弈

? 动态博弈:各参与者的行动有先后顺序,而且后行动者在自己行动之前能观测到先行动者的行动。

? 定义:完全信息扩展式博弈形式是一个三元组F=(N,H,P ):其中N 是参与者的集合。H 是A (行动的集合)中元素组成的序列的集合并且满足:

(1)空序列()∈H ;(2)如果一个h ∈H ,则h|k ∈H , h|k 表示h 的长度为k 的子序列;(3)如果一个无穷序列的所有有穷子序列都属于H ,那么h 也属于H 。P :H/Z ? N ,其中Z ?H 且h ∈Z 当且仅当任给h ’ ∈H ,若h ’|k =h 则h ’ =h 。

? 对于n 个参与者有限战略的扩展式表述有一种直观的图形方法,就是博弈2,4 2,3 1,4 1,1 0,2 4,0 1,2 4,1 3,3 上 中 左 中 右 参与者1 下

在上面的这个博弈中既不存在严格占优策略均衡,也不存在逐步剔除严格劣策略均衡,对这样的博弈引入纳什均衡的概念。

树。

?设ui:Z ?R,F=(N,H,P)扩展式博弈形式,我们称G=(F,(u i)i N)为一个扩展式博弈。

1

2 (0,0)(2,1)(1,2)

l L

r R

(完整版)博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、 决策主体是理性的,最大化自己的收益。 2、 完全理性是共同知识 3、 每个参与人被假定为可以对所处环境以及其他参与者的行为形成正确的信念 与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完全信息) 等的信息。 完全信息:每个参与人对其他参与人的支付函数有准确的了解;完美信息:在博弈过程的任何时点每个参与人都能观察并记忆之前各局中人所选择的行动,否则为不完美信息。 不完全信息:参与人没有完全掌握其他参与人的特征、战略空间及支付函数等信息,即存在着有关其他参与人的不确定性因素。 支付:决策主体在博弈中的收益。在博弈中支付是所有决策主题所选择的行动的函数。 从经济学的角度讲,博弈是决策主体之间的相互作用,因此和传统个人决策存在着区别: 3、博弈论与传统决策的区别: 1、 传统微观经济学的个人决策就是在给定市场价格、消费者收入条件下,最大化自己 效用,研究工具是无差异曲线。可表示为:maxU(P ,I),其中P 为市场价格,I 为消费者可支配收入。 2、 其他消费者对个人的综合影响表示为一个参数——市场价格,所以在市场价格既定 下,消费者效用只依赖于自己的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相比,扩展式博弈更注重对参与人在博弈过程中遇到决策问题时序列结构的分析。 包含要素: 1、 参与人集合 {1,2,...,}n Γ={1,2,...,}n Γ=11(,...,,...,)n i i n i s s s s ==∏

博弈论的基概念

博弈论的基本概念 ?博弈论是研究两人或多人谋略和决策的理论。 ?博弈论思想古已有之,我国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展,正式发展成一门学科则是在20世纪初。1928年冯·诺意曼证明了博弈论的基本原理,从而宣告了博弈论的正式诞生。1944年,冯·诺意曼和摩根斯坦共著的划时代巨著《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。纳什的开创性论文《n人博弈的均衡点》(1950),《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博弈论已发展成一门较完善的的学科。 ?参与者:参与者是指一个博弈中的决策主体,通常又称为参与人或局中人。 参与人的目的是通过合理悬着自己的行动,以便取得最大化的收益。参与者可以是自然人,也可以是团体。 ?信息:信息是指参与者在博弈过程中能了解和观察到的知识。信息对参与者是至关重要,每一个参与者在每一次进行决策之前必须根据观察到的其他参与者的行动和了解到的有关情况作出自己的最佳选择。完全信息是指所有参与者各自选择的行动的不同组合所决定的收益对所有参与者来说是共同知识。

?策略:策略是参与者如何对其他参与者的行动作出反应的行动规则,它规定参与者在什么时候选择什么行动。通常用s i表示参与者i的一个特定策略,用S i表示参与者i的所有可选择的策略的集合(又成为而i的策略空间)。如果n个参与者没人选择一个策略,那么s=(s1,s2,…,s n)称为一个策略组合。 ?收益:收益是在一个特定的策略组合下参与者能得到的确定的效用。通常用u i表示参与者i的收益,它是策略组合的函数。 ?均衡:均衡是所有参与者的最优策略组合,记为s*。 几个经典的博弈实例 ?例一囚徒困境两个共同作案的犯罪嫌疑人被捕,并受到指控。除非至少一人认罪,否则警方无充分证据将他们按最论刑。警方把他们隔离审讯,并对他们说明不同行动所带来的后果。如果两人都采取沉默的抗拒态度,因警方证据不足,两人将均被判为轻度犯罪入狱一个月;如果双方都坦白,根据案情两人将被判入狱六个月;如果一个招认而另一个拒不坦白,招认者因由主动认罪立功的表现将立即释放,而另一人将被判入狱九个月。

博弈论的书心得体会

博弈论的书心得体会 篇一:阅读博弈论类书籍的心得体会 阅读博弈论类书籍的心得体会 图书情报宋静思 最近阅读的书目主要围绕在博弈论领域,由浅入深的从博弈论平话类书籍到博弈论的理论应用类书籍都有一些涉猎。近一个月来我所阅读的书目主要有王则柯的《新编博弈论平话》、高志明的《生存博弈》、黄涛的《博弈论教程—理论、应用》以及张维迎的《博弈论与信息经济学》。由于个人能力与知识储备的限制,对以上书目的认识理解和心得也是有限的,下面我仅对上述书目中能够引起我思考的一些理论和案例展开分析并阐述我的一点见解,以及提出我所认为的这些博弈理论可以分析的社会现象。 一、对博弈论平话类书籍的心得 首先从王则柯教授的《新编博弈论平话》和高志明教授的《生存博弈》这两本书使我我深刻的认识到博弈论作为一种科学的思维方法对我们在日常生活中科学的做出决策有重大的意义。它们都是以比较浅显的例子和故事普及博弈论的一些知识和方法,阐发博弈论的一些思想和观念。从囚徒困境、情侣博弈、诺曼底登陆模拟和慕尼黑谈判模拟等能够引起读者兴趣的故事入手,介绍静态博弈、动态博弈、纳

什均衡、零和博弈、双赢对局、帕累托优势、子博弈精炼纳什均衡等博弈论的基本概念,以及劣势策略消去法、相对优势策略下划线法、确定混合策略纳什均衡的反应函数法、动态博弈的倒推法等博弈论基本方法,在以上两本书的论述中很少使用到高等数学的知识,这两本书是使我对博弈论产生兴趣的启蒙老师,帮助我了解博弈论的若干初步知识。 从最初对这两本书的阅读我真正理解了什么是博弈决策,就拿我们生活中报考什么学校、从事什么职业、选择何种方式度过周末闲暇时光等这些例子来说,之所以称之为博弈决策,是因为在这些例子当中,我的身边往往存在和我情形相似的决策者,我们的思维和行动相互之间产生着很微妙的互动影响。博弈论研究的目的,就是要清晰地揭示蕴涵于这种互动影响中的基本概念和原理,从而帮助我们建立策略思维的意识。 看过囚徒困境后,我明白了为什么寡头企业不选择在市场上结盟而是竞相采取低价策略企图抢占更多的市场份额;又为什么多数情形是非合作博弈。虽然通过囚徒困境的博弈分析我可以理解上述现象产生的原因,然而究其根本原因,是什么导致了囚徒困境呢?这不禁引发了我的思考。设想如果两个罪犯充分相信同伙遵守最初的约定死咬着抵赖会有最后的困境出现么?如果联盟内部成员相信彼此遵守约定

博弈论知识点总结

博弈论知识点总结

博弈论知识总结 博弈论概述: 1、博弈论概念: 博弈论:就是研究决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。 博弈论研究的假设: 1、决策主体是理性的,最大化自己 的收益。 2、完全理性是共同知识 3、每个参与人被假定为可以对所处 环境以及其他参与者的行为形成正确的 信念与预期 2、和博弈有关的变量: 博弈参与人:博弈中选择行动以最大化自己受益的决策主体。 行动:参与人的决策选择 战略:参与人的行动规则,即事件与决策主体行动之间的映射,也是参与人行动的规则。 信息:参与人在博弈中的知识,尤其是其他决策主体的战略、收益、类型(不完 全信息)等的信息。

1、

2、 既定下,消费者效用只依赖于自己 的收入和偏好,不用考虑其他消费者的影响。但是在博弈论理个人效用函数还依赖于其他决策者的选择和效用函数。 4、博弈的表示形式:战略式博弈和扩展式博弈 战略式博弈:是博弈问题的一种规范性描述,有时亦称标准式博弈。 战略式博弈是一种假设每个参与人仅 选择一次行动或战略,并且参与人同时进行选择的决策模型,因此,从本质上来讲战略式博弈是一种静态模型,一般适用于描述不需要考虑博弈进程的完全信息静态博弈问题。 1、参与人集合 : 2、每位参与人非空的战略集 S i 3、每位参与人定义在战略组合 上的效用函数Ui(s1,s2,…,sn). 扩展式博弈:是博弈问题的一种规范性描述。 与战略式博弈侧重博弈结果的描述相 比,扩展式博弈更注重对参与人在博弈过程 {1,2,...,} n Γ=11 (,...,,...,) n i i n i s s s s ==∏

博弈论的书心得体会

博弈论的书心得体会 博弈论是一门深奥的学科,关于别同的人来说有别同的意义,你读完之后它对你有哪些意义吗?下面是查字典范文带来的博弈论书心得体味,欢迎查看。 读博弈论的书的心得体味范文篇一 近日整理书橱时,我偶然看到了在东北财经大学学习研究生课程时所学的《博弈论》这本书。当时我们很幸运,学院专门选了东北财经大学优秀教师史永东教授来说授这门课。史教授是当时东北财经大学最年轻的教授(时年35 岁,32 岁时就破格晋升为教授),他把一门很深的学咨询给我们说得惟妙惟肖,特别生动。直至今日随手翻阅时,仍能清晰地记起他说课时激情洋溢的风采,但现在重新阅读这本书却有了别同的感觉,当时是为了掌握其中的理论,如今则能够比较从容地去体味其中的道理了。 博弈论是一门很深的学咨询,要紧研究个体怎么在错综复杂的相互妨碍中得出最合理的策略,其应用的领域也特别广,最通常的应用该是经济学吧。这本书中的理论很深奥,其数学模型的推导更是复杂,但是书中的案例却既浅显又生动,很值得一看。如今拿出一具例子来,和大伙儿一起分析其中的道理、分享其中的趣味。 那个例子是智猪博弈的故事,说的是:猪圈里有两头猪,一头大猪,一头小猪。猪圈的一边有个踏板,每踩一下踏板,在远离踏板的猪圈的另一边的投食口就会降下少量的食物。假如有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边降下的食物。当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完降下的食物之前跑到食槽,争吃到另一半残羹。 那么,两只猪各会采取什么策略?答案是:小猪将挑选搭便车策略,也算是舒舒畅服地等在食槽边;而大猪则为一点残羹别知疲倦地奔忙于踏板和食槽之间。 原因何在?因为,小猪踩踏板将一无所获,别踩踏板反而能吃上食物。对小猪而言,不管大猪是否踩动踏板,别踩踏板总是好的挑选。反观大猪,已明知小猪是可不能去踩动踏板的,自己亲自去踩踏板总比别踩强吧,因此只好亲力亲为了。 小猪躺着大猪跑的现象是由于故事中的游戏规则所导致的。规则的核心指标是:每次降下的食物数量和踏板与投食口之间的距离。假如改变一下核心指标,猪圈里还会浮现同样的小猪躺着大猪跑的景象吗?试试看。 改变方案一:减量方案。投食仅原来的一半重量。结果是小猪大猪都别去踩踏板了。小猪去踩,大猪将会把食物吃完;大猪去踩,小猪将也会把食物吃完。谁去踩踏板,就意味着为对方贡献食物,因此谁也可不能有踩踏板的动力了。 改变方案二:增量方案。投食为原来的一倍重量。结果是小猪、大猪都会去踩踏板。谁想吃,谁就会去踩踏板。反正对方可不能一次把食物吃完。小猪和大猪相当于日子在物质相对丰富的共产主义社会,因此竞争意识却可不能很强。 改变方案三:减量加移位方案。投食仅原来的一半重量,但并且将投食口移到踏板附近。结果呢,小猪和大猪都在舍命地抢着踩踏板。等待者别得食,而多劳者多得。每次的收获刚好消费完。 那个故事给了竞争中的弱者(小猪)以等待为最佳策略的启示。但是关于社会而言,因为小猪未能参与竞争,小猪搭便车时的社会资源配置的并别是最佳状态。为使资源最有效配置,规则的设计者是别愿看见有人搭便车的,政府这样,公司的老总也是这样。而能否彻底杜绝搭便车现象,就要看游戏规则的核心指标设置是否合适了。 书中还有不少例子,并进行了分析,我们都能悟出些道理。因此读的时候会有一具感受,那算是先有事实,后由理论。也算是我们常说的理论来源于实践。感受就像是先有那个社会现象,然后才有那个理论去分析,那个理论套在那个社会现象上恰好合适。 读博弈论的书的心得体味范文篇二

博弈论(课一)

课程内容和时间安排 第一讲:概述(第一、二章) 第二讲:术语解读和基本假设(第三、四章) 第三讲:囚犯困境和破解之道(第五、六、七章)第四讲:万元陷阱和智猪博弈(第八、九章) 第五讲:懦夫博弈和性别战(第十、十一章)

博弈学 -----博览全局对弈棋局课一 博弈在中国的理解--略观围棋,法于用兵,怯者无功,贪者先亡。 西方国家的理解--Game fair play。 (中国人在博弈中关注的是获胜,西方人在博弈中关注的是怎么玩的开心。) 博弈可以在工作领域,可以在社交往来,可以在家庭相处,无处不在,博大精深。 知人者智,自知者明; 胜人者力,自胜者强; 小胜者术,大胜者德。

推荐书刊 1、蒋文华:《用博弈的思维看世界》,浙江大学出版社,2014年。 2、张维迎:《博弈论与信息经济学》,上海三联书店,上海人民出版社,1996年。 3、詹姆斯·米勒:《活学活用博弈论-如何利用博弈论在竞争中取胜》,中国财政经济出版社,2006年。 4、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《策略思维》,中国人民大学出版社,2002年。 5、阿维纳什·K ·迪克西特、巴里·J ·奈尔伯夫:《妙趣横生博弈论》,机械工业出版社,2009年。 博弈 指在一定的游戏规则约束下,基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动),以实现利益最大化的过程。 故事1,两人同行打猎,忽遇一猛狮。一人卸下身上物品狂奔,同伴不解,问道:“汝能胜狮?”答曰:“非需胜狮,只需胜汝!” (博弈既可以是竞争,也可以是合作! ) 游戏1,每位同学写1个介于1与100之间的自然数(整数,包括1与100在内),然后求出所有数字的平均数,如果你所写的数字最接近该平均数的二分之一,那么你将在游戏中胜出。(博弈,必须学会换位思考!)

博弈论经典案例分析

博弈论经典案例分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A 来说,囚徒B 有坦白和不坦白两种可能的选择,假设囚徒B 的选择是不坦白,则对囚徒A 来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B 选择的是坦白,则囚徒A 不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B 采取何种策略囚徒A 的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 1,1 8, 0 不坦白 0,8 5,5 坦白 嫌疑犯乙 不坦白 坦白 嫌疑犯甲 1,2 -1, -1 时装 0,0 2,1 足球 男 时装 足球 女

博弈论课程心得体会

《博弈论与信息经济学》课程心得体会 作为一名会计专业硕士,我选修这门课程是为了了解和学习一种思想方法,这种方法我很早就感兴趣,电影《美丽的心灵》中纳什的故事让博弈论在我心中显得非常神秘和高大上。第一堂课吕老师谈到博弈论已经成为一种主流方法时,学习的欲望变得更为强烈。经过九周的学习,尽管由于有些地方因为数学能力有限,不得尽懂,但我觉得自己起码已经揭开了这种方法的入门和核心的面纱。 我认为,会计专业硕士是为了培养立足于会计的高级管理人才而设置的,除了扎实的专业知识和理论功底,我觉得掌握思想方法是尤为重要的能力。面对会计行业的变革,作为一名研究生,财务管理能力和管理会计能力是我的核心竞争力。这两种能力需要缜密的思维,科学的方法。如果说缜密的思维更需要在学习和实践中不断历练,科学的方法就需要不断地去接触和了解,不断地去主动学习。博弈论就是一种科学的方法。我觉得博弈论是一种寻求均衡的科学,也是一种创造规则的科学。它让我了解面对不同利益相关者时怎么去寻求均衡、博弈,甚至创造有益的规则。同时,它让我有了一种更加科学、简洁的视角看待事物,非常实用有效而且简单漂亮。 博弈论的核心应该是纳什均衡,这是一个理性的策略组合,每个参与者在对方的选择一定情况下会做出纳什均衡策略组合中的策略。这种选择将是每个理性参与人最终的选择。这个道理很明了,也正是明了让这个理论非常有力。吕老师带着我们解决一个又一个案例中的问题时,我感觉到这种方法的神奇和独特。我印象里最深的是吕老师对法律的看法:法律让不可置信的承诺变成可置信的承诺,好的法律是看似严苛,但很少有人触犯它。以前在学习经济法时,我对“法律是一种合同”这种观点不是很在意,吕老师的说法让我有了新的认识。让不可置信承诺变成可置信的承诺,使得最有益的策略组合成为纳什均衡,在这一点上合同和法律的目的和性质是一样的。我还记得吕老师说《反国家分裂法》是一部非常好的法律,在以前我因为它几乎很少被使用而感觉不到这部法律的重量,但从博弈论的角度来看,这部法律使得针对台湾,宣布独立就会被制裁成为一种可置信的承诺,吕老师的解释让我非常赞同。我真的觉得自己看某些问题的视角发生了变化,更加地深刻和科学。 我觉得正是这种视角是我学习这门课程最大的收获。我知道,短短九周的学习远远不足以掌握博弈论,我甚至或许不能完整地计算出一道例题,但是我对它有了一个基本的认识,理解它的理论基础,最重要的在看一些问题时我可以尝试着用博弈论的角度去试试看。最可怕的不是不会用博弈论的技术和方法,可怕的是在能够使用它时我不知道以它的角度去看待问题,知道可以使用这门科学的技术和方法。经过这两个多月的课程,相信将来如果用的着这种方法时,我知道从哪里着手去学习。

生活中的博弈论感悟

生活中的博弈论感悟集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

《生活中的博弈论》学习感悟 第一讲初试博弈论 生活中的资源是有限和稀缺的,于是就产生了竞争,这种竞争就需要一种形式把大家聚在一起,这种形式就是博弈。博弈论是在力图在最简单的假设下得到最大范围的推广和应用,其伟大在于对后世的引导和激发作用。博弈论不仅从古代就散发着智慧,还体现在我们生活中的种种小事中,如双方互拨打电话,放弃球赛陪女友逛街等。博弈论是建立在博弈双方或者多方都属于理性人的基础上,通过对自己以及博弈对手状况的了解、博弈环境的要求及变化等诸多因素,博弈者做出对自己最有利最保险的决策和行动,从而使得自己能达到获利或者获胜的目的。每个人都可以成为博弈高手,但人的决策又具有有限理性,因此博弈论也不是万能的。 第二讲纳什均衡 在某一策略组合中,所有的参与者面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲,勿施于我。 第三讲囚徒困境 囚徒困境博弈反映个人最佳选择并非团体最佳选择。用囚徒困境博弈对两个势均力敌的竞争对手进行分析,可以发现合作是可以实现双赢的。如:两个公司互相竞争,二公司的广告互相影响,即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告,收入增加很少但成本增加。但若不提高广告质量,生意又会被对方夺走。此二公司可以有二选择:互相达成协议,减少广告的开支。(合作)增加

博弈论中的几个经典问题

几个博弈论中的经典问题 博弈论(Game Theory),亦名“对策论”、“赛局理论”,属应用数学的一个分支,博弈论已经成为经济学的标准分析工具之一。目前在生物学、经济学、国际关系、计算机科学、政治学、军事战略和其他很多学科都有广泛的应用。博弈论主要研究公式化了的激励结构间的相互作用。是研究具有斗争或竞争性质现象的数学理论和方法。也是运筹学的一个重要学科。博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。生物学家使用博弈理论来理解和预测进化论的某些结果。 几个重要的概念 1、策略(strategies):一局博弈中,每个局中人都有选择实际可行的完整的行动方案, 即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。 2、得失(payoffs):一局博弈结局时的结果称为得失。每个局中人在一局博弈结束时 的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付(payoff)函数。 3、次序(orders):各博弈方的决策有先后之分,且一个博弈方要作不止一次的决策 选择,就出现了次序问题;其他要素相同次序不同,博弈就不同。 4、博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。 在供求关系中,某一商品市场如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。 5、纳什均衡(Nash Equilibrium):在一策略组合中,所有的参与者面临这样一种情况, 当其他人不改变策略时,他此时的策略是最好的。也就是说,此时如果他改变策略他的支付将会降低。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中,当局中人A采取其最优策略a*,局中人B也采取其最优策略b*,如果局中人B仍采取b*,而局中人A却采取另一种策略a,那么局中人A 的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。 经典的博弈问题 1、“囚徒困境” “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯(A和B)作案后被警察抓住,隔离审讯;警方的政策是"坦白从宽,抗拒从严",如果两人都坦白则各判8年;如果一人坦白另一人不坦白,坦白的放出去,不坦白的判10年;如果都不坦白则因证据不足各判1年。 在这个例子里,博弈的参加者就是两个嫌疑犯A和B,他们每个人都有两个策略即坦白和不坦白,判刑的年数就是他们的支付。可能出现的四种情况:A和B均坦白或均不坦白、A坦白B不坦白或者B坦白A不坦白,是博弈的结果。A和B均坦白是这个博弈的纳什均衡。这是因为,假定A选择坦白的话,B最好是选择坦白,因为B坦白判8年而抵赖却要判十年;假定A选择抵赖的话,B最好还是选择坦白,因为B坦白判不被判刑而抵赖确要被判刑1年。即是说,不管A坦白或抵赖,B的最佳选择都是坦白。反过来,同样地,不管B是坦白还是抵赖,A的最佳选择也是坦白。结果,两个人都选择了坦白,各判刑8年。在(坦白、坦白)这个组合中,A和B都不能通过单方面的改变行动增加自己的收益,于是谁也没有动力游离这个组合,因此这个组合是纳什均衡。

博弈论中的相关概念

新古典经济学前提: 理性选择——减少不确定; ——经济系统效用最大化。 理性——新古典经济学与博弈论的纽带 博弈论决策前提:理性的战略选择。 博弈论决策基础:最优反应,即带来最大收益的战略。 但是,在博弈论中最优反应不是理性的唯一表现,也不总是假定人是理性的。 新古典经济学决策的背景: 理性的个体面临特定的制度环境(产权、货币、高度竞争的市场),在此基础上以获取利益最大化为目的。 隐含的基础:只需考虑自身情况和市场条件,而不考虑他人行为。 弊端: ——限制了理论的使用范围,现实中竞争并不完全; ——无法解决货币经济以外的决策难题。 博弈论的优势: ——不仅考虑自身条件和市场环境,最重要的是还需考虑他人的行为。 游戏规则: 两个选手,轮流取币; 每次至少取一枚硬币; 只能从一行中取任意数量的硬币,不许从两行中选取; 取走最后一枚硬币的为胜者 囚徒困境的启示: 囚徒困境仅仅是二人博弈,多人博弈在现实中更多; 如果囚犯可以交流,结果显著不同; 如果多轮博弈,结果也有不同; 导致困境结论的分析过程令人注目,但最后结论并非理性。 通常假设参与者将采取最优反应战略而理性行事,最大化利润、力争在游戏中获胜、达到主观收益最大化,或者惩罚最小化,皆属于理性行为。 最优反应战略是在其他参与者战略已知或可预测条件下,给某参与者带来最大化收益的战略。 博弈分析的关键步骤是找出在别人选择既定的情况下自己的最优反应战略。 依据新古典经济学,我们把一个参与者的最优反应(best response)定义为,在其他参与者已经选定战略,或者可以预计到他们将选择何种战略时,能够给该参与者带来的最大收益的战略。 标准式——数字矩阵; 扩展式——树形图 不确定事件(contingency): 相机战略(contingent strategy):仅在不确定事件发生时才会采取的战略 信息集(information set):节点2包含了决策者掌握的所有信息,因此也称为信息集。 扩展式的优势: ——展示了每一阶段掌握的信息; ——展示了参与者掌握信息的不完全 所有博弈问题均可用标准式描述,即绘制一个表格,边缘列出参与者的战略,里面列出参与者的收益;

(完整word版)博弈论给我的心得

博弈论给我的心里体会 潘慧明 201202034049 12金融数学 我是大学第二学期开始选修学习《博弈论》的,并且以前对它停留在表面意思。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在,在未学习这门课程之前我对身边发生的一些事情无法用一个专业的学说来概述,经过这个学期的学习后,我才知道我身边发生的很多事情都可以用这门课程概述。那么什么是“博弈论”?所谓的“博弈论”——就是研究决策主体的行为发生直接相互作用时的决策及这种决策的均衡问题。并且学习后我还有个感受就是:博弈论有两个比较enlightening的观点,一是more information can hurt you(掌握更多的信息可能是一件坏事),二是more options can hurt you(拥有更多的选择可能是一件坏事).虽然博弈论主要用于研究经济问题,但是我觉得这些原理在我们现实生活中同样是适用的。 而且经过这段时间的学习,我现在对《博弈论》有了些比较肤浅的认识。诚然,一门学问想在短时间内有所深入理解是不现实的。生活之中到处充满着博弈,有人说没有,那是因为缺少发现博弈现象的眼睛。因此在生活中我们要懂得学以致用,要会灵活的去使用这门学科。 人生就是在弈棋,学会博弈。虽说博弈不是万能的,但没有博弈现象存在的生活是万万不能的。 社会生活中,共赢是一种优良的博弈方式。双赢策略其实是一种很高的智慧,帮助别人的同时接受别人的帮助,双方最终将获得独自奋战所不能拥有的东西。放弃内心的宁予外贼不予家奴的思想。中国人对竞争的理解大多不是“你死”就是“我活”,胜利的含义似乎就是阻止别人成功,可是这“胜利”是那么虚假,经不起风吹雨打,经不起时间考验。拥抱双赢,拥抱明天。双赢强调的是博弈双方的利益都要兼顾,就是所谓的“赢者不全赢,输者不全输”。但是双方都得到了满意的结果。这些双赢的事例,在商务上经常可以看到的。如:商务上的谈判,完完全全的运用到了《博弈论》的知识与原理来分析问题,并且从而找到最佳的均衡点,也就是最好的解决方法。 在所有的对抗和较量中,其胜负成败常常取决于三个基本的因素:机会或者说运气、体能和智能。头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每

博弈论案例分析

(1)失火了,你往哪个门跑 失火了,你往哪个门跑——这就是博弈论 一天晚上,你参加一个派对,屋里有很多人,你玩得很开心。这时候,屋里突然失火,火势很大,无法扑灭。此时你想逃生。你的面前有两个门,左门和右门,你必须在它们之间选择。但问题是,其他人也要争抢这两个门出逃。如果你选择的门是很多人选择的,那么你将因人多拥挤、冲不出去而烧死;相反,如果你选择的是较少人选择的,那么你将逃生。这里我们不考虑道德因素,你将如何选择?这就是博弈论! 你的选择必须考虑其他人的选择,而其他人的选择也考虑你的选择。你的结果——博弈论称之为支付,不仅取决于你的行动选择——博弈论称之为策略选择,同时取决于他人的策略选择。你和这群人构成一个博弈(game)。 上述博弈是一个叫张翼成的中国人在1997年提出的一个博弈论模型,被称之为少数者博弈或少数派博弈(Minority Game)。当然,原来的博弈形式不是这么简单,这里我把它简化了,我们在第三部分论述归纳推理时还要谈这个博弈模型。现在很多学者在研究这个问题。 生活中博弈的案例很多,你会见到很多例子。只要涉及到人群的互动,就有博弈。 什么叫博弈?博弈的英文为game,我们一般将它翻译成“游戏”。而在西方,game的意义不同于汉语中的游戏。在英语中,game即是

人们遵循一定规则下的活动,进行活动的人的目的是使自己“赢”。奥林匹克运动会叫Olympic Games。在英文中,game有竞赛的意思,进行game的人是很认真的,不同于汉语中游戏的概念。在汉语中,游戏有儿戏的味道。因此将关于game的理论,即game theory翻译成博弈论或者对策论,是恰当的。本书下面统称game theory为博弈论。 博弈论的出现只有50多年的历史。博弈论的开创者为诺意曼与摩根斯坦,他们1944年出版了《博弈论与经济行为》。诺意曼是着名的数学家,他同时对计算机的发明作出了巨大贡献,他去世时博弈论还未对经济学产生广泛影响,否则经济学的诺贝尔奖肯定有他的名字,因为诺贝尔奖有规定,只颁发给在世的学者。谈到博弈论,不能忽略博弈论天才纳什(John Nash)。纳什的开创性论文《n人博弈的均衡点》(1950)、《非合作博弈》(1951)等等,给出了纳什均衡的概念和均衡存在定理。今天博弈论已发展成一个较完善的学科。 博弈论对于社会科学有着重要的意义,它正成为社会科学研究范式中的一种核心工具,以至于我们可称博弈论是“社会科学的数学”,或者说是关于社会的数学。从理论上讲,博弈论是研究理性的行动者(agents)相互作用的形式理论,而实际上它正深入到经济学、政治学、社会学等等,被各门社会科学所应用。甚至有学者声称要用博弈论重新改写经济学。1994年经济学诺贝尔奖颁发给三位博弈论专家:纳什、塞尔屯、哈桑尼(),而像1985年获得诺贝尔奖的公共选择学派的领导者布坎南,1995年获得诺贝尔奖的理性主义学派的领袖卢

博弈论心得体会

博弈论心得体会 最初选择博弈论,是因为看了《美丽心灵》电影后,因而对John Forbes Nash Jr和博弈论产生了浓厚的兴趣。当看到选修课新开了博弈论,简直激动的不能自已,迫不及待就报名参加了。而在我的进一步对《博弈论》的学习下,我懂得了这门课程在我们的生活中无处不在。 博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的目的。博弈论思想古已有之,中国古代的《孙子兵法》等著作就不仅是一部军事著作,而且算是最早的一部博弈论著作。博弈论最初主要研究象棋、桥牌、赌博中的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展。 博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。 在社会中,人与人之间的对抗和较量是一个不容回避的话题,只有直面这些问题,个人才更有可能获得成功的机会。在所有的对抗和较量中,其胜负成败常常取决于3个基本的因素:机会或者说运气、体能和智能。通过抛硬币来赌输赢是纯粹依赖于个人运气的游戏;百米赛跑的胜负基本上取决于个人的全身技能;而篮球赛、战争等对抗,虽然也会受到运气的影响,体能也很重要,但决定胜负的更重要的因素是头脑技能的较量。 头脑技能是一种策略技巧,或者说是在谋略方面的造诣。既然世间大多数对抗都与头脑技能有关,因此人们试图获得成功,就有必要研究在对抗局势中如何策略性地选择自己的行动。而今,博弈论就是一门专门研究互动局势下人们的策略行为的学问。事实上,每个人每天都在与他人打交道,或竞争或合作。身处这样高度互动的环境之中,无论一个人是否知道博弈论,实际上他都不断地在与他人进行博弈,无论是他的父母、亲人、兄弟、老师还是商场对手、政治敌人……一个人可能不知道博弈论为何物,但是他的确常常在与他人进行着对抗和较量,在进行着一场又一场博弈;而生存本能,也让人们在不知不觉中学会了不少技巧。难怪经济学家萨缪尔森这样说着:“要在现代社会做一个有文化的人,你必须对博弈有一个大致的了解。”不过,对于大多数的人来说,学习博弈论并不是一件轻松的事情。 因为正式的博弈理论往往是用数学语言表达出来的,而社会中的大多数人都有数学恐惧症,虽然对于少数人来说数学的形式是那么优美,但大多数人把博弈论的学习看做是一件艰难的而痛苦的事情。 如果我们能熟练地掌握这一部分博弈论知识,对我们的学习和工作都大有裨益。深感短短一个学期的时间,对于博弈论这一门独具魅力的课程,只是从皮毛上略有了解。尽管如此,我还是学会了一种以博弈的观点来思考、分析、判断、解决问题的方法。就好比囚徒博弈的现象,我以前可能能够猜到结果,但这只是知其然而不知其所以然罢了。然而现在可就不同了,相似的问题我都能够用所学的博弈论知识去解释,能够了解其本质了。 我学过一段时间博弈论,一些思维过程中也可能自觉不自觉地使用一些博弈论思想,当制订政策或游戏规则,要保证所有人有参与积极性。这来源于“纳什均衡”概念,说起来当然简单。但我自己觉得,以前所知道的这条道理——制订游戏规则要保证所有人有参与积极性——是简单接受,没有逻辑,或者,在直觉层次觉得这是对的,但没有认识到它为什么对。千万不能把别人当傻瓜,如果把别人当傻瓜,吃亏的是自己,就像那个卖猫的故事。

耶鲁大学博弈论_精简版

第一讲导论-五个入门结论 1.通过成绩博弈模型可以知道,不选择严格劣势策略,因为每次博弈会得到更好的收益。 2.通过囚徒的困境博弈模型可以知道,理性选择导致次优的结果(协商难以达成目的的原因不是因为缺少沟通,而是没有强制力)。 3.通过愤怒天使博弈模型可以知道,汝欲得之,必先知之;永远选择优势策略,选择非劣势策略,损失小,如果对手有优势策略则应以此作为选择策略的指导。 4.如果想要赢,就应该站在别人的立场去分析他们会怎么做。 第二讲学会换位思考 1.构成博弈要素包括,参与人,参与人的策略以及收益。 2.所谓严格优势策略,就是指不论对方采取什么策略,采取的这个策略总比采取其他任何策略都好的策略。 3.在博弈中剔出某些选择时需要站在别人的角度去思考结果,因为对手不会选择劣势策略;同时要考虑到对手也是一个理性的参与人。 4.在博弈中剔除某些选择是一种直接思考,同时也是作为一个理性参与人的选择。 第三讲迭代剔除和中位选民定理 1.在选民投票博弈模型中,通过不断地迭代以及剔除来决定策略,由此,我们得到了一种新的选择策略的方法:迭代剔除法。 2.选民投票博弈模型的结果与现实存在偏差,主要是因为:①现实中选民并不是均匀分布的;②选民通常根据候选人的性格而非政治立场来进行投票,而政治立场只是单一维度;③只适用于只有两个候选人的情况;④同时存在弃权票;⑤选民未必相信候选人所声明的立场。 3.建立模型,是为了更好的描述事实以激发灵感,模型是有重要的事是抽象而来,逐步增加约束条件完善模型观察结果,比较分析结果的变化。 第四节足球比赛与商业合作之最佳对策 1.点球博弈模型告诉我们,不要选择一个在任何情况或信念下都不是最佳对策的策略。 2.最佳对策:①参与人针对对手策略的定义:参与人i的策略s^i(简写成BR)是对手策略S-i的最佳对策,如果参与人i在对手的策略S-i下选S^i的收益弱优于其它对策Si`,这对参与人i的所有Si`都适用,则策略S^i是其它参与人策略S-i的最佳对策。S^i最大化了对手选S-i时我的收益;②最佳对策广义定义:参与人i的策略S^i是最佳策略(你对其他参与人可能采取的策略持信念P时的最佳策略),在参与人i仍持信念P的情况下选S^i 的获得预期收益比在同样的信念P下选其它的策略获得的预期收益都要高(对于所有可选的Si`均成立)即Eu(S^i,P)≥Eu(Si`,P) Si` in Si 我从Si选择可选策略时S^i而非S-i最大化了我的预期收益。 第五讲坏风气与银行挤兑 1.纳什均衡,即对任意一个此博弈内的参与者A,他所选择的策略是其他参与人所选策略的最佳策略。

博弈论经典案例与分析

博弈论的经典案例与分析 囚徒困境 案例:警察把甲乙分开关押,并在提审时分别告之,如果你坦白而他不坦白,那么你将只判0年,他将被判8年;如果你不坦白而他坦白,那么你判8年,他判0年;如果你们两人都坦白了,各判5年;如果你们两人都不坦白了,各判1年。 分析:每个博弈方选择自己的策略时,虽然无法知道另一方的实际选择,但他却不能忽视另一方的选择对他自己的得益的影响,因此他应该考虑到另一方有两种可能的选择,并分别考虑自己相应的最佳策略。对囚徒A来说,囚徒B有坦白和不坦白两种可能的选择,假设囚徒B的选择是不坦白,则对囚徒A来说,不坦白得益为-1,坦白得益为0,他应该选择坦白; 假设囚徒B选择的是坦白,则囚徒A不坦白得益为-8,坦白得益为-5,他还是该选择坦白。因此,在此博弈中,无论囚徒B采取何种策略囚徒A的选择只有一种,即坦白,因为在另一方两种可能的情况下,坦白给自己带来的得益都是较大的。同样的道理,囚徒B 的唯一的选择也是坦白。 所以最可能的结局:该博弈的最终结果是两博弈方同选择坦白策略。 其支付矩阵如下: 性格大战 嫌疑犯乙

案例:一对恋人准备在周末晚上一起出去,男的喜欢看足球,但女的喜欢看时装表演。当然两个人都不愿意分开活动。不同的选择给他们带给他们不同的满足。 分析:可以看出,分开将使他们两人得不到任何满足,只要在一起,不管是看时装表演还是看足球,两人都会得到一定的满足。但看足球将使男的得到更大的满足,看时装表演则使女的得到更大的满足。 在这样的一个对局中,男的和女的都没有占优战略。他们的最优侧率依赖于对方的选择,一旦对方选定了某一项活动,另一个人选择同样的活动就是最好的策略。因此,如果男的已经买好了足球的门票,女的当然就不再反对;反之,如果女的已经买好了时装表演票,男的也就会与她一起看时装表演。 价格战 案例:假设市场中仅有A 、B 两家企业,每家企业可采取的定价策略都是10元或15元,我们可以得出得益矩阵如下: 分析:无论对企业A 还是企业B 来说,低价都是他们的占优战略。从表可见,企业A 的占优战略是10元,因为无论B 采取什么战略,企业A 都能获取比定价15元更多的利润。 如果企业B 定价10元,企业A 定价10元能够获利80万元,而定价15元只能获得30万元;如果企业B 定价15元,企业A 定价10元可获利170万元,而定价15元却只能获利120万元。同样地,企业B 的占优战略也是定价10元的策略。 企业B 男

学习生活中的博弈论的体会

学习生活中的博弈论的体会 首先说自己当初选择“生活中的博弈论”这门课程的原因吧。自己本来就对这些心理学方面的知识就感兴趣,课余的时间也读过一点心理学的书籍,再者就是,上一次选修了杨老师的“青年心理学”,感觉受益匪浅,所以仍想在博弈论的课堂上再次感受杨老师的生活中的智慧。 博弈无时不在,无处不在,日常生活中的一切,均可从博弈得到解释,大到美日贸易战,小到今天早上你突然生病。我们首先就会问,什么是博弈论?其实就是研究个体如何在错综复杂的相互影响中得出最合理的策略。生活中每个人,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,人人争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们“出棋”着数中理性化、逻辑化的部分,并将其系统化为一门科学。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、扑克等。数学家们将具体的问题抽象化,通过建立完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若假设双方都精确地记得自己和对手的每一步棋且都是最“理性”的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法。 学习了这门课程之后,我才深深的感觉。在生活中当中,我们更多的人在面对生活中的一些问题的时候,都太不理性,处理的方法也都不够“聪明”。我们都太自以为是了,很少会认真去考虑一下对方是有怎么样的想法。也就是说,我们都坚信的认为自己是正确的,而总是认为对方的智商不够,而这,恰恰就是我们愚蠢的所在。所以,想到以前自己会去咒骂一些人的决策,甚至是决策人者的决策,而深感羞愧。 在博弈的双方都十分理性的前提下,如何实现自己的利益最大化。这看似一个简单的问题,却蕴含了深刻的道理。在生活中,我们很多人做事的时候并没有真正的实现自己的利益最大化,反而是做了很多损人不利己的事,甚至是还会去做损人损及的事。所以从学过这门课程之后,我就开始思考,到底是什么原因会让我们明明自己获得不到利益的情况下,还要去损害他人的利益?除了博弈论中所说不理性还有什么原因呢?在此,我觉得是否和我们个人的自私心理有关。我们不仅仅是自私,还会嫉妒比自己获得利益大的人,这是不是也就是一种心胸狭隘。 所以学过这门课之后,我们不只是要面对问题时更加理性,处理问题时考虑到对方也是足够的聪明之外,也要培养一种宽广的胸怀,要时刻谨记,自己的决策一定要实现自己利益的最大化。 得与失是我们日常生活中每天都要面对的博弈,什么事该做,什么事不该做,什么利益必须争取,什么利益敬而远之,这些都需要我们深思熟虑后做出正确的选择。人生就是在得失之间走过的,金钱、荣誉、权势、爱情,我们得到后欣喜若狂,但失去后又愁眉不展。其实,不以得喜,不以失悲,坦然地面对得失才是处世的最高境界,就像佛教中的这首禅偈一样:“富贵贫穷各有由,夙缘分时莫强求。未曾下得春时种,坐守荒田望有秋。”事物的得失都存在一定的因果联系,有付出才会有回报,如果有时尽力了也没有得到想要的结果,你可能会深感上天的不公,但反过来想想,其实你更应该坦然地面对,因为尽力去做的你已经无怨无悔,得不到不是因为你没有去珍惜和努力,而是因为对方本不属于你,所以在人生中我们有时更要学会放弃,学会忘记。

相关文档