当前位置：文档库 › 利用审计师_囚徒困境_阻止合谋的博弈分析

利用审计师_囚徒困境_阻止合谋的博弈分析

经济科学·2009年第4期

利用审计师“囚徒困境”阻止合谋

的博弈分析?

刘锦芳

（中南大学商学院湖南长沙 410083）

摘要：本文提出一种新的阻止合谋的策略，即同时派出两个审计师审计，让他们陷入“囚徒困境”，以保证其提交的审计报告真实，却发现这一策略由于

成本过高而无法实行。所以笔者分析能否以一定概率派出第二个审计师—这一低

ξ∈的概率派出第二个审计师、成本方式，来阻止审计合谋。研究表明：以(0,1)

强化刚性法律的“硬约束”和完善审计师的激励机制，可以阻止审计合谋。同时

还得出，审计师的道德约束、风险厌恶有助于防止审计合谋，国有企业监管者在

阻止审计合谋中，可以发挥同企业真实所有者一样的作用。这为国资局对国有企

业实行审计公开招标和抽查复审提供了理论支持。

关键词：审计合谋囚徒困境贝叶斯均衡博弈道德约束

一、引言

谁来监督审计者，这个问题一直困扰着机制设计者。对审计师疏于监管会使其利用自己的职权向被审计人寻租合谋。无论是我国的琼民源、红光、郑百文、银广厦等案件，还是美国的安然、世界通信、施乐、阳光等财务报告舞弊案，无不牵涉到注册会计师的审计合谋问题，而美国发生“次贷危机”的一个重要原因就是未能阻止审计合谋。审计师没有遵守职业操守，未能揭露问题公司在次级债链条中明显存在的重大风险，其有合谋之嫌，此次经济危机足以彰显防范合谋的重要性。学者们对于如何制约监督审计师、防范合谋，进行了广泛的探讨。李洁，刘桂良（2007）提出加强对审计师的“有效惩罚”是激励其拒绝合谋、恪尽职守出具审计报告的制约因素，并认为以注册会计师的私人财富为抵押，是实现有效惩罚强有力的物质保障机制。王善平，赵国宇（2008）通过建立委托代理模型，分析得出奖励审计师不能有效防范审计合谋，但惩罚能有效防范合谋。管亚梅（2009）则提出建立安全保障系数制度来应对审计合谋，由中注协对会计师事务所进行安全保障系数评级，符合规定安全系数的事务所才有资格承接审计业务。而且上市公司将审计费用交给中注协，由中注协在核实事务所的审计业务无舞弊之后，再将审计费用支付给事务所。朱锦余和雷光勇（2001）从深层制度层面分析认为，审计合谋的原因有行政介入审计事务、

?本文为国家自然科学基金项目（项目批准号：70772039）、教育部人文社会科学2006年度规划项目（项目批准号：06JA790114）、中南大学2008年人文社会科学重点资助项目和研究生学位论文创新基金项目（编号：2009bsxt026）的阶段性成果。

公司法人治理结构不合理、缺乏审计质量监管、相关法规罚则操作难度大等。并据以提出对策：巩固“脱钩改制”成果，大力发展合伙制事务所；建立合理的公司法人治理结构；严格质量监管等，许多学者与他们持相似观点（叶炜，2006；龚启辉和刘桂良，2006；叶雪梅，2001；翁建英和章永奎，2009）。Dittmann（1999）分析了委托代理模型中的审计合谋问题，他认为审计成本决定着审计结果的可靠程度，想要得到更准确的审计结果，就要花费更多的成本，即给审计师支付更高的报酬。所以不同可靠程度的审计师和对代理人不同的惩罚力度可以构成多个不同组合，他分析了不同组合下代理人的合谋行为，并给出了委托人不同情况下的最优策略。

让人耳目一新的是，Kofman和Lawarree（1996）通过引入第二个审计师，使两个审计师间形成“囚徒困境”，以防范合谋，从而为解决审计合谋问题提供了新的思路，朱业明等对此问题也做了分析研究（余玉苗和朱业明，2007；赵新刚等，2003）。沿着这一思路，考虑到现实世界中，审计师作为社会人，并不单纯只追求经济利益，他有自己的职业操守和风险偏好，冒风险去同被审计者合谋，对他来说，会由于良心自责和担惊受怕而遭受效用损失（Cushing，1999；Coate，1999）。所以在考虑审计师是否会与被审计者合谋时，笔者将加入这一因素。同时考虑到我国国情，国有企业控制着国家的经济命脉，根据2003年6月16日沪深股市收盘数据，国有股比重超过50%的上市公司占总数的48%，国有股比重超过25%更是高达81%，这意味着我国上市公司大部分为国家控股。国家控股意味着公司的大股东是国家，而在我国代表国家行使大股东权力的是国资局。对国资局的负责人来说，监管企业、防范合谋，其利益除了收缴被企业经理舞弊私吞了的信息租金之外，一个重要的利益是通过查处合谋而获得良好的政绩，从而有助于其升迁。基于以上的分析，下面对分析模型进行描述。

二、模型描述

（一）博弈顺序

本文的委托代理模型包括三层：委托人—审计师—经营者。委托人拥有企业，①但缺乏运作它所需的技能和时间，因此他们雇佣经营者（代理人）来管理企业。委托人也缺乏审查监督经营者的知识，于是他雇佣审计师对企业进行审计，为简化分析，在此假定审计无需花费审计师成本（这避免考虑审计师偷懒这一道德风险问题）。付给审计师的报酬为w。所有参与者均为风险中性。②

经营者运营企业利润高低取决于委托人无法观测到的因素，如企业的先进文化、市场垄断地位、容易获得的廉价劳动力等。经营者能清楚地察觉到这些，形成他的私有信息，正是这些因素决定着企业生产率的高低。笔者假定经营者仅有两种类型，高生产率和低生产率。在没有监督的情况下，高生产率的经营者将获得信息租金π，仅向委托人上缴低生产率时的产出。为了防止高生产率的经营者私吞信息租金，委托人以审计成本w雇佣一个自利的审计师，审计师会无误地发现经营者的私有信息，并获得可核实的证据。但如果他与经理合谋，他会向委托人提交虚假的审计报告，经营者会与审计师分享他的信息租金π

①国有企业的监管者（国资局负责人）拥有政府赋予的权力监管企业，他们就是委托人，因为没有企业

的所有权，他们相应的对企业的剩余没有索取权，但是他们仍然有动力去查处审计合谋，因为这样有利于他们政绩的提升。

②这里为了分析审计师在监督下对合谋风险的权衡，假定他有风险偏好。

97 （给予审计师贿赂B ）来让审计师报告委托人错误信息。

为了防止合谋，委托人将给审计师奖励R ，以激励其披露真实情况。为了抵御经营者给予审计师的贿赂的诱惑，委托人可能付出高达π的奖励给审计师，这就是“赏金猎手”

方案，此时审计师可以获取经营者的全部租金π（详见Kofman 和Lawarree ，1993）

。另一项防止合谋的策略就是以成本w 雇佣第二个审计师，这样，一旦两个审计师出具的审计报告不一致时，就可以发现其中有审计师作弊。而说真话的审计师能出具有力的证据证明自己的清白。此时委托人可以对说谎的审计师予以P 的惩罚。这样委托人不但可以获得经营者隐瞒的信息租金，还可以从舞弊的审计师那里得到罚金。对国有企业的上级主管部门领导（国资局的相关负责人）而言，查处合谋可以为其升迁提供好的政绩。①毫无疑问，委托人雇佣两个审计师的理性约束为2w π<。

假定审计师在合谋时，会承受自己职业操守的道德谴责和因冒险而担惊受怕受折磨，其效用损失为l 。假定对合谋的审计师的惩罚最大不得超过P ,P 是法律上规定的对合谋行为允许的最大惩罚，本文中要分析最低的足以阻止合谋的P 是多少。

假定2R l π+≤，

因为一旦2R l π+>，经营者和审计师就可能合谋来分享R 超出2l π?的盈余。②假设不奖励第一个揭露存在信息租金的审计师。

总结上面的分析，博弈顺序为：

1．自然决定经营者的类型，高生产率的经营者获得信息租金0π>，低生产率的经营者没有租金。

2．委托人派出两个审计师时，在经营者是高生产率时，两审计师得益矩阵将为：

高生产率报告低生产率报告高生产率报告

0，0 R ，P l ?? 低生产率报告 P l ??，R 0，0

3．两审计师观察经营者类型。

4．经营者向审计师们行贿。

5．两审计师各自提供自己的审计报告。

6．委托人检查审计报告并据以实行奖惩，各方得益实现。

（二）“囚徒困境”分析

当委托人同时派出两个审计师时，如果/2P π>，他能使两个审计师处于“囚徒困境”中，每个审计师都能在真实披露与虚假披露中做出选择，他们的得益矩阵为：

① 对于国有企业的监管者来说，查处合谋收缴的π，他们可以按一定比例k 分享，而对其政绩的贡献，用m 表示，所以对监管者而言其查处合谋的收益为k m π+。

②

委托人至多会付不超过π的奖励给审计师，因为作为理性人，他不会付出超过自己所能得到的收益，而且委托人注意到可以利用审计师在合谋情况下承受心理压力这一点（审计师内心深处会偏向于不合谋，因为他可能蒙受的损失l ），委托人清楚自己需要支付R 可以不用超过2l π?（在可能派出两个审计师时），这样可以最大化自己的收益。下面，我们来分析此时国有企业监管者的权衡过程，他在查处合谋时可以得到k m π+的收益，他也不会随意的去提高R ，以诱使审计师揭发经营者的舞弊行为（现实中高额的奖励也很少见）。因为一旦R π>时，审计师可能与经营者合谋以分享R 超过π的部分，尤其是在R 很大时，所以对于国有企业的监管者，他开出的奖励也是2R l π≤?。

98 审计师2

真实报告虚假报告真实报告

0，0 R ，B P l ?? 审计师1 虚假报告 B P l ??，R B l ?，B l ?

为确保（真实报告，真实报告）是博弈的纳什均衡，需要P B l ≥?。因为显然/2B π≤，而P 可以比/2π大（/2P π≥并且P P ≤），所以这一条件可以满足。

为保证（虚假报告，虚假报告）不是博弈的纳什均衡，需要R B l >?。/2,/2B R ππ≤>可以实现这一保证。

因此，只要,P B l R B l ≥?>?，委托人总可以得到真实报告。这个机制显得十分有力，然而现实中，利用“囚徒困境”，同时雇佣两个审计师进行审计的却很少，这是为什么呢？同时雇佣两个审计师的成本过高是主要原因。那么能否以一定的概率γ雇佣第二个审计师，来阻止审计合谋呢？这是本文下面将要分析的问题。直觉告诉我们，如果P 增大，那么γ能相应的减少，这样就可以降低雇佣审计师的成本。那么如何使P 大到足以使合谋不发生呢？我们可以通过对合谋的审计师追究其法律责任，使其受牢狱之灾，这样他所遭受的损失要远远大于其有上限的经济损失，这样他就不敢从事审计合谋了。① 三、贝叶斯均衡博弈分析

现在让我们回到两个潜在的审计师这个问题上来，注意到委托人对先派出谁无所谓，因此笔者定义派出每个审计师的概率是1/2。假定委托人不告诉审计师他是第一个还是第二个被派出的。设ξ为告诉第二个被派出的审计师他的位置的概率。在此，假定0ξ=。

现在我们有必要重新回顾一下博弈过程。

假定自然已经决定了经营者的类型，且他能赚取正的租金（0π>）。经营者的类型是他的私有信息。（如果自然决定经营者的0π=，博弈顺序也是一样的，只是不会有行贿发生）

（1）委托人随机派出第一个审计师，如果0π>，该审计师能观察到经理的租金。（2）经营者向第一个审计师行贿1B 。

（3）（a ）如果审计师拒绝贿赂，他报告租金π为正。经营者的租金将被没收。（b ）如果审计师接受贿赂，他收到1B 并且报告0π=。

（4）委托人以概率γ派出第二个审计师，这是共同知识。

（5）经营者向第二个审计师行贿2B 。

（6）（a ）如果第二个审计师接受贿赂，他报告0π=。两个审计师保留各自的受贿，经营者得到租金π。博弈结束。（b ）如果第二个审计师拒绝贿赂，他报告0π>，得到奖励R 。第一个审计师保留他的受贿但被惩罚P 。经营者给第一个审计师付出了贿赂但无法得到π。委托人没收π，支付第二个审计师奖励。博弈结束。

下面用完全贝叶斯均衡来分析这一博弈(Fudenberg 和Tirole ，1991)。博弈中，每个居中人的策略选择一定是他们相对于其他居中人策略选择的最优反应，他们的事后信念也来自于他们运用贝叶斯法则对自己事先信念的修正。所以，经理一定会思考贿赂的数额

① 目前许多会计师事务所是有限责任合伙制的，这样它在审计失败后，面临的最大惩罚是其有限的公司注册资本，为了利用这一漏洞，国际四大事务所在中国注册的公司注册资本仅达250万，这样他舞弊被查处时，赔偿的上限为其注册资本。

99 （10B ≥和20B ≥）而审计师一定会考虑是否接受贿赂。博弈条件依赖于审计师的策略，这一策略可以用参数,,,R P γξ来表示。而且要满足条件：,01,,01R P P πγξ≤≤≤≤≤≤。

在审计师面临是否拒绝贿赂的抉择时，对他而言至关重要的是知道他是第一个还是第二个审计师。例如，假设他知道第一个审计师已经接受了贿赂。在这种情况下，他只需简单的比较经营者给他的贿赂和他通过揭发第一个审计师所可能得到的奖励何者更多。然而如果他知道自己是第一个审计师，他的行为将取决于他对第二个审计师是否接受贿赂的信念判断。

被作为第一个审计师的概率为1/2。当第一个审计师报告0π=时，委托人派出第二个审计师的概率为γ。设β为第一个审计师合谋的可能性。那么派出第二个审计师的概率为(1/2)βγ，派出审计师的概率为(1/2)(1)βγ+。

假设审计师可以无误的发现错弊，即一旦审计师被派去审计，他就可以清楚地查出经营者的类型。

根据贝叶斯法则，审计师的事后信念为：被派出为第一个审计师的概率是(1/2)/[(1)/2]1/(1)βγβγ+=+，被派出为第二个审计师的概率为/(1)βγβγ+。

假设0β=（没有审计师会接受贿赂），那么当审计师被派出时，他知道自己不可能是第二个审计师，因为审计师一旦被派出，就会拒绝贿赂并揭发合谋意图。

为了找出博弈的均衡，我们现在需要计算审计师拒绝或接受合谋时的期望成本。审计师拒绝贿赂时的期望成本ECr(Expected Cost(Refuse))为

(1)(2)()1L L L R ECr P C P C R C βγβγ

=+?=?+ （1）其含义为：若为第一个审计师，则其审计成本为L C ，而如为第二个，除L C 外，还可能因揭露第一个审计师与经营者合谋得到奖励R ，进而降低其实际成本。

该审计师接受贿赂时的期望成本ECa[Expected Cost(accept)]为

111212(1){(1)[(1)()]}(2)()

(1)11L L L ECa P C l B B P B P C l B B B P C l γγβββγγββγβγ=+??+?+??++?+?=+?+++ （2）

其含义为，当该审计师为第一个且接受贿赂时：（1）如果第二个审计师拒绝贿赂（概

率为1β?）

，则第一个审计师将受到惩罚P ；（2）如果第二个审计师接受贿赂（概率为β），则第一个审计师得到贿赂1B 。而当该审计师为第二个且接受贿赂时，其实际审计成本可因

贿赂减少2B 。γ为派出第二个审计师的概率，在两种情况下第一个审计师都会损失l 。当ECa ECr >时，理性的审计师会选择拒绝贿赂，由式（1）、式（2）整理可得

12()(1)(1)R B B P l βγβγγββγ>+???+ （3）

现在，我们把注意力限定在只考虑0β=或1的纯策略，以及纯策略下的两种均衡：当12B B =时，两者得到的贿赂相同，形成混同均衡（a pooling equilibrium ）；当12B B ≠时，形成分离均衡(a separating equilibrium)。

（一）混同均衡分析12()B B =

当两个审计师都认为对方不会接受贿赂，即两个审计师都认为0β=时，第一种混同均衡会出现。由式（3）可知

B P l γγ<+ （4）

这表明，当贿赂额一定时，派出第二个审计师的概率γ越大，审计师的道德水平越高，阻止合谋所需的惩罚力度越小。从另一方面可以看出，当惩罚十分严厉时，需要派出第二个审计师的概率可以很小，近似于零。

100 当两个审计师都预期对方会接受贿赂时（1β=），会出现另一种均衡，由式（3）有

(2)1R l B γγ

+<+ （5）即对每一个审计师而言，他愿接受的贿赂额至少为min (2)1R l B γγ

+=+。为了更好地理解这一公式背后的含义，我们来考虑1γ=的情况（当第一个审计师向委托人报告经理不存在舞弊时，委托人总是派出第二个审计师）。这种情况下，审计师接受合谋的最小贿赂为(2)/2B R l =+。

可以看出最低贿赂额是容易被满足的，而且对于审计师而言，1β=时是一种更好的状态，因为w w B <+。那么委托人能找到一种可行的策略来阻止合谋混同均衡的发生吗？

我们可以从下面的命题得出结论。

命题1 当委托人没有告诉审计师其顺序(0)ξ=时，合谋混同均衡会出现。

证明假定合谋混同均衡能被阻止，且12B B B ==。经营者的激励约束为B B γπ+≤，即有1B πγ≤+，其愿支付的最大贿赂为max 1B π

=+。而对每一个审计师而言，他愿接受的最低贿赂为min B 。当max min B B <时可以阻止合谋混同均衡发生。此时

(2)11R l γπγγ

+>++ 即有/(2)1R l πγ+<≤，这与前面假定2R l π+≤，即/(2)1R l π+≥矛盾。故0ξ=时合谋混同均衡会出现。

（二）分离均衡分析12()B B ≠

命题2 委托人告知审计师先后顺序(1)ξ=时，合谋分离均衡会形成．

证明如果经营者提供的贿赂2B 大于对审计师的奖励R ，并足以补偿他的风险成本和

道德谴责时，则理性的第二个审计师2A 会选择与经营者合谋；

此时，如果12,B l B R l ≥≥+，则在博弈中第一个审计师的最优策略也将与经营者合谋。经营者的激励约束是，如果12B B γπ+≤时，他才会去贿赂第一个审计师，如果21B B π≤?，才会去贿赂第二个审计师，

而且是否贿赂第二个审计师决定着合谋成功与否。为了阻止合谋，需要R π>，而根据已知条件，委托人不会支付如此高的奖励，所以此时合谋分离均衡会形成。

命题1，2给出无论惩罚有多大，委托人都无法防止合谋的发生。原因在于合谋均衡产生时，审计师根本不用担心惩罚，因为他们根本就不会被抓住。而且可以看出0ξ=和1ξ=时，都无法阻止合谋的发生，那么如果我们让委托人能选择告知第二个审计师其先后顺序的概率(0,1)ξ∈，即引入信息不对称，能阻止审计合谋吗？下面的给出的解决方法将回答这一问题。四、解决方法

命题3 通过选择告知第二个审计师其先后顺序的概率(0,1)ξ∈，委托人能阻止

合谋均衡：1)当1(1)R l πξγ>?+?时能阻止合谋分离均衡；2)当max{,1R πγ

>+ ()[1(1)]},(1)P l ππξγγξγξ?+?+??()[1(1)](1)max{,}B l B l R P γξξγγξξ

??+??>?时可以阻止合谋

101 混同均衡。

证明 1 合谋分离均衡下，审计师理性约束条件为12,B l B R l ≥≥+；经营者的激励约

束为：

1）经营者没有激励告知第一个审计师其顺序为第二个，这要求1222B B B B γγ+≤+式子右边为经营者告知第一个审计师其顺序是第二个时的期望贿赂总额，因为此时向第一个审计师支付的贿赂也将为2B ；由此有21B B ≥；

2）经营者没有激励告诉第二个审计师其顺序为第一个，这要求1211(1)B B B B ξξπ+≤+?+式子左边为委托人选派第一个与第二个审计师时经营者的贿赂

支出总额；右边为如果经营者告知第二个审计师其位置是第一个时的贿赂期望支出，其中ξπ表示委托人告知第二个审计师顺序时（概率为ξ），第二个审计师因贿赂额小于R l +不与经营者合谋，而经营者因此失去信息租金()π。

此时有21(1)B B ξξπ≤?+，因2B R l ≥+，得11R l B ξπξ

+?≥?。又2(),B R l γγ≥+ 12B B πγ≥+。最终有1(1)R l π

ξγ≤?+?，故当1(1)R l π

ξγ>?+?时合谋分离均衡能被阻止。

证明2 在混同均衡下，12B B =。

1．当12B B R ==时，经营者的激励约束为12B B γπ+≤，即有1R πγ≤

+，故当1R πγ

>+时可以阻止合谋混同均衡发生； 2．当12B B B R ==<时，()[1(1)](1)

P l R ππξγγξγξ?+?+?>?，max{,B l P γ?> ()[1(1)]

(1)}B l R γξξγξξ

?+???可以阻止合谋混同均衡发生，证明过程见附录。故当()[1(1)]max{,},1(1)P l R πππξγγξγ

γξ?+?+?>+? ()[1(1)](1)max{,}B l B l R P γξξγγξξ

??+??>?时可以阻止合谋混同均衡。显然，通过引入(0,1)ξ∈，即使在2R l π≤?的约束下，只要P 足够大①，我们就可以阻止合谋。五、结论与建议

本文剖析了审计合谋的成因，在博弈均衡框架中探讨了引入“第二个审计师”来阻止审计合谋的机理，得到以下结论与建议：

1．将博弈模型从单期扩展到多期来看，在适当的惩罚与激励机制作用下，两审计师将更好地相互监督，最终均将选择不与经营者合谋，从而削弱其合谋偏好。而且，此时可以将第二个审计师看作第一个审计师的“影子”，在审计师保持不与经营者合谋的“惯性”时，将“派出第二个审计师”审计无形中回归到一个审计师审计的路线上来，既降低对审计师的社会监督成本，又降低委托人的审计成本；

① P 要达到足够大，需要强化刚性法律法规的“硬约束”，即对合谋者实施严厉的法律制裁。

102 2．在目前环境下，阻止审计合谋需要强化对审计师的监督力度与广度，强化刚性法律法规的“硬约束”，以及完善对审计师的激励机制。

3．审计师的风险成本和道德偏好可以使审计合谋的惩罚额降低，使经营者贿赂成本提高的同时，可以减少所需的奖励力度R 。

4．国有企业监管者在扮演委托人这一角色时，其利益驱动机理虽与企业真实所有者不同，但效果一致。在收益与罚没收入挂钩、政绩考核与合谋查处挂钩的激励下，他能行使同企业所有者一致的委托监管职能。所以，应该继续完善和实施当前国有企业的财务审计统一招标制度，这能较好的解决审计的委托代理问题，同时作为审计的招标方—国资局，应实行抽查复审制度，让经营者和审计师清楚，既使对于已审计的没有问题的企业，国资局仍有可能聘请另一家事务所再次审计，这样可以有效阻止审计合谋。

附录：对命题3中(2)的证明

把“审计师被告知其先后顺序”称为事件S ，“没被告知”称为事件NS 。如前所述，

被选派的审计师顺序为1A （第一个审计师）的概率为1(1)1P βγ

=+，顺序为2A （第二个审计师）的概率为(2)1P βγβγ

=+。1(|)P A NS 和2(|)P A NS 分别表示审计师为1A 与2A 未被告知其派出先后顺序时的条件概率，利用贝叶斯法则可计算得

1121()(1)1(|)()(1)(2)(1)1(1)(1)(|)1(|)1(1)

P A NS P P A NS P NS P P P A NS P A NS ξβγξβγξβγξ×===+?+??=?=+? 当审计师拒绝贿赂时，其期望审计成本为

12(1)(|)(|)()1(1)

L L L R ECr P A NS C P A NS C R C βγξβγξ?=+?=?+? （6）当审计师接受贿赂时其期望审计成本为

12(|){(1)(1)[(1)()]()}(|)()L L ECa P A NS C l B B P B P B P A NS C l B γγξββγξ=+??+??+??+

?++? （7）

上式在式(2)基础上进一步考虑了委托人是否告知审计师先后顺序的情况，与式(2)含义相同。由于12B B B R ==<，审计师2A 将不会和经营者合谋。将1(|)P A NS 和2(|)P A NS 代入上式后，计算可得

[1(1)]1(1)

L P ECa C l B γβξγβξ??=+?++? （8）未被告知顺序的审计师不与经营者合谋(0)β=，要求00||ECa ECr ββ==≥，得B l P γ?>

；未

被告知顺序的审计师与经营者合谋(1)β=，要求11||ECa ECr ββ==≤，可得 (1)()[1(1)]R B l P γξγξγξ?≤?+?? （9）

整理可得 ()[1(1)](1)B l R P γξξγξξ

?+??≤? 所以，为防止未告知顺序的审计师与经营者合谋，需要()[1(1)](1)B l R P γξξγξξ

?+??>?，

103 故当()[1(1)](1)max{,}B l B l R P γξξγγξξ

??+??>?时，审计师与经营者合谋能被阻止。由式（9）也可知，审计师与经营者合谋时所愿接受最小贿赂额

min (1)1(1)

R P B l γξγξγξ?+=++? 审计师2A 被告知其顺序(概率为γξ)时，由条件2B R l <+可知，他将选择不与经营者合谋，1A 可能会面临惩罚P ，经营者可能会失去信息租金，经营者新的个人理性约束为

[1(1)](1)B γξπγξ+?≤?

由此可知经营者愿意支付的最大贿赂额为 max (1)1(1)

B πγξγξ?=+? 阻止未被告知其顺序的审计师与经营者合谋的条件为max min B B <，代入max B 与min B 整理得

()[1(1)](1)

P l R ππξγγξγξ?+?+?>? 参考文献：

1. 龚启辉、刘桂良：《审计合谋的治理：来自审计收费模型的风险博弈分析》[J]，《审计研究》2006年第4期。

2. 管亚梅：《上市公司独立审计合谋形成原因及过程审视与应对模式》[J]，《现代财经》2009年第1期。

3. 李洁、刘桂良：《审计合谋治理：来自有效惩罚及其注册会计师私人财富抵押的分析》[J]，《审计研究》 2007年第1期。

4. 雷光勇：《审计合谋与财务报告舞弊：共生与治理》[J]，《管理世界》2004年第2期。

5. 翁建英：《章永奎.审计合谋问题研究》[J]，《当代财经》2009年第3期。

6. 王善平、赵国宇：《防范审计合谋之奖惩措施的有效性》[J]，《系统工程》2008年第1期。

7. 叶炜：《审计合谋的成因分析与对策治理》[J]，《经济体制改革》2006年第2期。

8. 叶雪梅：《上市公司审计合谋及治理对策》[J]，《财经论丛》2001年第3期。

9. 余玉苗、田娟、朱业明：《审计合谋的一个博弈均衡分析框架》[J]，《管理科学学报》2007年第4期。

10. 朱锦余、雷光勇：《审计合谋的制度分析及对策》[J]，《中南财经大学学报》2001年第3期。

11. 赵新刚、关忠良、宋学安：《上市公司阻止审计合谋的博弈分析》[J]，《数量经济技术经济研究》2003年第2期。

12. Cushing, Barry E, Economic Analysis of Accountants’ Ethical Standards: The Case of Audit Opinion Shopping[J]. Journal of Accounting and Public Policy, 1999, 18:339-363.

13. Coate, Charles J.. Discussion of “Economic Analysis of Accountants’ Ethical Standards: the Case of Audit Opinion Shopping”[J]. Journal of Accounting and Public Policy, 1999, 18: 365-373.

14. Dittmann, Ingolf. How Reliable Should Auditors Be?: Optimal Monitoring in Principal-agent Relationships[J]. European Journal of Political Economy, 1999, 15:523-546.

15. Fudenberg, D. and J. Tirole.1991. Perfect Bayesian Equilibrium and Sequential Equilibrium[J]. Journal of Economic Theroy 53, 236-260.

16. Kofman F, Lawarree J. Collusion in Hierarchical Agency[J]. Econometrica, 1993, 15(6): 629-656.

17. Kofman F, Lawarree J. A Prisoner’ Dilemma Model of Collusion Deterrence[J]. Journal of Public

Economics, 1996, 59(2):117-136

（L ）

浅析博弈中的囚徒困境

浅析博弈中的囚徒困境班级：姓名：学号：

摘要：囚徒困境是博弈论的非零和博弈中具代表性的例子，个人最佳选择并非团体最佳选择，个人理性有时会导致集体的非理性——机关算尽却因而作茧自缚，这就是囚徒困境所反映的问题。一经典的囚徒困境 “囚徒困境”是1950年美国兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。两个共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年；若一人揭发，而另一人隐瞒，则揭发者因为立功而立即获释，隐瞒者因不合作而入狱五年；若互相揭发，则因证据确实，二者都判刑三年。从集体上看，他们应当互相合作，都隐瞒，这样总服刑时间最短（为2年）。但他们会仔细考虑对方可能采取什么样的选择，并从自身利益出发做出选择。他们会意识到，如果同伙隐瞒而自己背叛，就能使自身利益最大化（0年）。但他也意识到，他的同伙也不傻，也会这样来设想，这样的话，他就更不可能让同伙得利（服刑0年）而自己受害（服刑5年）所以结论就是，唯一正确的选择就是背叛同伙，把一切都告诉警方，如果他的同伙保持隐瞒，那么他就会是那个获释出狱，服刑0年。而如果他的同伙也向警方交代了，那么，他只需服刑3年而不是5年。所以结果只能是两个囚犯都坐牢服刑3年，而不是都服刑1年。所以对于他们个人来说都是理性的，然而对集体来说却是非理性的。二重复多次如果囚徒困境的情况重复多次，会有什么新的变化？假设重复10次。我们可以合理地设想，如果囚徒第一次被对方指控，第二次这个囚徒也会指控对方。相反，如果第一次相反，如果第一次别人保持隐瞒，建立了互信的关系，你也会保持隐瞒，导致最优。当然，两个囚徒都会有相似的想法，在第一局保持隐瞒，以期望建立互信关系，所以双方都会保持隐瞒。第二局时，双方亦应有相似的想法，继续保持隐瞒，以期继续在互信的情况下进行第三局，

浅谈博弈论中的囚徒困境的解决方法

浅谈博弈论中的囚徒困境的解决方法摘要：囚徒困境是博弈论中的一个重要范例，这个问题涉及各个领域。本文通过三个简单的实例，来谈谈解决的方法。案例一：一个面馆的囚徒困境我曾经在路边一个小店里吃面，由于当时客人不是很多，就顺便与小老板聊了起来。通过老板的介绍听出了一些门道。以前面馆开店的时候请了一个师傅，开始的时候为了调动他的积极性他们采用按销售量分成，一碗面给5毛钱提成。这样的话，客人越多他挣得也就越多，为了吸引更多的顾客，他在碗里放很多的肉来吸引回头客，一碗面才6块钱，本来就靠薄利多销，他放的肉多，面馆自然也赚不到钱。后来呢，就换了一个结算方式，给厨师发固定的工资，这样客人多少跟他没有什么关系，但是新的问题又出现了，这次他在碗里放肉放很少，基本上把所有的客人都赶走了。客人少了，他就轻松了啊反正他拿的是固定的工资。通过这个案例我们可以了解到面馆的老板与厨师在工资的分配上存在一定的分歧，由于没有处理好，使得双方都处在不利的结局。解决方法：面馆的老板应该对厨师明确，每碗面的元材料是固定的，大师傅的工资还是按照销售量提成走，但是前题是每个月使用的原材料不能超额，否则只有基本工资。或者就规定每碗面里就放多少克肉。此外，还有一个更简单的办法就是：面馆的小老板亲自放肉。因为关键的资源一定要掌握在关键的人手里。经过以上的分析，我们可以得知解决的方法：1.工资加提成的制度确实能调动员工的积极性；2.权利下放可以，但是要有度；3.员工的工资提成不能只和销量挂钩，应该和老板的利润挂钩。4.有效的沟通、激励，平时给员工传达精神的奖励，让员工认为自己也是公司的主人。案例二：小餐馆的囚徒困境在天津新建的一片经济适用房社区里有两家小餐馆，他们都是经营当地的家常炒菜及快餐。因为这里是新开发的经济适用房，而周边像小饭馆这样的生活配套设施很缺乏，所以附近的建筑工人都是在这两家小饭馆解决三餐。这两家餐馆因为在口味、价格、菜的品种等都基本相同，所以一直以来这两家面对都是这些人，营业额都差不多，而附近的建筑工人们对于吃饭也没有什么特殊的爱好。好景不长，就在今年的夏天，两家餐馆的其中一家，暂且称为A

浅析囚徒困境与纳什均衡

浅析囚徒困境囚徒困境是博弈论的非零和博弈中具代表性的例子，指反映个人最佳选择并非团体最佳选择。囚徒困境的经典案例这里不再复述，让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境：减轻中小学生过重负担喊了20多年，仅1985年至2000年的15年里，中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效，中小学生课业负担不减反增。又比如近年来炒得火热的楼市——“我没买房，结果房价还是涨了，因为我们无法保证大家都不买房。可是，我错了吗？没有。当初如果我买房了，房价下跌了呢？因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下，房价竟还能且调且涨。可是，我对了吗？没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的“调侃”折射出当下楼市的“囚徒困境”：买，难担高房价重负；不买，难受房价节节攀升的煎熬。再看中国的法治之路。虽然法治让所有人都长期受益，甚至执政者自己也不例外，但是一个狭隘理性社会却偏偏无力支撑法治，以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人，不会故意给自己找茬，多数律师也不例外。不过，任何事物都有两面性，“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”：一种行为模式对于个人看起来是很理性的，但是对于个人构成的集体来说却是非理性的，最后对于每个人来说也是非理性的。我们都不敢站出来说话，对每个人来说都是很“理性”的一种行为方式，但最后的结果只能是让整个社会丧失法治。但囚徒困境一定是坏事吗？就以囚徒困境的经典案例来说，作为一个比喻，我们会为囚犯不能合作而遗憾；可是如果它发生在现实中，我们就巴不得他们不能合作。然而如果是多次博弈，人们就有了合作的可能性，囚徒困境就有可能破解，合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解，这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明，要想使合作成为多次博弈的均衡解，博弈的一方（最好是实力更强的一方）必须主动通过可信的承诺，向另一方表示合作的善意，努力把这个善意表达清楚，并传达出去。比如在楼市的囚徒困境中，政府能适当调控房价，给予购房者房价稳定合理的承诺，那么楼市的囚徒困境是有可能破解的。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出

博弈论“囚徒困境”的四种形式

博弈论中的“囚徒困境” 摘要：“囚徒困境”模型是博弈论中的经典范例，它是1950年Tucker提出的，其完全信息下的静态博弈为广大博弈论的工作者和初学者所掌握，成为解释生活现象的有力工具。其实“囚徒困境”模型随着博弈论的深入发展，具有各种不同的形式，通常分为：完全信息的静态博弈，完全信息的动态博弈，不完全信息的静态博弈及不完全信息的动态博弈四种形式。本文将对“囚徒困境”的这四种形式作一个简单的介绍和分析。关键词：博弈论囚徒困境经济一、完全信息静态“囚徒困境”博弈完全信息静态“囚徒困境”博弈部分地奠定了非合作博弈论的理论基础。它的基本模型是：警察抓住了两个合伙犯罪的罪犯，由于缺乏足够的证据指证他们的罪行，所以希望这两人中至少有一人供认犯罪，就能确认罪名成立。为此警察将这两个罪犯分别关押以防止他们串供，并告诉他们警方的政策是“坦白从宽，抗拒从严”：如果两人中只有一人坦白认罪，则坦白者立即释放，而另一人则将重判5年徒刑；如果两个同时坦白认罪，则他们将各判3年监禁。当然罪犯知道如果他们两人都拒不认罪，则警方只能以较轻的妨碍公务罪判处他们1 年徒刑。用矩阵表示两个罪犯的得益如下(得益向量的第一个数字是囚徒1的得益，第二个数字是囚徒2的得益) ：囚徒2 囚徒 1 （表1）假定两个罪犯熟悉彼此，这便是一个同时行动的完全信息静态博弈。容易看出，由于对

于每个囚徒而言，无论对方选择什么策略，坦白都是自己的最优策略，所以(坦白，坦白) 是博弈的Nash均衡。二、完全信息动态“囚徒困境”博弈——重复“囚徒困境”博弈研究重复博弈的意义在于基本博弈会重复进行，比如犯罪团伙会被警方多次审讯，日常生活中买卖会重复进行，国际间的战争此伏彼起。而且人们也发现基本博弈的重复进行并非基本博弈的简单累加，比如商业中的回头客问题。下面继续以表1所示的“囚徒困境”模型为例对多重博弈进行探讨。首先观察“囚徒困境”的有限博弈，以T记基本博弈的重复次数。博弈重复进行所耗时间会比较长，支付的时间价值必须考虑，记r为折现因子。在有限博弈的情况下，可简化在r = l 的情况下讨论，并采用动态博弈的逆向归纳法进行研究：先分析t = T阶段两博弈方的选择，这仍然是一个基本的囚徒困境博弈，此时前一阶段的结果已成为事实，又无后续阶段，因此不难得出结论，这一阶段的结果是(坦白，坦白)，双方得益( -3 ，-3)。现在回到t = T -1阶段，理性的博弈方对于后一阶段的结局非常清楚，其结果必然是(坦白，坦白)，因此不管现阶段的博弈结果是什么，双方在本阶段以后的最终得益都是在本阶段得益的基础上各加上-3，此时的得益矩阵是：囚徒2 囚徒 1 （表2）容易看出，坦白仍是两博弈方的严格优超策略，即(坦白，坦白) 是T - 1阶段的唯一的纯Nash均衡。以此往上类推，每阶段“囚徒困境”博弈的结果都是博弈双方采用坦白，所以T次重复博弈的子博弈精炼Nash均衡是每个博弈阶段双方都采用坦白。再考虑“囚徒困境”博弈重复无数次。因为无限博弈没有最终阶段，所以不能运用逆向归纳法求解。考虑博弈双方都采用“冷酷战略”：( 1 ) 开始阶段选择抵赖；( 2 )选择抵赖直到有一方选择了坦白，为了报复对手的背叛，以后都选择坦白。假定囚徒j 严格执行上述冷酷战略，考察囚徒i 的最优策略是否为冷酷战略：如果i 在博弈的某个阶段首先选择了坦白，他在该阶段得到0，而不是-1，但他的这次背叛会遭到囚徒j的永远惩罚，因此i 在随后每个阶段的支付都是-3 。如果下列条件满足，给定j没有选择坦白，i将不会选择坦白： 22 0+r(-3)+r(3)-1+r(-1)+r(-1) -+≤+ ……，即： 31 11 r r r -≤- -- 解上述不等式得：r≥1／3 (这个条件容易满足)。就是说，如果r ≥1／3，给定j 坚持冷酷战略并且j没有首先坦白，i不会选择首先坦白。进一步假定j首先选择坦白，那么i 是否有积极性坚持冷酷战略以惩罚j的不合作行为？如果i 坚持冷酷战略，他随后每个阶段的支付是-3，但如果他选择其他战略，他在任何单一阶段的支付都不会大于-3，因此，无论r是多大，i都有积极性坚持冷酷战略。在博弈重复无数次的情况下，只要r>1／3，子博

博弈论论文囚徒困境的启示和思考

囚徒困境的启示和思考二、囚徒困境的解释如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：若对方沉默、背叛会让我获释，所以会选择背叛。若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑8年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑1年，总体利益更高，结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。实际上囚徒困境在我们的实际生活中也有很多，下面举两个进行说明

三、经济学例子：关税战两个国家，在关税上可以有以两个选择: 提高关税，以保护自己的商品。（背叛）与对方达成关税协定，降低关税以利各自商品流通。（合作）当一国因某些因素不遵守关税协定，独自提高关税（背叛），另一国也会作出同样反应（亦背叛），这就引发了关税战，两国的商品失去了对方的市场，对本身经济也造成损害（共同背叛的结果）。然后二国又重新达成关税协定。（重复博弈的结果是将发现共同合作利益最大。）四、商业例子：广告战商业活动中亦会出现各种囚徒困境例子。以广告竞争为例。两个公司互相竞争，二公司的广告互相影响，即一公司的广告较被顾客接受则会夺取对方的部分收入。但若二者同时期发出质量类似的广告，收入增加很少但成本增加。但若不提高广告质量，生意又会被对方夺走。此二公司可以有二选择：互相达成协议，减少广告的开支。（合作）增加广告开支，设法提升广告的质量，压倒对方。（背叛）若二公司不信任对方，无法合作，背叛成为支配性策略时，二公司将陷入广告战，而广告成本的增加损害了二公司的收益，这就是陷入囚徒困境。在现实中，要二互相竞争的公司达成合作协议是较为困难的，多数都会陷入囚徒困境中。除了这些还有的很多类似的例子，比如说公共产品的提供，商家的价格战等等，在这里就不多赘述了。五、“囚徒困境”现象的意义和启示通过以上几个关于囚徒困境的例子，特别是作为经济管理学院的学生，我们可以将博弈论的一些知识运用好，更好的指导我们的经济生活。理论的重要意义在于类似的情况之下给人们社会经济生活带来指导。在经济发展中，我们应该认识到“看不见的手”还有更多内涵，有待我们去发掘。本文主要通过对该理论的分析，从中发现对企业经营管理活动的有义启示。第一，在市场竞争过程中，一名优秀的经营者，无论做任何决策还是考虑问题应该有战略眼观，特别是在做出对企业乃至行业今后发展的竞争策略时，从长远出发，做正确的决断。第二，保存对手就是保存自己。在市场竞争中，让竞争对手发展就是自己发展，本着求同存异的思想，共谋发展，避免恶性竞争，避免两败俱伤的情况。第三，市场竞争不是纯粹的竞争，在义和利之间应该如何取舍，是一位有战略眼观的企业家该做的第一个选择。 2杜兰：走出“囚徒困境”《通信企业管理》[J] 2003年第4期，第31页

囚徒困境

囚徒困境（prisoner's dilemma ）是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。概念释义囚徒困境（prisoner's dilemma ）：两个被捕的囚徒之间的一种特殊博弈，说明为什么甚至在合作对双方都有利时，保持合作也是困难的。单次和多次重单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数量，纳什均衡趋向于帕累托最优。囚徒困境的主旨囚徒们虽然彼此合作，坚不吐实，可为全体带来最佳利益（无罪开释），但在资讯不明的情况下，因为出卖同伙可为自己带来利益（缩短刑期），也因为同伙把自己招出来可为他带来利益，因此彼此出卖虽违反最佳共同利益，反而是自己最大利益所在。但实际上，执法机构不可能设立如此情境来诱使所有囚徒招供，因为囚徒们必须考虑刑期以外之因素（出卖同伙会受到报复等），而无法完全以执法者所设立之利益（刑期）作考量。固定局数的囚徒困境试想像囚徒困境的情况进行十次。我们可以合理地设想，如果囚徒第一次被对方指控，第二次这个囚徒也会指控对方。相反，如果第一次别人保持沉默，建立了互信的关系，你也会保持沉默，导致帕累托最优。当然，两个囚徒都会有相似的想法，在第一局保持沉默，以期望建立互信关系，所以双方都会保持沉默。第二局时，双方亦应有相似的想法，继续保持沉默，以期继续在互信的情况下进行第三局，以致余下的八局。这种想法合理吗？在第十局时，互信的关系明显是没有意义的，因为十局已经完结，囚徒没有必要为维持互信的关系而沉默(没有第十一局)，所以第十局囚徒一定会背叛对方的，理由和只有一局囚徒困境一样。问题是，既然大家都知道在第十局，无论如何对方都会背叛自己的，你在第九局保持沉默也是没有意思的，要知道，保持沉默(友好关系)的原因是为了希望下一局别人保持沉默。所以第九局双方都一定会背叛对方的。下一个问题是，双方都有相同的想法，明知第九局对方会背叛自己，所以第八局保持沉默也是没有意思的，第七局亦然，如此类推，纳什均衡是十局都会互相背叛，建立互信关系是没有可能的。只有在囚徒困境的局数大家都不肯定的情况下，上述的推论才不会发生，才会出现互相保持沉默的现象。经典的囚徒困境例子 1950年，由就职于兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特·塔克（Albert Tucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获

浅析“囚徒困境”模型中的“理性”假设

浅析“囚徒困境”模型中的“理性”假设 “囚徒困境”博弈模型中个体理性和集体理性的冲突对经济学的基本假设——“理性经济人”造成了严重挑战。认为“囚徒困境”中之所以出现表面的理性冲突是因为囚徒并非真正理性，之后笔者试着给出了两种可以化解这种冲突的方案：一种是改变博弈的理性选择方式，一种是集体理性工具说或集体利益幻象说，这一过程构成笔者对“理性经济人”假设的反思。标签：“理性经济人”假设；囚徒困境；个体理性；集体理性引言 “理性经济人”假设是西方经济学理论分析的逻辑起点，它为构建精致庞大的经济学理论体系奠定了一个公理化的起点。在以此为前提取得了丰硕的理论研究成果的同时，它也遭到了众多批判和质疑。1950年普林斯顿大学的塔克（Tucker）教授提出的“囚徒困境”博弈模型是对这一假设的有力冲击。在这一模型里，每个囚徒都是“理性的”，而且他们也都知道对方是“理性的”，每个囚徒都选择了对自己而言是理性的“占优策略”，而结果对每个人而言却都是次劣的，对集体而言则是最劣的[1]，这不符合“理性经济人”假设的逻辑结果，即个体理性的利益最大化行为的自然结果即是集体利益的最大化。这促使笔者思考，或者是研究者们在这一模型里对“理性经济人”假设的理解有偏差，或者是这一假设本身即有暗伤存在，囚徒博弈只是帮助我们发现了这一点；或者是这一假设根本不适用于分析该模型中囚徒的策略选择行为，这一点显然是试图逐渐扩张到解释预测一切人类行为的帝国主义经济学所不愿意承认的。而笔者深信，每个囚徒可以选择的“沉默”（合作）与“坦白”（背叛）两种策略不可能都是不理性的，至少有一个策略是相对最为理性的；同样，仅有可能出现的四种结果（最优，次优，次劣，最劣）也不可能对于每个囚徒而言都是不理性的，至少有一个结果是相对最为理性的[2]，在模型中如何使理性的策略与理性的结果统一起来，即实现手段理性与目标理性的统一，这是理性的任务。一、“囚徒困境”及其出现的原因分析 “囚徒困境”博弈模型最初由普林斯顿大学的塔克教授提出。经典的“囚徒困境”如下所述[3]：两个囚徒被警察抓住后分别关押，警方知道他们有罪，但是苦于缺乏充足的证据。警察给他们的政策是“坦白从宽，抗拒从严”。每个囚徒面临的两个策略选择“沉默”（合作）和“坦白”（背叛）。如果一方“坦白”，而另外一方“沉默”，则坦白方将被释放，而沉默方将被判重刑10年；如果双方均“坦白”，则每人将被判刑8年；如果双方均“沉默”，警方因为没有足够的证据而只能给他们轻微的象征性惩戒，判刑半年。他们的支付矩阵如下所示:

博弈论之囚徒困境

博弈论之囚徒困境阿普顿是普林斯大学的高材生，毕业后被安排在爱迪生身边工作，他对依靠自学而没有文凭的爱迪生很不以为然。一次，爱迪生要阿普顿算出梨形玻璃泡的容积，阿普顿点点头，心想：这么简单的事一会几就行了。只见他拿来梨形玻璃泡，用尺上下量了几遍，再按照武样在纸上画好革田，列出了一道算式，算来算去，算得满头大汗仍没算出来。一连换了几十个公式，还是没结果，阿普顿惠得满脸通红，狼狈不堪。爱迪生在实验室等了很久，觉得奇怪，便走到阿普顿的工作问，看到几张白纸上密密麻麻的算式．便笑荚说：“您这样计算太浪费时间了。”只见爱迪生将一杯水倒连玻璃泡内，交给阿普顿说：“再找个量筒来就知道答案了。”阿普顿茅塞顿开，终于对爱迪生敬服．最后成为爱迪生事业上的好助手。有时候。科学并不一定意味着烦琐的计算与剥量，而是一种有浓厚艺术气息的思维方式。前者固然可以得出正确的结论，但是后者同样可以用一种出入意表的方式曲径通幽。这种方式，与我们在生活中运用博弈科学有异曲同工之妙。大量的教学模型吓不倒我们，因为我们可以对它们置之不理。有一个脑筋息转弯问题是这样的：在什么情况下零大干二，二大干五，五又大干零’答案是：在玩“石头．剪刀．布”游戏的时候。博弈．就是用这种游戏思维来突破看似无法改变的局面，解决现实的严肃问题的策略。在博弈中，每个参与者都在特定条件下争取其最大利益，强差一者来必胜券在握，弱者也未必永无出头之日。因为在博弈中，特别是多十参与者的博弈中，结果不仅取决干参与者的实

力与策略，而且还取决于其他参与者的制约和策略。事实上，博弈过程本来就不过是一种日常现象。我们在日常生活中经常薷要先分析他人的意田从而做出合理的行为选择，而所谓博弈就是行为者在一定环境条件和规则下，选择一定的行为或策略加以实施并取得相应结果的过程。博弈论首先是我们思索现实世界的一套逻辑，其次才是把这套逻辑严密化的数学形式。博弈论的目的在于巧妙的策略，而不是解法。我们学习博弈论的目的．不是为了享受博弈分析的过程，而在于赢得更好的结局。说到底，博弈论毕竟只是一个分析问题的工具，用这个工具来简化问题，使问题的分析清晰明了也就够了。博弈的思想既然来自现实生活，它就既可以高度抽象化地用教学工具来表述，也可以用日常事例来说明，并运用到生活中去。在斯大林时代的苏联，有一位乐队指挥坐火车前往下一个演出地点。正当他在车看当晚就要指挥演奏的作品乐谱时。两名克格勃(KGB，苏联国家安全警察。实际是政治特务将他作为间谍逮捕了。他们以为那乐谱是某种密码，这位乐队指挥争辩说那只是柴可夫斯基的小提琴协奏曲，却无济于事。在乐队指挥被投入牢房的第二天，审问者自鸣得意地走进来说：“我看你最好还是老实招了吧，我们已经抓住你的朋友柴可夫斯基了．他这会儿正向我们交代呢。你如果再不招就枪毙了你。如果交代了，只判你10年。”笑过之后，每个人都会思考其中所蕴涵的东西。但是如果认为这个笑话仅仅讽刺了克格勃特务的无知与无耻，那是不够的。事实上，克格勃们的花招，是想运

囚徒困境-个人理性与集体理性的矛盾及其解决方式

个人理性与集体理性的矛盾及其解决方式一、囚徒困境举例概述囚徒困境是博弈论的非零和博弈中具代表性的例子，反映个人最佳选择并非团体最佳选择。虽然困境本身只属模型性质，但现实中的价格竞争、环境保护等方面，也会频繁出现类似情况。囚徒困境最早是由美国普林斯顿大学数学家阿尔伯特·塔克（Albert tucker）1950年提出来的。他当时编了一个故事向斯坦福大学的一群心理学家们解释什么是博弈论，这个故事后来成为博弈论中最著名的案例。故事内容是：两个嫌疑犯(A和B)作案后被警察抓住，隔离审讯；警方的政策是“坦白从宽，抗拒从严”，如果两人都坦白则各判8 年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判10年；如果都不坦白则因证据不足各判1年。单次发生的囚徒困境，和多次重复的囚徒困境结果不会一样。在重复的囚徒困境中，博弈被反复地进行。因而每个参与者都有机会去“惩罚”另一个参与者前一回合的不合作行为。这时，合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服，从而可能导向一个较好的、合作的结果。作为反复接近无限的数1 个体理性与集体理性许多行业的价格竞争都是典型的囚徒困境现象，每家企业都以对方为敌手，只关心自己的利益。在价格博弈中，只要以对方为敌手，那么不管对方的决策怎样，自己总是以为采取低价策略会占便宜，这就促使双方都采取低价策略。如可口可乐公司和百事可乐公司之间的竞争、各大航空公司之间的价格竞争等等。在国内的家电大战中，虽然不是两个对手之间的博弈，但由于在众多对手当中每一方的.市场份额都很大，每一个主体人的行为后果受对手行为的影响都很大，因此，其情景大概也是如此。如果清楚这种前景，双方勾结或合作起来，都制定比较高的价格，那么双方都可以因为避免价格大战而获得较高的利润。但是往往这些联盟处于利益驱动的“囚徒困境”，双赢也就成泡影。五花八门的价格联盟总是非常短命，道理就在这里。并不是每次个人的“理性选择”都能让自我利益最大化，也许会让你陷入一个“囚徒困境”。大量例子说明，在“囚徒困境”中，常常是先动手的一方会占一些优势。那么，“先下手为强”吧。二、个体理性与集体理性 1.个体理性

生活中的囚徒困境

生活中的—“囚徒困境” 摘要：数学源自生活，生活中处处可见数学之美，博弈论—数学的一个分支，无疑在经济、军事、生物、政治等方面发挥了不可替代的作用。博弈论是二人在平等的对局中各自利用对方的策略变换自己的对抗策略，达到取胜的目的。所谓奕者即博者，在中国很早便存在博弈论的思想。如“世事洞明皆学问，人情练达即文章”，更有“画龙画虎难画骨，知人知面不知心”、“逢人且说三分话，未可全抛一片心。”博弈论中著名的“囚徒困境”在生活中最为真实体现，本文即从囚徒困境出发，寻找生活中“囚徒困境”的例子，如学生减负，商业之间的广告战、价格战等等，阐述了生活中的“囚徒困境”。囚徒困境—忠诚还是背叛这是一个问题经典案例：“警察与小偷的故事” 在博弈论中，一个著名例子是由塔克给出的“囚徒困境”博弈模型“警察与小偷的故事”。假设有两个小偷A 和B 联合犯事、私入民宅被警察抓住。警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果两个犯罪嫌疑人都坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪，各被判刑8年；如果只有一个犯罪嫌疑人坦白，另一个人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。表1给出了这个博弈的。表1 囚徒困境博弈 [Prisoner's dilemma] A ╲B 坦白抵赖坦白 -8，-8 0，-10 抵赖 -10，0 -1，-1 我们来看看这个博弈可预测的均衡是什么。对A 来说，尽管他不知道B 作何选择，但他知道无论B 选择什么，他选择“坦白”总是最优的。显然，根据对称性，B 也会选择“坦白”，结果是两人都被判刑8年。但是，倘若他们都选择“抵赖”，每人只被判刑1年。但他们都抵赖并非个人最优选择。不难看出，“坦白”是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡。生活中的“囚徒困境” 学生减负—书包越减越重学生减负的呼声在中国当代教育体制下越来越高，但结果是，辅导班越来越火、学生书包越来越重。表2将清楚的呈现学生各个选择的结果面对表2的结果，孩子和父母会做出怎样的选择呢？从“囚徒困境”中我们知道，所有的学生会选择增负而不是减负，如果所有人选择减负那么皆大欢喜，如果我选择了减负而别人选择了增负，我考试分数肯定会比别人低，那么我便不能考上好的学校接受更好的教育，在未来求职时我赶不上他人；如果我选择了增负，其他人选择减负，那我会在考试中获得优势。其他学生╲我减负增负减负所有人综合素质提高我能考好的大学，找好工作增负我的会比其他人低，考不上好的大学所有人都会拼命学习

经典的囚徒困境

经典的囚徒困境 1950年，由就職於兰德公司的梅里尔·弗勒德（Merrill Flood）和梅爾文·德雷希爾（Melvin Dresher）擬定出相關困境的理論，後來由顧問艾伯特·塔克（Albert Tucker）以囚徒方式阐述，並命名为「囚徒困境」。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但沒有足够证据指控二人入罪。於是警方分开囚禁嫌疑犯，分别和二人见面，并向雙方提供以下相同的选择： ?若一人認罪並作证检控對方（相關術語稱「背叛」對方），而對方保持沉默，此人将即時獲释，沉默者将判監10年。 ?若二人都保持沉默（相關術語稱互相「合作」），则二人同樣判监半年。 ?若二人都互相检举（互相「背叛」），則二人同樣判監2年。用表格概述如下：解說如同博弈論的其他例證，囚徒困境假定每個參與者（即「囚徒」）都是利己的，即都尋求最大自身利益，而不關心另一參與者的利益。參與者某一策略所得利益，如果在任何情況下都比其他策略要低的話，

此策略稱為「嚴格劣勢」，理性的參與者絕不會選擇。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底應該選擇哪一項策略，才能將自己個人的刑期縮至最短？兩名囚徒由於隔絕監禁，並不知道對方选择；而即使他们能交谈，還是未必能夠盡信對方不會反口。就個人的理性選擇而言，檢舉背叛對方所得刑期，總比沉默要來得低。試設想困境中兩名理性囚徒會如何作出選擇： ?若對方沉默、我背叛會讓我獲釋，所以會選擇背叛。 ?若對方背叛指控我，我也要指控對方才能得到較低的刑期，所以也是會選擇背叛。二人面對的情況一樣，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是兩種策略之中的支配性策略。因此，这場博弈中唯一可能达到的纳什均衡，就是雙方参与者都背叛對方，結果二人同樣服刑2年。这場博弈的纳什均衡，顯然不是顧及團體利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，兩人都只會被判刑半年，总体利益更高，結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設，二人均為理性的個人，且只追求自己個人利益。均衡狀況會是兩個囚徒都选择背叛，结果二人判监均比合作為

论“囚徒困境”现象及其普遍意义

【摘要】本文从博奕论的经典命题“囚徒困境”现象出发，论述了“囚徒困境”现象及其普遍意义，“囚徒困境”现象与企业竞争情报以及价格战中的合作双赢；运用“囚徒困境”博奕对两个势均力敌的竞争对手之间的价格进行了分析，认为价格战是可以避免的，合作可以带来双赢。【关键词】博弈论囚徒困境企业竞争情报价格战合作双赢 “生活是一个永无止息的决策过程，我们每个人都无法逃避这样的现实：或是成为某个策略的影响者，或是被某个策略所影响。其实，我们每个人都是生活这场游戏的策略家。既然这样，当一个出色的策略家总比当一个蹩脚的策略家更好一点。” 目前博弈论的发展正越来越受到各个领域的重视，因为在现实生活中矛盾和冲突总是无所不在，而利用博弈论可以帮助我们很好地解决这些现实生活中的矛盾和冲突问题。由此可见，如何在矛盾和冲突中成功的选择和运用策略是一个很有意义的问题。一、“囚徒困境”现象及其普遍意义 1.“囚徒困境”现象 “囚徒困境”（Prisoner， s Dilemma）的具体内容如下：两个嫌疑犯作案后被警察逮捕，分别关在不同的屋子里审讯，警察告诉他们，如果两个人都坦白，那么每个人判刑8年；如果两个人都抵赖，每个人判刑1年（或许因为证据不足）；如果其中一个人坦白，另一个人抵赖的话，坦白的人释放，抵赖的人判刑10年。在这个博奕中，纳什均衡是（坦白，坦白），尽管从总体上看，（抵赖，抵赖）是对两个人都有益的结果，但由于不构成纳什均衡，所以不是该博奕的解。给定B坦白的情况下，A的最优战略选择是坦白，AB最优战略的组合（纳什均衡）却不是总体最优的选择。有没有可能其中一个人选择抵赖呢？按照人是理性的假设，没有人会积极地这么做，因为如果对方坦白的话，自己就可能被判刑10年，理性的人是不会冒这种风险的。囚徒困境反映了一个深刻的哲学问题：个人理性和集体理性的矛盾。在这个博奕中，两个博奕方对对方的可能得益完全知晓，并且各自独立作出策略选择。每个博奕方选择自己的策略时，虽然无法知道另一方的实际选择，但

囚徒困境博弈的行为博弈均衡分析

囚徒困境博弈的行为博弈均衡分析 Christopher Stephens: Modelling Reciprocal Altruism, The British Journal for the Philosophy of Science, vol.47, No.4, 1996, pp.533-551. 互动利他主义建模 1、利他主义困惑与标准模型 The altruism puzzle and the standard model 在一个囚徒困境博弈中，每个博弈者都有两种可能选择：背叛（Defect）或合作（Cooperate），可一般表示为：囚徒困境博弈要求两个主要条件：（1）Y>W>Z>X（命令条件，The ordering condition）；（2）(Y+X)<2W（反利用条件，The anti-exploitation condition）尽管“背叛”策略是一次性博弈中每个博弈者的优超选择，但相互合作却比相互背叛要好。 2、利他主义的非正式条件 Informal condition for reciprocal altruism 3、对反利用条件的Axelrod证明的批评 Criticism of Axelrod’s justification of the anti-exploitation condition 4、相互利他主义的一组正式模型 A menu of formal models of reciprocal altruism 5、对于guppies、baboons和bats模型的互动利他主义建模 Modelling reciprocal altruism in guppies, baboons, and bats （1）建模guppies的同时合作

博弈论中的囚徒困境在生活中的应用

博弈论中的囚徒困境在生活中的应用囚徒困境最早出现在1950年，由就职于兰德公司的梅里尔·弗勒德（Merrill Flood）和梅尔文·德雷希尔（Melvin Dresher）拟定出相关困境的理论，后来由顾问艾伯特·（AlbertTucker）以囚徒方式阐述，并命名为“囚徒困境”。经典的囚徒困境如下：警方逮捕甲、乙两名嫌疑犯，但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯，分别和二人见面，并向双方提供以下相同的选择：若一人认罪并作证检控对方（相关术语称“背叛”对方），而对方保持沉默，此人将即时获释，沉默者将判监10年。若二人都保持沉默（相关术语称互相“合作”），则二人同样判监半年。若二人都互相检举（互相“背叛”），则二人同样判监2年。如同博弈论的其他例证，囚徒困境假定每个参与者（即“囚徒”）都是利己的，即都寻求最大自身利益，而不关心另一参与者的利益。参与者某一策略所得利益，如果在任何情况下都比其他策略要低的话，此策略称为“严格劣势”，理性的参与者绝不会选择。另外，没有任何其他力量干预个人决策，参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略，才能将自己个人的刑期缩至最短？两名囚徒由于隔绝监禁，并不知道对方选择；而即使他们能交谈，还是未必能够尽信对方不会反口。就个人的理性选择而言，检举背叛对方所得刑期，总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择：（1）若对方沉默、背叛会让我获释，所以会选择背叛。（2）若对方背叛指控我，我也要指控对方才能得到较低的刑期，所以也是会选择背叛。二人面对的情况一样，所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此，这场博弈中唯一可能达到的纳什均衡，就是双方参与者都背叛对方，结果二人同样服刑2年。这场博弈的纳什均衡，显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言，如果两个参与者都合作保持沉默，两人都只会被判刑半年，总体利益更高，结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设，二人均为理性的个人，且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛，结果二人判决均比合作为高，总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了：非零和博弈中，帕累托最优和纳什均衡是相冲突的。一，囚徒困境之于异地恋

浅析囚徒困境与纳什均衡之欧阳家百创编

浅析囚徒困境欧阳家百（2021.03.07）囚徒困境是博弈论的非零和博弈中具代表性的例子，指反映个人最佳选择并非团体最佳选择。囚徒困境的经典案例这里不再复述，让我们看一下身边的例子。囚徒困境在生活中最常见的表现就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是你挤我不挤,我就可能上得慢,所以每个人的最优战略都是挤,结果上车就更慢了。学生也同样遭遇囚徒困境：减轻中小学生过重负担喊了20多年，仅1985年至2000年的15年里，中央就下达“减负令”49次。但实际情况却是学生课业负担不但没减下来，反倒呈现出越演越烈之势，致使学生作业做到深夜、节假日仍然上课、业余时间奔忙于各种补习班等。可见“减负令”难以见效，中小学生课业负担不减反增。又比如近年来炒得火热的楼市——“我没买房，结果房价还是涨了，因为我们无法保证大家都不买房。可是，我错了吗？没有。当初如果我买房了，房价下跌了呢？因为我不能保证大家都买房。人们根本不能预知在疾风暴雨式的调控之下，房价竟还能且调且涨。可是，我对了吗？没有。”这是一部眼下流行、充满黑色幽默的网络视频《北漂族的无房生活》中的经典对白。含泪的

“调侃”折射出当下楼市的“囚徒困境”：买，难担高房价重负；不买，难受房价节节攀升的煎熬。再看中国的法治之路。虽然法治让所有人都长期受益，甚至执政者自己也不例外，但是一个狭隘理性社会却偏偏无力支撑法治，以至最后每个理性人都不得不忍受法治缺位的非理性之苦。绝大多数中国人都是很识时务的理性人，不会故意给自己找茬，多数律师也不例外。不过，任何事物都有两面性，“理性”过了头也就成了非理性。这就是充斥着当今中国社会的“囚徒困境”：一种行为模式对于个人看起来是很理性的，但是对于个人构成的集体来说却是非理性的，最后对于每个人来说也是非理性的。我们都不敢站出来说话，对每个人来说都是很“理性”的一种行为方式，但最后的结果只能是让整个社会丧失法治。但囚徒困境一定是坏事吗？就以囚徒困境的经典案例来说，作为一个比喻，我们会为囚犯不能合作而遗憾；可是如果它发生在现实中，我们就巴不得他们不能合作。然而如果是多次博弈，人们就有了合作的可能性，囚徒困境就有可能破解，合作就有可能达成。连续的合作有可能成为重复的囚徒困境的均衡解，这也是博弈论上著名的“大众定理”的含义。但合作的可能性不是必然性。博弈论的研究表明，要想使合作成为多次博弈的均衡解，博弈的一方（最好是实力更强的一方）必须主动通过可信的承诺，向另一方表示合作的善意，努力把这个善意表达清楚，并传达出去。比如在楼市的囚徒困境中，政府能

博弈论中经典案例--“囚徒困境”

博弈论中经典案例--“囚徒困境” 博弈论中有一个经典案例--“囚徒困境”。两个共谋犯罪的人被关入监狱，不能互相沟通情况。如果两个人都不揭发对方，则由于证据不确定，每个人都坐牢一年;若一人揭发，而另一人沉默，则揭发者因为立功而立即获释，沉默者因不合作而入狱十年;若互相揭发，则因证据确实，二者都判刑八年。由于囚徒无法信任对方，因此倾向于互相揭发，而不是同守沉默。囚犯可以做出如下选择：1、供出他的同伙(即与警察合作，从而背叛他的同伙)，2、保持沉默(也就是与他的同伙合作，而不是与警察合作)。这两个囚犯都知道，如果他俩都能保持沉默的话，就都会被释放，因为只要他们拒不承认，警方无法给他们定罪。但警方也明白这一点，所以他们就给了这两个囚犯一点儿刺激：如果他们中的一个人背叛，即告发他的同伙，那么他就可以被无罪释放，同时还可以得到一笔奖金。而他的同伙就会被按照最重的罪来判决，并且为了加重惩罚，还要对他施以罚款，作为对告发者的奖赏。当然，如果这两个囚犯互相背叛的话，两个人都会被按照最重的罪来判决，谁也不会得到奖赏。那么，这两个囚犯该怎么办呢？是选择互相合作还是互相背叛？从表面上看，他们应该互相合作，保持沉默，因为这样他们俩都能得到最好的结果：自由。但他们不得不仔细考虑对方可能采取什么选择。

A犯不是个傻子，他马上意识到，他根本无法相信他的同伙不会向警方提供对他不利的证据，然后带着一笔丰厚的奖赏出狱而去，让他独自坐牢。这种想法的诱惑力实在太大了。但他也意识到，他的同伙也不是傻子，也会这样来设想他。所以A犯的结论是，唯一理性的选择就是背叛同伙，把一切都告诉警方，因为如果他的同伙笨得只会保持沉默，那么他就会是那个带奖出狱的幸运者了。而如果他的同伙也根据这个逻辑向警方交代了，那么，A犯反正也得服刑，起码他不必在这之上再被罚款。所以其结果就是，这两个囚犯按照不顾一切的逻辑得到了最糟糕的报应：坐牢。囚徒困境模型的几个现实例子囚徒困境的例子在现实生活中很多。比如国家与国家之间的军备竞赛，显然，各国都不把大量的财富花在可能永远都用不上的军备上是最佳选择。可是，如果别的国家不把钱花在军备上，我们花，那么我们会在两国外交和贸易中占得优势，拥有国际影响力，在未来战争中赢得胜利。如果别国把钱花在军备上，我们也花，那么我们至少可以不吃亏。所以，不管别的国家把钱花不花在军备上，我们把大把大把的钱花在军备上都是优势选择。所以，我们会把钱花在军备上。显然，别国也会这样想。结果是各国都会把大把大把的钱花在军备上，而且还互相攀比，想要胜过对方，占得优势，以便给对方造成压力。这就造成了军备竞赛，你花一百亿，我花一百五十亿。你花一百五十亿啊，那么我花两

囚徒困境的生活实例分析教学资料

囚徒困境的生活实例分析

囚徒困境的生活实例分析中南财经政法大学工商管理学院博弈论对人的基本假定是：人是理性的,理性的人是指他在具体策略选择时的目的是使自己的利益最大化，博弈论研究的是理性的人之间如何进行策略选择的。 “囚徒困境”是博弈论里最经典的例子之一。讲的是两个嫌疑犯（Ａ和Ｂ）作案后被警察抓住，隔离审讯；警方的政策是"坦白从宽，抗拒从严"，如果两人都坦白则各判８年；如果一人坦白另一人不坦白，坦白的放出去，不坦白的判１０年；如果都不坦白则因证据不足各判１年。问题可以总结为：在这个例子里，博弈的参加者就是两个嫌疑犯Ａ和Ｂ，他们每个人都有两个策略即坦白和不坦白，判刑的年数就是他们的支付。可能出现的四种情况：Ａ和Ｂ均坦白或均不坦白、Ａ坦白Ｂ不坦白或者Ｂ坦白Ａ不坦白，是博弈的结果。Ａ和Ｂ均坦白是这个博弈的纳什均衡。这是因为，假定Ａ选择坦白的话，Ｂ最好是选择坦白，因为Ｂ坦白判８年而抵赖却要判十年；假定Ａ选择抵赖的话，Ｂ最好还是选择坦白，因为Ｂ坦白判不被判刑而抵赖确要被判刑１年。即是说，不管Ａ坦白或抵赖，Ｂ的最佳选择都是坦白。反过来，同样地，不管Ｂ是坦白还是抵赖，Ａ的最佳选择也是坦白。结果，两个人都选择了坦白，各判刑８年。在（坦白、坦白）这个组合中，Ａ和Ｂ都不能通过单方面的改变行动增加自己的收益，于是谁也没有动力游离这个组合，因此这个组合是纳什均衡。囚徒困境反映了个人理性和集体理性的矛盾。如果Ａ和Ｂ都选择抵赖，

各判刑１年，显然比都选择坦白各判刑８年好得多。当然，Ａ和Ｂ可以在被警察抓到之前订立一个"攻守同盟"，但是这可能不会有用，因为它不构成纳什均衡，没有人有积极性遵守这个协定。从自私自利的角度出发，选择认罪是最好的这种说法是有缺陷的，因为两个人都可能会得到8年的监禁期。即使是最狡猾的方法也不能把你救出监狱。但是如果你期望你的同伙与你合作，那你最好的选择将是认罪。然而，如果你的同伙知道了你的计划，他也会认罪，此时最好的方法是你们两个合作。这就是这个悖论的关键所在。如果从整体来看，对于两个囚犯而言，最好的结果是两人合作，其它的任何选择都是不好的。实例分析 1：一．电信价格竞争根据我国电信业的实际情况，我们来构造电信业价格战的博弈模型。假设此博弈的参加者为电信运营商A与B, 他们在电信某一领域展开竞争，一开始的价格都是P0。A（中国电信）是老牌企业，实力雄厚，占据了绝大多数的市场份额；B（中国联通）则刚刚成立不久，翅膀还没有长硬，是政府为了打破垄断鼓励竞争而筹建起来的。正因为B是政府扶植起来鼓励竞争的，所以B得到了政府的一些优惠，其中就有B的价格可以比P0低 10％。这一举动，还不会对A产生多大的影响，因为A的根基实在是太牢固了。在这样的市场分配下，A、B可以达到平衡，但由于B在价格方面的优势，市场份额逐步壮大，到了一定程度，对A造成了影响。这时候，A该怎么做？不妨假定： A降价而B维持，则A获利15，B损失5，整体获利 10；