(应用数学专业论文)均衡理论及其在经济领域中的应用研究.pdf_第1页
(应用数学专业论文)均衡理论及其在经济领域中的应用研究.pdf_第2页
(应用数学专业论文)均衡理论及其在经济领域中的应用研究.pdf_第3页
(应用数学专业论文)均衡理论及其在经济领域中的应用研究.pdf_第4页
(应用数学专业论文)均衡理论及其在经济领域中的应用研究.pdf_第5页
已阅读5页,还剩75页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

哈尔滨l :稃人学硕十学位论文 摘要 博弈论是当今经济学乃至整个社会科学中极为重要的一门理论学科,它 利用数学工具对社会经济现象进行深入的规范分析,获得了丰硕的成果。博 弈分析的目的是预测博弈的均衡结果。所以均衡理论是博弈论中最为重要的 内容。 本文主要是根据纳什均衡的理论建立了一个多厂商条件下的古诺模型并 对其进行了分析,找到了这个模型下各厂商产量的变化规律:某个行业的以个 厂商,由于他们进入市场的初始产量的和的不同,他们的产量经过多次调整 后,各厂商的产量有可能达到一个均衡产量或是出现在两个均衡值之间的波 动,我们把这种波动称为周期均衡。并且根据各厂商初始产量的和的不同这 种波动的幅度也会有所不同。并且还对这一规律进行了分析。这对于各生产 行业有着重要的现实意义。 本文的其他内容还包括: ( 1 ) 对博弈论进行了综述,介绍了博弈论的发展概况,近几年的主要成 果和基本概念。 ( 2 ) 介绍了纳什均衡的相关知识,纳什均衡与一般均衡的关系以及纳什 均衡的缺陷和解决办法。 ( 3 ) 研究了古诺模型中的纳什均衡,分析了双头古诺模型在不同需求函 数条件下和不同的成本函数下的纳什均衡解。 ( 4 ) 介绍了博弈论中另外两个经典模型:伯特兰德模型和斯塔克尔伯格 模型,并重点是对斯塔克尔伯格模型进行了推广。 关键词:博弈论;纳什均衡;多厂商古诺模型;串谋;斯塔克尔伯格模型 a bs t r a c t g a m et h e o r yi sa l le x t r e m e l yi m p o r t a n tt h e o r e t i c a ls u b j e c ti nt h ee c o n o m i c s a n de v e nt h ee n t i r es c i e n t i f i cc o m m u n i t y , w h i c hu s e sm a t h e m a t i c a lt o o l sa n a l y s i s s o c i o e c o n o m i c p h e n o m e n o n ,h a so b t a i n e dt h es u b s t a n t i a la c h i e v e m e n t t h e g a m b l i n ga n a l y s i s sg o a li sf o r e c a s t i n gag a m b l i n ge q u i l i b r i u mr e s u l t t h e r e f o r e t h ee q u i l i b r i u mt h e o r yi st h ev e r yi m p o r t a n tc o n t e n ti nt h eg a m et h e o r y t h i sp a p e ri sb a s e do nt h et h e o r yo fn a s he q u i l i b r i u mt oe s t a b l i s ha m u l t i v e n d o rc o u m o tm o d e la n da n a l y s i si t ,f o u n dm a n u f a c t u r e r s p r o d u c t i o n c h a n g e si nt h i sm o d e l s o m em a n u f a c t u r e r , a st h e yh a v ed i f f e r e n ti n i t i a lp r o d u c t i o n , v a r i o u sm a n u f a c t u r e r s o u t p u tw i l la c h i e v ea l le q u i l i b r i u mo ra p p e a rf l u c t u a t i o n b e t w e e nt w oe q u i l i b r i u ma f t e rt h e ya d j u s tt h e i rp r o d u c t i o nm a n yt i m e s t h i sk i n d o ff l u c t u a t i o ni sc a l l e dt h ec y c l ee q u i l i b r i u m b e c a u s em a n u f a c t u r e r s t o t a li n i t i a l p r o d u c t i o ni sd i f f e r e n t ,t h i sk i n do fc y c l ef l u c t u a t i o n ss c o p ew i l la l s ob ed i f f e r e n t a n dw eh a v ea n a l y s e dt h i sr u l e t h i sh a st h ev i t a lp r a c t i c a ls i g n i f i c a n c et oe a c h p r o d u c t i o np r o f e s s i o n i nt h i sp a p e r ,t h eo t h e re l e m e n t si n c l u d e : ( 1 ) g a m e t h e o r yi si n t r o d u c e d ,i n c l u d et h ed e v e l o p m e n to fg a m et h e o r y t h em a j o ra c h i e v e m e n t si nr e c e n ty e a r sa n db a s i cc o n c e p t s ( ”w e g oo nw i t ht h ec o r r e l a t i v et h e o r yi nn a s he q u i l i b r i u m t h er e l a t i o n o fn a s he q u i l i b r i u ma n dg e n e r a le q u i l i b r i u m ,t h ed e f e c t sa n ds o l u t i o n si nn a s h e q u i l i b r i u m ( 3 ) n e x tw e s t u d yt h en a s he q u i l i b r i u mi nc o u m o tm o d e l ,h a v ea n a l y z e d t h en a s he q u i l i b r i u ms o l u t i o no ft h ed o u b l eo l i g a r c hc o u m o tm o d e lu n d e rt h e d i f f e r e n td e m a n df u n c t i o nc o n d i t i o na n dt h ed i f f e r e n tc o s tf u n c t i o n ( 4 ) i nt h el a s tp a r tw em a i n l yi n t r o d u c eo t h e rt w oc l a s s i c a lm o d e l si nt h e g a m et h e o r y , b e t r a n da n ds t a c k e l b e r gm o d e l a n dt h ek e yp o i n tw a sp r o m o t i o n a b o u ts t a c k e l b e r gm o d e l 哈尔滨t 稗人学硕十学位论文+ k e yw o r d s :g a m et h e o r y ;n a s he q u i l i b r i u m ;c o u r n o tm o d e lw i t hm a n yf i r m s ; c o l l u s i o n ;s t a c k e l b e r gm o d e l 哈尔滨工程大学 学位论文原创性声明 本人郑重声明:本论文的所有工作,是在导师的指导下,由 作者本人独立完成的。有关观点、方法、数据和文献的引用己在 文中指出,并与参考文献相对应。除文中已注明引用的内容外, 本论文不包含任何其他个人或集体已经公开发表的作品成果。对 本文的研究做出重要贡献的个人和集体,均已在文中以明确方式 标明。本人完全意识到本声明的法律结果由本人承担。 作者( 签字) :夤形锄条 日期:钞z 年月知e l 哈尔滨。i :程人学硕+ 学位论文 第1 章绪论 1 1 博弈论的背景 博弈论又被称为对策论( g a m e st h e o r y ) ,是研究具有斗争或竞争性质现 象的理论和方法,它既是现代数学的一个新分支,也是运筹学的一个重要学 科。 博弈论思想古已有之,我国古代的孙子兵法就不仅是一部军事著作, 而且算是最早的一部博弈论专著。博弈论最初主要研究象棋、桥牌、赌博中 的胜负问题,人们对博弈局势的把握只停留在经验上,没有向理论化发展, 正式发展成- f - j 学科则是在2 0 世纪初。1 9 2 8 年冯诺意曼证明了博弈论的基 本原理,从而宣告了博弈论的正是诞生。1 9 4 4 年,冯诺意曼摩根斯坦共著的 划时代巨著博弈论与经济行为将二人博弈推广到n 人博弈结构并将博弈 论系统的应用于经济领域,从而奠定了这一学科的基础和理论体系。谈到博 弈论就不能忽略博弈论天才纳什,纳什的开创性论文n 人博弈的均衡点 ( 1 9 5 0 ) ,非合作博弈( 1 9 5 1 ) 【7 l 等等,给出了纳什均衡的概念和均衡存在 定理。此外,塞尔顿、哈桑尼的研究也对博弈论发展起到推动作用。今天博 弈论已发展成一门较完善的的学科1 6 3 d - 9 。 值得一提的是1 9 5 0 年和1 9 5 1 年纳什的两篇关于非合作博弈论的重要论 文,彻底改变了人们对竞争和市场的看法。他证明了非合作博弈及其均衡解, 并证明了均衡解的存在性,即著名的纳什均衡。从而揭示了博弈均衡与经济 均衡的内在联系。纳什的研究奠定了现代非合作博弈论的基石,后来的博弈 论研究基本上都沿着这条主线展开的。纳什均衡理论也成为迄今为止博弈论 中最为重要的理论。 1 2 博弈的要素与类型 1 2 1 博弈要素 ( 1 ) 局中人:在一场竞赛或博弈中,每一个有决策权的参与者成为一个 局中人。只有两个局中人的博弈现象称为“两人博弈 ,而多于两个局中人的 博弈称为“多人博弈”。 哈尔滨t 程大学硕十学位论文 ( 2 ) 策略:一局博弈中,每个局中人都有选择实际可行的完整的行动方 案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案,一个局 中人的一个可行的自始至终全局筹划的一个行动方案,称为这个局中人的一 个策略。如果在一个博弈中局中人都总共有有限个策略,则称为“有限博弈”, 否则称为“无限博弈”。 ( 3 ) 得失:一局博弈结局时的结果称为得失。每个局中人在一局博弈结 束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取 定的一组策略有关。所以,一局博弈结束时每个局中人的“得失”是全体局 中人所取定的一组策略的函数,通常称为支付( p a y o f f ) 函数。 ( 4 ) 对于博弈参与者来说,存在着一博弈结果。 ( 5 ) 博弈涉及到均衡:均衡是平衡的意思,在经济学中,均衡意即相关 量处于稳定值。在供求关系中,某一商品市场如果在某一价格下,想以此价 格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的 供求达到了均衡。所谓纳什均衡,它是一稳定的博弈结果1 3 - 6 1 。 1 2 2 博弈类型 根据博弈的不同特点可以分出不同的博弈: ( 1 ) 合作博弈:研究人们达成合作时如何分配合作得到的收益,即收益 分配问题。 ( 2 ) 非合作博弈:研究人们在利益相互影响的局势中如何选决策使自己 的收益最大,即策略选择问题。 ( 3 ) 完全信息与不完全信息博弈:参与者对所有参与者的策略空间及策 略组合下的支付有充分了解称为完全信息;反之,则称为不完全信息。 ( 4 ) 静态博弈和动态博弈: 静念博弈:指参与者同时采取行动,或者尽管有先后顺序,但后行动者 不知道先行动者的策略。 动态博弈:指双方的行动有先后顺序并且后行动者可以知道先行动者的 策略m 1 8 】。 2 哈尔滨r 释大学硕十学位论文 1 3 博弈论中均衡理论的由来及现状 对具有博弈性质的问题的研究可以追溯到1 9 世纪甚至更早,1 8 3 8 年法 国经济学家古诺提出了简单双寡头垄断模型古诺模型1 3 2 3 3 ,并求出其均衡 解,后来的学者又对古诺模型的迸一步的论述及一些扩展1 4 6 1 1 4 9 - 5 h ,使古诺模型 成为研究经济现象非常重要的模型,对古诺模型的扩展主要包括:对双头m j 和多头【3 6 】的动念古诺模型的研究1 4 7 1 1 s 2 1 ,对广义古诺模型的解法的研究1 3 7 1 ,对不 完全信息及完全信息古诺模型进行了说日月【,】,分析多目标古诺模型的存在性 与稳定性m 】。到了1 8 8 3 年伯特兰和1 9 2 5 年艾奇沃奇思研究了两个寡头的产 量与价格垄断1 3 唧】,其中伯特兰德提出了非常著名的伯特兰德模型和伯特兰 德悖论m l ,这些都涉及到了博弈论与均衡解,可以说是博弈论的萌芽,但这 些理论的特点是零星的,片断的研究,带有很大的偶然性,很不系统。冯诺 依曼和摩根斯特恩的博弈论与经济行为一书中提出的标准型、扩展型和 合作型博弈模型解的概念和分析方法,奠定了这门学科的理论基础。合作型 博弈在2 0 世纪5 0 年代达到了巅峰期。然而,诺依曼的搏弈论的局限性也同 益暴露出来,由于它过于抽象,使应用范围受到很大限制,在很长时间旱, 人们对博弈论的研究知之甚少,只是少数数学家的专利,所以,影响力很有 限。正是在这个时候,非合作博弈“纳什均衡”应运而生了,它标志 着博弈论的新时代的开始! 纳什的主要学术贡献体现在1 9 5 0 年和1 9 5 1 年的 两篇论文之中( 包括一篇博士论文) 。1 9 5 0 年他才把自己的研究成果写成题 为“非合作博弈”的长篇博士论文,1 9 5 0 年1 1 月刊登在美国全国科学院每 月公报上,立即引起轰动【7 l 。 纳什在上大学时就开始从事纯数学的博弈论研究,1 9 4 8 年进入普林斯顿 大学后更是如鱼得水。2 0 岁出头已成为闻名世界的数学家。特别是在经济博 弈论领域,他做出了划时代的贡献,是继冯诺依曼之后最伟大的博弈论大师 之一。他提出的著名的纳什均衡的概念在非合作博弈理论中起着核心的作用。 后续的研究者对博弈论的贡献,都是建立在这一概念之上的。 由于纳什均衡的提出和不断完善为博弈论的应用奠定了坚实的理论基 础。上世纪八、九十年代是博弈论走向成熟的时期【2 1 1 。在这个阶段博弈论的 理论框架,及与其他学科之间的关系等逐渐完整和清晰起来,博弈论在经济 哈尔滨t 程人学硕十学何论文 学中的应用领域越来越广泛,在经济学中的地位达到了最高峰 s p p - l o 。这段时 期博弈论中的最重要的理论成果有: k o h l b e r 9 1 9 8 1 年引进的“顺推归纳法 ( f o r w a r di n d u c t i o n ) ;克瑞珀斯 ( k r e p s ) 和威尔森( w i l s o n ) 1 9 8 2 年提出的“序列均衡”;斯密斯( m a y n a r d s m i t h ) 1 9 8 2 年出版的进化与博弈论;波恩海姆和皮尔斯1 9 8 4 年创立的 “可理性化”;弗德伯格( d f u d e n b e r g ) 和泰勒尔( t i r o l e ) 提出的“完美 贝叶斯均衡”等。 现在博弈论已经广泛被应用于经济学、管理学、社会学、政治学、军事 科学等领域1 2 9 】f 6 7 。尤其是经济领域的应用 1 4 - 1 7 j 。对经济学的发展具有相当大的 推动作用。 1 9 9 4 年n a s h 、h a r s a n y i 、s e l t e n 正是由于致力于博弈论的基础理论研究, 对非合作博弈理论的创立与发展做出的巨大贡献,共同获得诺贝尔经济学奖。 1 9 9 6 年,博弈论与信息经济学家英罩斯( m i r r l e e s ) 和维克瑞( v i c k r e y ) 由 于在不对称信息条件下激励机制问题方面的基础性研究而获得诺贝尔经济学 奖。 1 4 多人博弈的均衡点概述 我们可以定义门人博弈的概念,其中,每一个参与人有有限个纯策略, 且对每一个, 维纯策略( 每一个参与人选择一个纯策略) ,每个参与人都有确 定的支付与之对应。混合策略即为纯策略上的概率分布,支付函数即为各参 与人的期望,它是关于各参与人选择不同的纯策略的概率的多重线性形式。 任何玎维策略,每一个分量对应于一个参与人,都可以看作由刀个参与 人的甩个策略空问的乘积而得到的积空间的一个点。一个这样的刀维策略对 抗另一个胛维策略,指的是在这个玎维对抗策略中,相对于其他刀一1 个参与 人在被对抗的刀维策略中的策略选择,每一个参与人都选择了能使他获得最 高期望支付的策略。一个自我对抗的,2 维策略就称为均衡点。 1 5 囚徒困境 说到博弈论,我们就不得不提博弈论中的一个经典案例:囚徒困境。 假设有两个小偷a 和b 联合犯事、私入民宅被警察抓住。警方将两人分 哈尔滨f 住ij 人学硕十学位论文 别置于不同的两个房间内进行审讯,对每一个犯罪嫌疑人,警方给出的政策 是:如果一个犯罪嫌疑人坦白了罪行,交出了赃物,于是证据确凿,两人都 被判有罪。如果另一个犯罪嫌疑人也作了坦白,则两人各被判刑8 年;如果 另一个犯罪嫌人没有坦白而是抵赖,则以妨碍公务罪( 因已有证据表明其有 罪) 再加刑2 年,而坦白者有功被减刑8 年,立即释放。如果两人都抵赖, 则警方因证据不足不能判两人的偷窃罪,但可以私入民宅的罪名将两人各判 入狱1 年。表1 1 给出了这个博弈的支付矩阵。 表1 1囚徒困境博弈 bb 坦白抵赖 a坦白8 ,80 ,1 0 a抵赖1 0 ,01 ,1 关于案例,显然最好的策略是双方都抵赖,结果是大家都只被判1 年。 但是由于两人处于隔离的情况,首先应该是从心理学的角度来看,当事双方 都会怀疑对方会出卖自己以求自保、其次才是亚当斯密的理论,假设每个人 都是“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这 样一个盘算过程:假如他坦白,我抵赖,得坐1 0 年监狱,坦白最多才8 年; 他要是抵赖,我就可以被释放,而他会坐1 0 年牢。综合以上几种情况考虑, 不管他坦白与否,对我而言都是坦白了划算。两个人都会动这样的脑筋,最 终,两个人都选择了坦白,结果都被判8 年刑期。 基于经济学中r a t i o n a la g e n t 的前提假设,两个囚犯符合自己利益的选择 是坦白招供,原本对双方都有利的策略不招供从而均被释放就不会出现。这 样两人都选择坦白的策略以及因此被判8 年的结局,“纳什均衡”首先对亚 当斯密的“看不见的手”的原理提出挑战:按照斯密的理论,在市场经济中, 每一个人都从利己的目的出发,而最终全社会达到利他的效果。但是我们可 以从“纳什均衡”中引出“看不见的手 原理的一个悖论:从利己目的出发, 结果损人不利己,既不利己也不利他。 哈尔滨r 程大学硕十学何论文 1 6 本文的主要内容及创新点 本文主要基于博弈论中纳什均衡理论研究了纳什均衡的应用。首先介绍 纳什均衡的相关知识,包括纳什均衡的定义及纳什均衡的性质,并对这些性 质进行了论证,然后重点介绍了古诺模型的相关知识,并对古诺模型进行了 扩展和研究。 本文的主要内容是: 第1 章对博弈论进行了综述,介绍了博弈论的发展概况,主要成果,基 本概念以及本篇论文所要研究的主要问题。 第2 章主要介绍了纳什均衡的相关知识,研究了纳什均衡与一般的关系, 另外根据实际情况对博弈论中一个无法求出纳什均衡解的博弈进行了分析。 这有利于我们以此为借鉴,处理一些在理论上无法得到纳什均衡解的情况。 第3 章主要研究了古诺模型中的纳什均衡,分析了双头古诺模型在不同 需求函数条件下和不同的成本函数下的纳什均衡解。 第4 章对多个生产厂商条件下静态古诺模型的纳什均衡进行了求解。接 着对这个均衡解进行了分析,找到了各厂商随着调整次数的不同产量的变化 规律,并对其进行了分析。这章也是本文的重点内容。 第5 章主要介绍了博弈论中另外两个经典模型:伯特兰德模型和斯塔克 尔伯格模型,并重点求解了一个垄断企业和多个跟随企业的斯塔克尔伯格模 型的均衡解。 另外本文的创新点主要包括以下几个方面: ( 1 ) 分析了双头古诺模型在不同需求函数条件下和不同的成本函数下的 纳什均衡解,尤其对成本函数为二次函数以及需求函数为非线性函数时双头 舌诺模型的纳什均衡进行了求解。在需求函数为非线性函数时,根据厂商成 本的不同,还对两厂商的利润进行了分析。 ( 2 ) 对于多个生产厂商条件下静态古诺模型的纳什均衡进行了求解。这 是本文的重点内容,由于古诺模型是博弈论和经济学中具有重要地位的模型, 对它的研究有利于我们解决很多经济学中遇到的问题。在此之前有很多关于 动态古诺模型的研究,它主要是假设一个厂商在它前面的厂商调整完产量之 后,自己再进行调整,可是由于商品具有时效性,而且各厂商在商品推出之 6 哈尔滨t 程人学硕士学位论文 前自己的预计产量是商业机密,不会轻易被其他厂商知道,所以这种对动态 的古诺模型的研究有它的局限性。本文主要通过各个生产厂商之间对彼此的 不完全的信息掌握,而各厂商又想在此条件下获得最大利润的基础上建立一 个多厂商静态古诺模型,并研究了在此模型下,各生产厂商产量的变化规律, 以及面对这种规律所应该采取的应对方法。这也是本文的重点内容。 ( 3 ) 研究了斯塔克尔伯格模型,介绍了不同成本下的双头斯塔克尔伯格 模型的均衡解,重点是对斯塔克尔伯格模型进行了推广,分析了一种一个领 导企业和多个跟随企业情况下的斯塔克尔伯格模型的纳什均衡解。 7 哈尔滨t 程大学硕十学何论文 2 1 基本概念 第2 章纳什均衡的相关知识 纳什均衡,又称为非合作博弈均衡,是博弈论的一个重要术语,以著名 数学家纳什的名字命名,关于纳什在第l 章中我们已做了一些介绍,这里就 不再介绍了。 定义2 1 所有参与者的集合定义为大写,即i = 1 ,2 ,聆) 。 定义2 2 将每一个参与者所有可用的策略集合定义为策略空间,用大写 的s 表示。 定义2 3 每一个参与者得到多少收益取决于所有参与者的策略组合,策 略组合与收益之间的关系,用收益函数u ( s ,s :,s 。) 来表示。, 定义2 4 博弈表达的基本式由参与者集合,、策略空间s 和收益函数u 三 个要素组成,即f = ,s ,u ,其中,= 1 , 2 ,刀 ,s = s 1 ,s 2 ,s 。 , u = u 。,u 2 u 。 。收益函数u ,:s 专r ,它表示第f 位参与者在不同策略组 合下所得到的收益。有时我们也把搏弈表达的基本式写作: f = s l ,s 2 ,s 。;甜l ,u 2 ,u 。) 另外,对于参与者的策略还分为纯策略和混合策略,纯策略是最基本的 策略,它不能分解为更小的策略;而混合策略则是参与者策略空间s ,中全部 纯策略的概率分布,它能够分解为更小的策略。 定义2 5 对于博弈f = ,s ,u ,假设s ,= s 肿) ,那么参与者f 的一 个混合策略为映射p 。:s ,一【0 ,1 ,即以p ,( 0 ) 的概率取s 中的纯策略s 诸, k 。 其中p ,( s ,。) = l 。混合策略也可以表示为p ,= ( 死l 一,p 膈) ,其中对于所有 k = l 的k = 1 ,k ,0 p | 七l ,且p 订+ + p 联= l 3 1 。 上面五个定义只是博弈论中的一些基本概念,是为我们下面研究纳什均 衡做准备的,下面我们进入本章的主题纳什均衡。 2 2 严格优策略均衡与一般均衡 因为均衡对所有各方来说是最优的,所以各参与者都会想方设法回到均 8 哈尔滨t 稗人学硕十学位论文 衡状态,这就说明一个博弈的最后结果最有可能是一个均衡状态,而严格优 策略均衡是最简单的均衡概念。 什么是严格优策略均衡呢? 我们还是用第1 章提过的囚徒困境来加以说明。由前面的介绍我们容易 知道这个案例的均衡解是( 坦白,坦白) 。 定义2 6 在博弈f = ,s ,谚中,在其他参与者任意给定的策略组合下, 即v s 一,= ( s i ,一,s ,- l ,s ,+ l ,s 。) s 一。= ( s ,s ,_ l ,s + l ,s 。) ,参与者f 存在一 个策略s j 使得对于v s ,s ,s j s 。,都有: 甜,( j l ,j ,。,j n ) t 2 ,( j l ,占,j n ) 我们就称s ? 为参与者f 的严格优策略。 。 在囚徒困境中,无论囚徒b 的策略是什么,囚徒a 选择坦白所得到收益 都要大于选择抵赖,所以坦白是囚徒a 的严格优策略。对于囚徒b 而言,无 论囚徒a 选择什么策略,囚徒b 选择坦白都要优于抵赖,所以囚徒b 的严格 优策略也为坦白。显然( 坦白,坦白) 构成了囚徒困境的一个均衡解。通过 对囚徒困境的分析,很容易得到一个一般性的结论,即如果一个博弈中的所 有参与者都存在严格优策略,那么严格优策略组合一定是该博弈的唯一均衡 解【8 1 。 命题2 1 如果在一个博弈基本式f = ,s ,u ) 中,每个参与者都存在严格 优策略,那么严格优策略组合一定是该博弈唯一的均衡解。 证明:假设一个博弈为f = ,s ,“ 中,其中每个参与者都存在严格优策 略。根据定义可知严格优策略具有唯一性,如果不是那就意味着某个参与者f 至少有两个严格优策略,不妨设它们分别为s :和s ? ,根据严格优策略的定义, 可知: “,( s j ,s 一,) “( s ? ,s 一,) 甜,( s ? ,s 一,) “( s ? ,s f ) 显然这是自相矛盾的。因而严格优策略具有唯一性。由于严格优策略具 有唯一性,因而每一个参与者假如不选择严格优策略,将意味着他得到的收 益不为最优,显然这与参与者是理性的相矛盾,从而命题得证。 定义2 7 在博弈f = ,s ,甜) 中,如果对所有参与者f 而言,都存在s :为 严格优策略( 其中v i i ) ,那么策略组合s = ( s ? ,s j ,s :) 就称为严格优 9 哈尔滨1 :稃大学硕+ 学位论文 策略均衡。 在这些情况下,优策略也可能形成均衡,而不一定必须是严格优策略, 但也可能出现多重均衡。 定义2 8 在博弈f = ,s ,u ) 中,如果对参与者f 而言,在其他参与者任 意给定的策略组合下,即 ? v s 一,= ( s l ,一,s ,s 川,s 。) s 一,= ( 墨,s - l ,s + l ,s 。) ,存在一个策略 s ? 使得对于v s ,s ,都有:“,( j l ,一,s :,s 。) u t ( s l 一,s ,s 。) ,并且至 少存在一个s ? 使得上述不等式严格成立。我们就称s ;为参与者;的优策略【3 1 。 如果参与者只存在优策略而不是严格优策略,那么一个可能的后果是博 弈不存在唯一的均衡解,从而使得我们无法对博弈的结果作出明确的预测。 极端的情况是博弈有可能出现各种各样的结果,这时理论的力量就丧失掉了。 而什么又是一般均衡呢? 一般均衡是经济学中一个很重要的概念。最早 的一般经济均衡里出现于w a l r a s 的纯粹政治经济学要义中,他综合他以 前运用数学方法来研究经济学的观点,提出了一般经济均衡里论。而真j 下意 义上的一般均衡理论体系的建立,是在a r r o w d e b r e u 利用不动点定理和数学 公设的方法证明了一般经济均衡的存在性后,才使得这一理论得到了快速发 展。一般均衡理论所建立的一般均衡体系不仅是唯一的,而且是稳定的。作 为经济最优解来说,一般均衡作为理论结果为我们提供了经济体系分析的有 力工具。目前,一般均衡理论是数理经济学中的一个高度的技术性分支,它 研究的是多市场均衡的抽象性质;多市场均衡的存在性、若存在是否惟一、 若惟一是否稳定等问题。 如果经济处于完全竞争条件下,所有市场上的买者和卖者都是价格的接 受者,当经济中出现一组价格( 包括所有商品和要素的价格在内) ,能使所有 消费者对商品组合的选择和生产者对投入产出组合的选择满足下列条件时, 整个经济便达到了一般均衡状态: ( 1 ) 每一消费者都在其既定收入下达到了效用最大化: ( 2 ) 每一厂商都在其生产函数决定的投入产出组合下达到了利润最大 化; ( 3 ) 所有市场同时出清,即各自的供求都相等; ( 4 ) 每一厂商都只获得正常利润,即其经济利润为零。 1 0 哈尔滨。l :程入学硕+ 学位论文 第一、第二两个条件是说消费者和厂商必须处于均衡状态。第三个条件 保证了所有市场的供求相等,它意味着所有市场都有一个稳定的价格。第四 个条件则意味着经济中不再有市场上扩大或减少其产量的动机。一般均衡状 态的实现有两个重要的假定前提: ( 1 ) 市场完全竞争的假定; ( 2 ) 是资源具有稀缺性的假定。 前者至少在理论上保证了市场机制的充分作用,从而使一般均衡状态能 够实现;后者则把资源的分配和经济效率问题引入经济活动之中,从而使一 般均衡过程的研究具有了必要性【,o 】。 2 3 纳什均衡的定义与性质 定义2 9 一个策略组合j = ( s i ,s :,s :) ,如果对于每一个参与者 f = 1 , 2 ,玎,对于所有的8 ,墨,不等式甜,( s ;,s :,) “,( s ,s :,) 都成立,那么s 就是博弈f = ,s ,甜 的一个纳什均衡。 纳什均衡是博弈论的精髓,所以研究纳什均衡的性质也就变得非常重 要。 性质1( 一致预测性) 在博弈f = ,s ,甜) 中,每一个局中人f 的实际行 为选择与他们的预测一致。 我们还是用囚徒困境来说明这个性质,假设两个囚徒都是理性的,囚徒 a 预测到选择坦白他得到的收益会大于抵赖所得到的收益,那么他就会选择 坦白,而不会选择跟自己的预测相反的结果,同理囚徒b 也会选择跟自己预 测结果一致的坦白,这就是纳什均衡的一致预测性。 而这里说的一致并不是不同博弈方的预测相同、无差异。 例如:如果两囚徒事先已经达成了共谋,一起抵赖,囚徒a 遵守了这个 约定,认为抵赖会给自己带来最大的收益,而b 却知道如果自己坦白a 抵赖, 自己就会被释放,那么他可能就放弃事先的约定,打算坦白交代,这样两个 人就会有不同的预测。 性质2 博弈f = ,s ,“) 存在严格优策略均衡s = ( s :,s ? ,s :) ,那么 哈尔滨t 稗大学硕十学位论文 它一定是一个纳什均衡,但反之不成立。 证明:( 反证法) 已知策略组合s = ( s :,s j ,s :) 是博弈f = ,s ,z i f ) 的严格优策略,但 不是纳什均衡。我们不妨假设纳什均衡为s 。= ( s ? 9o * s ? ,s :) 。根据严格优 策略的定义可知,一定存在参与者f _ 1 , 2 ,胛有: u ( s ? ,5 1 ,) ”,( s ? ,s ! 。) 而根据纳什均衡的定义,一定有: “,( s ? ,j 三) 甜,( j ? ,j 三) 显然这是自相矛盾的。 要证第二个观点,我们不妨假设纳什均衡一定是严格优策略均衡。只要 找出一个反例,这个假设就自然得证。下面我们就举这样一个例子斗鸡 博弈。 在美国,一些飞车党党徒为了表示勇敢,通常有两个人分别驾驶两辆摩 托车从相反的方向极速对撞。如果一方怕死而首先让道那么让道的人就会被 称为小鸡,如果两人同时让道,那么两个人同时被称为小鸡。小鸡会备受歧 视,而不怕死的人则会受到众人推崇。在这个博弈中如果两个人都不让道, 有可能都下地狱,或是残废,收益为一w ;如果主动让道,又会受到大家的 嘲笑,做人抬不起头,收益为一1 0 ,如果不让道成为勇敢者,会受到大家尊 敬,收益为+ 1 0 。 显然这个博弈的纳什均衡为( 让,撞) ,( 撞,让) ,而这个博弈却不存 在严格优策略均衡,所以纳什均衡不一定是严格优策略均衡。 在看下一个性质之前我们先了解一个定义。 定y 2 1 0 在博弈f = ,s ,u ) 中,s :和s :为参与者f 的两个可行策略,即 了s :,s ;s ,。如果对于v s 一,s 一有“,( s :,s 一,) 甜。( s ? ,s a 那么s :就称相对于 1 2 哈尔滨t 程大学硕十学位论文 策略s :的严格劣策略。 作为理性者,显然没有哪个参与者会选择严格劣策略,因而我们可以将 严格劣策略从参与者的策略空间中剔出。通过不断剔除严格劣策略就可能最 终得到博弈的均衡解。这就是重复剔除严格劣策略法。 性质3 如果策略组合鼍= ( j ? ,s ? ,s :) 为博弈f = ,s ,甜) 的纳什均 衡,它一定不会被重复剔除严格劣策略的方法剔除掉:如果进行了重复剔出 严格劣策略后剩下惟一策略组合,那么这个策略组合一定是纳什均衡。 证明:( 反证法) 如果策略组合s = ( s :,s ? ,s :) 为博弈f = ,s ,“) 的纳什均衡,但却 在重复剔除严格略策略的过程中被剔除。这意味着在重复剔出严格劣策略的 某个阶段,存在某个参与者f i 有: 1 1 ( s ? ,s j ) u t ( s ? ,j f ) 也就是1 i ( s ? ,s :,) u l ( s ? ,s :。) 成立。 显然这与s = ( j :,s ? ,s :) 为博弈1 1 = ,s ,“) 的纳什均衡相矛盾。 如果重复剔出严格劣策略后剩下唯一的策略组合不是纳什均衡,那就意 味着纳什均衡在重复剔出严格劣策略的某个阶段已被剔除,显然这与我们前 面证明的纳什均衡能够在重复剔出严格劣策略中保存下来相矛盾。性质得证 o f f :+ - j lo 另外,对于纳什均衡还有一个极其重要的性质,那就是纳什存在性定理, 也称纳什定理,它是1 9 5 0 年由纳什率先提出。 性质4 ( 纳什定理) 在一个有n 个博弈方的博弈f = ,s ,u ) 中,如果丹是 有限的,且s ,都是有限集( 对f _ 1 , 2 ,r ) ,则该博弈至少存在一个纳什均 衡,但可能包含混合策略【7 1 。 用更通俗的语言,这个性质就是说“每一个有限博弈都至少有一个混合 策略纳什均衡”。对于这个性质的证明要引入角谷不动点定理所以在证明 哈尔滨t 程大学硕十学位论文 性质4 之前我们先看两个引理。 引理2 1 ( 布鲁威尔不动点定理) 设f ( x ) 是定义在集合x 上的实函数, 且f ( x ) x ,v x x 。如果f ( x ) 是连续的,x 为一非空有界凸闭集,则至少存 在一个x x 使f ( x ) = x 。即f ( x ) 至少存在一个不动点1 2 0 1 。 引理2 2 ( 角谷不动点定理) 令s 是一个有限维向量空间中任一非空有 界闭凸子集。设f :s s 是任一上半连续的点到集对应,且对s 中每个x , f c x ) 都是s 的一个非空凸子集。那么,s 中一定存在某个x 使得x f ( x ) 。 下面我们就可以利用引理来证明性质4 了。 性质4 的证明过程可以用下述方式来表达:每个n 个博弈方的博弈组成的 策略组合,都是由n 个博弈方的策略空间相乘得到的”维乘积空间中的一个 点。对每个这种策略组合,都可以找出由n 个博弈方对它的最佳反应策略构 成的一个或多个策略组合,都可以找出由n 个博弈方对它的最佳反应策略构 成的一个或多个策略组合,这就形成了一个从上述乘积空间到它自身的一对 多的影射。由于引进混合策略以后,在期望得益的意义上得益函数都是连续 函数,因此影射的图形是封闭的( 闭集) 且每个点在影射下的影像都是凸集 【2 5 l 。根据角谷的不动点定理,可知该影射至少有一个不动点,这个不动点就 是一个纳什均衡策略组合。 角谷的不动点定理,实际上就是关于一维空间上影射的布鲁威尔不动点 定理,在门维空间映射上的推广,其意义是在刀维空间的有界闭凸集上的连 续影射,至少存在一个不动点,即影像与原像是同一点。因为在混合策略的 意义上,博弈方之间的策略反应构成的正是,z 维空间上的连续影射,因此根 据角谷的不动点定理,这种影射至少存在一个不动点,而这种不动点就是混 合策略意义上的纳什均衡。 在纳什存在性定理中,我们只谈及到包括混合战略均衡在内的纳什均衡 存在性问题,除此之外,许多博弈不一定是有限博弈,一些常见的博弈的纯 战略空间通常都是无限集。在纳什定理之后,其他研究者还得到许多进一步 的结果,其中最具代表性的就是d e b r e u 于1 9 5 2 年提出的纳什均衡存在性定 理【1 9 】。 性质5 ( d e b r e u 定理) 在强人战略式表述博弈g = ,s ,豁 中,如果纯 战略空问s i 是欧氏空间上的非空紧致凸子集,效用函数u 。是连续的且对s ,是 1 4 哈尔滨i i 样大学硕十学付论文 拟凹的( 汪l ,z ) ,则g 存在一个纳什均衡。 一般地,当函数s ( x ) 满足下述性质时,我们称其为凹的: 厂( 钕。+ ( 1 一无h :) x s o 。) + ( 1 一x ) i ( x :l z 【0 ,1 】而,x :r ” 如果当允( o ,1 ) 时上面的不等式严格成立,则称s ( x ) 为严格凹的。一个 函数s ( x ) 是凸的当且仅定函数- s ( x ) 是凹的;厂g ) 为严格凸函数当且仅当 r ( x ) 为严格凹函数。 拟凹函数是凹函数概念的一种推广,它包括了凹函数在内的一大类函数, 而这类函数在经济学中有着广泛应用,关于拟凹函数的定义如下: 定义2 1 1 函数s ( x ) 定义在r n 中的子集d 上,当且仅当厂0 ) 满足如下性 质时,s ( x ) 是拟凹的: 厂( 触。+ ( 1 一x ) x :) m i n ( f ( x 。) ,厂g :) )旯【o ,| 1 2 6 , 显然,凹函数是拟凹的,但反过来并不成立,即拟凹函数不一定是凹函 数。在图2 。1 中,函数i ( x ) 是拟凹的,但不是凹的。 o 图2 1 不是凹函数的拟凹函数 在性质5 中,与性质4 相比,我们增强了对效用函数“性质的假设,于 是获得更进一步的结论,即保证了存在的纳什均衡还是纯策略博弈纳什均衡。 在有限博弈场合,即使纯策略空间可能是非凸的,支付函数也可能是非连续 的,但混合策略空间是欧氏空间上的非空有界闭凸集,期望效用函数是连续 的,拟凹的。当纯策略空间本身是欧氏空间上一个非空的,闭的,有界的凸 哈尔滨下稗大学硕十学位论文 集且效用函数在纯策略空间上是连续的,拟凹的时,就没有必要引入混合策 略了。 2 4 纳什均衡与一般均衡的关系 我们在上一节中已经介绍了一般均衡的定义与条件,我们知道,一般均 衡是以完全竞争的市场环境和以价格体系调节供求关系的市场机制为前提 的,因此我们要在两个假设条件下来考虑纳什均衡与一般均衡的关系。 2 4 1 自由竞争的市场条件 首先我们先来建立交换经济系统模型,给定局中人集n = 0 ,1 ,所 ,其 中o 表示市场。假设: ( 1 ) 局中人f 的全体可行方案集x ,是群= xix ,o ,= 1 ,所 的非空、 紧致、凸子集,f = 1 , 2 ,聊;江0 的全体可行方案集是x 。= s ”1 ,这是因为 市场具有调节价格的功能; ( 2 ) 局中人f 的效用函数“,( 而,五,x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论