博弈论3 完全且完美信息动态博弈.ppt_第1页
博弈论3 完全且完美信息动态博弈.ppt_第2页
博弈论3 完全且完美信息动态博弈.ppt_第3页
博弈论3 完全且完美信息动态博弈.ppt_第4页
博弈论3 完全且完美信息动态博弈.ppt_第5页
已阅读5页,还剩154页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章 完全且完美信息动态博弈,所有博弈方都对博弈过程和得益完全了解的完全且完美信息动态博弈。这类博弈也是现实中常见的基本博弈类型。由于动态博弈中博弈方的选择、行为有先后次序,因此在表示方法、利益关系、分析方法和均衡概念等方面,都与静态博弈有很大区别。,3.1 阶段和扩展性表示,阶段:动态博弈中一个博弈方的一次选择行为 例 1:仿冒和反仿冒博弈 模型描述:略 扩展式表示:,例2:市场进入阻挠(动态博弈),假设条件: 企业A、企业B经营同样产品 企业A已占领市场;企业B想打进该市场 企业A完全知道企业B的行为 分析: 企业A与企业B对市场的占领有先有后,因此该 博弈又称为:“先来后到博弈,市场进

2、入阻挠博弈的扩展形 Cont,圈B与圈A分别是 企业B与企业A的 决策结或选择节 点 (又称决策信 息集或选择信息 集), 即两博弈方 各自轮到选择 的位置.,博弈树 (1)结 (2)枝 (3)信息集,A,A,B,A,A,A,B,3.1.1动态博弈的表示法和特点,动态博弈 (Dynamic Games)的定义: 博弈方的策略选择和行动有先后次序,而且后选择、后行动的博弈方在自己选择、行动之前,可以看到其他博弈方的选择、行动,甚至还包括自己的选择、行动的博弈.,注:动态博弈各个博弈方的选择行动有先后次序,每个博弈方的选择行为会形成依次相连的时间阶段,因此博弈方的一次选择称为一个“阶段”。也有可能

3、存在几个博弈方同时选择的情况,这些博弈方的一次选择也构成一个“阶段” 。 一个动态博弈至少有两个阶段。因此态博弈又称为多阶段博弈(Multistage Games),3.1.2 动态博弈的基本特点,一、动态博弈的策略 1、完全信息静态博弈的策略和结果(略) 2、动态博弈的策略特点: 各博弈方的选择和行为 (1)行为有先后之分(2)博弈方要多次选择且每次选择有内在联系,是不能分割的整体。 注:各博弈方在整个博弈中轮到选择的每个阶段,针对以及由不同博弈方的这种计划构成的组合。这种计划就是动态博弈的博弈方的策略,Cont.,二、动态博弈的结果 指各博弈方在上面类型的策略构成的策略组合下,各博弈方的策

4、略组合形成的一条联结各个阶段的“路径”的结果。 三、动态博弈的非对称性 先后次序决定动态博弈必然是非对称的。 先选择、行为的博弈方常常更有利,有“先行优势”。,3.2 可信性和纳什均衡的问题,3.2.1 相机选择和策略中的可信性问题 3.2.2 纳什均衡的问题 3.2.3 逆推归纳法,3.2.1 相机选择和策略中的可信性问题,在实施中,只要符合自己的利益就可以在博弈过程中改变计划。这种问题称为“相机选择”(Contingent play) “相机选择”的存在,使得博弈方在各个阶段、各种情况下会采取行为的“可信性”产生怀疑?,一、开金矿博弈I的扩展形,模型描述: 甲开采一价值4亿元的金矿 时缺1

5、亿元资金,乙有1亿元可 投资资金。甲希望乙能投资自 己1亿元资金用于开矿, 并许诺在采到金子后与乙对半分成 问题:乙是否该将钱投资给甲呢?,二、有法律保障的开金矿博弈II的扩展形,确实可信的威胁通过法律武器 确实可信的威胁 (credible threat) 是指,博弈的参与人通过 某种行动改 变自己的支付函数, 从而使得自己的 威胁显得可信。参与人为改变博弈结 果而采取的措施称为承诺 (commitment),乙的完整策略:第一阶段 选择“投资”,若第二阶段甲 选择“不分”,第三阶段选择“打” 甲的完整策略:第二阶段选择“分”。 动态博弈的解。,三、法律保障不足的开金矿博弈III的扩展形,不

6、可信的空头威胁 乙在第三个阶段 “打官司”的威胁 是一种不可信的 空头威胁 (incredible empty threats),3.2.2 纳什均衡的问题,博弈中(不投资-不打, 不分) 和(投资-打,分) 都是纳什均衡。 但后者不可信, 不可能实现或 稳定。为什么会出现这种情 况呢?,结论:纳什均衡在动态博弈 可能缺乏稳定性,也就是说, 在完全信息静态博弈中稳定的纳什均衡,在动态博弈中可能是不稳定的,不能作为预测的基础。,Cont.,根源:纳什均衡本身不能排除博弈方策略中包含的不可信的行为设定,不能解决动态博弈的相机选择引起的可信性问题,3.2.3 逆推归纳法,定义:从动态博弈的最后 一个

7、阶段博弈 方的行为开始分析, 逐步倒推回前一个 阶段相应博弈方的行为选择, 一直到第一个阶段的分析方法, 称为“逆推归纳法”,逻辑基础:动态博弈中先行为的理性的博 弈方,在前面阶段选择行为时必然会考虑 后行为博弈方在后面阶段中将会怎样选择行为,只有在博弈方的最后一个阶段选择的,不再有后续阶段牵制的博弈方,才能直接做出明确选择。 注:逆推归纳法是动态博弈分析最重要、基本的方法。,3.3 子博弈和子博弈完美纳什均衡,3.3.1 子博弈 3.3.2 子博弈完美纳什均衡,3.3.1 子博弈,定义:由一个动态博弈第一阶段以外的 某阶段开始的后续博弈阶段构成 的,有初始信息集和进行博弈所 需要的全部信息,

8、能够自成一个 博弈的原博弈的一部分,称为原 动态博弈的一个“子博弈”。,注: (1)并不是任何博弈都有子 博弈 (2)博弈本身不是子博弈 (3)必须有一个明确 的初始的信息集,3.3.2 子博弈完美纳什均衡1965年selton,定义:如果一个完美信息的动态博弈中,各博弈方的策略构成的一个策略组合满足,在整个动态博弈及它的所有子博弈中都构成纳什均衡,那么这个策略组合称为该动态博弈的一个“子博弈完美纳什均衡”。,子博弈完美纳什均衡能够排除均衡策略中不可信的威胁和承诺,因此是真正稳定的。 逆推归纳法是求完美信息动态博弈子博弈完美纳什均衡的基本方法。,3.4 几个经典动态博弈模型,3.4.1 寡占的

9、斯塔克博格(Stackelberg)模型 3.4.2 讨价还价博弈 3.4.3 委托代理理论 3.4.4委托代理理论(续),3.4.1 寡占的斯塔克博格(Stackelberg) 模型,假设市场上有两个厂商,决策内容是产量, 一个是领头(leader)企业,一个是跟随 (follower)企业。领头企业先选择自己的 产量,跟随企业根据领头企业的产量选择, 选择自己的产量。 显然,他们选择有先有后,所以是一个 动态博弈。,斯塔克博格(Stackelberg)模型,假设条件: 在一个寡头市场上两企业生产销售同质产品,市场总产量Q =q1+q2 ,企业1是领头(leader)企业, 企业2是追随(f

10、ollower)企业. 2. 市场出清价格 P=8 - Q 3. 生产无固定成本,边际成本 c=c1=c2=2 4. 二企业先后决定各自的产量q10, q2 0 问题:两个企业应如何决策? 该动态的寡头市场产量博弈是一无限策略动态博弈,Stackelberg模型分析,企业1的得益(利润): u 1 (q1, q2) =Pq1c1q1 = (8-Q) q1 - 2q1 = 6 q1- q1 q2- q12 企业2的得益: u 2 (q1, q2) = Pq2 c2q2 = (8-Q) q2 - 2q2 = 6 q2- q1 q2- q22,用逆推归纳法 求子博弈完美纳什均衡,在第2个阶段,企业2

11、是在企业1选择定 q1下求解: max q2 u 2 (q1, q2) = max q2 (6 q2- q1 q2- q22) 一阶条件: 6- q1 - 2q2=0 有企业2对企业1产量的反应函数: q2= ( 6 - q1 ) /2 = 3 - q1 /2 (1),Cont.,将式(1)代入企业1的的得益函数 u 1 (q1, q2) = 6 q1- q1 q2-q12 =3 q1 q12 /2 max q1 (3 q1 q12 /2) 一阶条件: 3 - q1*= 0 有 q1*=3 (单位), q2*=3 - q1* /2 = 1.5 (单位), 使 u 1= 4.5 , u 2 =

12、2.25 使市场总产量 Q =q1+q2=4.5, 得二企业总得益 U = u 1 + u 2 =4.5+2.25=6.75,模型的均衡解,Stackelberg寡头竞争模型的子博弈完美纳什均衡解: 企业1在第1个阶段选择产量q1为3 单位, 企业2在第2个阶段选择产量q2为1.5单位,产量 得益 厂商1 3单位 4.5 厂商2 1.5单位 2.25,先行优势,信息的悖论,在Stackelberg模型中企业1与2得益: u1= 4.5 u2 = 2.25 信息不对称的博弈中,信息较多的博弈方有可能吃亏 即是:尽管跟随企业看到了领头企业的决策,掌握了更多的信息,但最终收益反而低。,与Courno

13、t模型的比较,与Cournot静态博弈模型的比较 Qs=3+1.5=4.5 Qc=2+2=4 Ps=8 - Qs=3.5 Pc=8 - Qc=4 Us= us1 + us2 =4.5+2.25=6.75 Uc= uc1 + uc2 =4 + 4 = 8,文献阅读,中国3G时代运营策略分析 供应链企业的竞争与合作 电力市场寡头竞争模型的市场力分析比较,3.4.2讨价还价与耐心,Bargaining问题的普遍性,几乎所有的交易都涉及讨价还价: 买卖双方之间; 雇员与顾主之间; 合伙人之间; 竞争企业之间 夫妻之间; 政治领域之间; 中央政府与地方政府; 国家之间;,所有讨价还价的共同之处,达成某种

14、协议是当事人的共同利益,但他们之间在究竟达成哪一个协议的问题上存在利益冲突;协议的多重行可能阻止任何协议的出现; 典型的“合作与竞争”问题; 合作意味着存在着帕累托改进,但不同的当事人偏好不同的帕累托状态。 不同与集体选择(唯一均衡)和其他多重均衡; 不是零和博弈。,两种思路,合作博弈思路(cooperative game approach):参与人联合作出决定,协议对双方具有约束力;强调的是集体理性; 非合作博弈思路(non-cooperative approach):每个参与人独立决策,协议是一个纳什均衡,没有约束力;强调的是个人理性; 注意:这里“合作”与“非合作”指的是“联合决策”(j

15、oint action)和“独立决策”(separate action)。,纳什合作解,考虑一个画家与拍卖商之间的讨价还价问题:如果画家自己出售画,可得1000元;如果拍卖商干其他事情(如拍卖别人的画),收入是500元;如果画家委托拍卖商出售画,画的价格是3000元。 他们之间如何分配这3000元? 请同学们给出建议。,问题的一般化,设想两个人,A和B,之间要就总价值等于V的分配问题讨价还价;如果他们之间能达成协议,V按照协议规定分配;如果不能达成协议,A得到a,B得到b。(a,b)被称“威胁点”或非合作状态(status quo),是不能达成协议是的最好选择. a+bV; S=V-a-b是合

16、作带来的剩余(surplus),分配规则,我们用x表示A得到的价值,y表示B得到的价值,假定A和B分别从剩余价值S中达到h和k的份额,那么: x=a+h(V-a-b);x-a=h(V-a-b) y=b+k(V-a-b);y-b=k(V-a-b),分配方法之一:纳什谈判模型,对n2的多人谈判问题,Nash-Harsanyi谈判模型为: 上述模型的解称作Nash平衡解。,分配方法之二:等效用法(Kalai,1975),对一般的非规范化谈判问题,设威胁点为(Xc,Yc),谈判集为x=g(y),谈判集中甲、乙两个谈判者的最大效用分别是Xmax与Yman,则,协议点为方程组的解,示例 用等效用法求解图1

17、3.2之(b)所示的谈判问题,用有关数值代入可得 该方程组的解为(2/3,1/3),它就是用等效用法求得的协议点。,分配方法之三: 中间中间法,略,固定谈判成本,谈判的另一类成本是固定成本,如劳资谈判拖延的话,企业可能要为客户支付违约金。 这类似于蛋糕随时间而变小。,谈判成本不同,如果A每次谈判成本是c,B每次的谈判成本是d; 如果c=d,结果是不确定的; 如果cd,B 将得到整个蛋糕;,外部机会成本,固定成本的一种特殊形式是外部机会损失:如果谈判期间,外部机会就不能利用。 此时,外部机会损失越大,对谈判越不利; 考虑夫妻离婚谈判。,信息与谈判,原因是:我们前面假定当事人具有完全信息:知道价值

18、V和每个人的机会成本或谈判砝码,每个人的耐心,谈判的时限等等。并且,每个人知道每个人知道;每个人知道每个人知道每个人知道,如此等等。 但在现实中,谈判面临的最大问题是信息不完全。 价值V,生产成本,谈判砝码(a,b),耐心,机会成本;,谈判与信息,谈判的过程实际上是信息揭示和窥探的过程; Screening and Signaling (沈阳的砍价公司) 由于信息不对称,谈判的结果并不总是帕累托最优的;事实上,许多帕累托改进没有被利用。,非合作博弈思路,谈判实际上是一个讨价还价的过程,一个动态博弈; 用非合作博弈的方法更合理;,轮流出价谈判,基本特征:两人,1和2,分一块钱;1先出价,2决定接受还是拒绝;如果接受,按照A提出的方案分配,谈判结束;如果2拒绝,2提出方案,1决定接受还是拒绝;如果接受,按2的方案分配,谈判结束;如果不接受,再由1提出方案;如此等等。 博弈有无穷多个纳什均衡,但精炼纳什均衡可能是唯一的。,变量说明,我们先考虑没有固定谈判成本的情况; 假定 x:1得到的份额; y:2得到的份额;x+y=1 s:1的无风险利率; a=1/(1+s):1的贴现因子; r:2的无风险利率; b=1/(1+r):2的贴现因子;,有限期谈判,如果只有一次谈判:逆向归纳意味着精炼纳什均衡是:x=1,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论