虚拟解释变量模型蓝色_第1页
虚拟解释变量模型蓝色_第2页
虚拟解释变量模型蓝色_第3页
虚拟解释变量模型蓝色_第4页
虚拟解释变量模型蓝色_第5页
已阅读5页,还剩98页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

虚拟解释变量模型蓝色第一节引言

在经济计量分析中,经常会碰到所建模型的被解释变量不仅受诸如收入、产量、价格、成本、需求、投资等数量变量的影响,而且也受到诸如战争、自然灾害、国际环境、季节变动以及政府经济政策变动等质量变量的影响。建立经济计量模型若不考虑这些质量变量的影响作用,显然是不适宜的。第2页,共103页,2024年2月25日,星期天所以,在建立经济计量模型时,即要考虑数量变量,也要考虑质量变量。但是,质量变量和数量变量不同,数量变量可以在事前规定好的尺度上,用不同的数值表现出来,质量变量却只能以属性、种类的不同具体形式表现出来。第3页,共103页,2024年2月25日,星期天例如,性别可表现为男或女;人种可表现为白种人和非白种人;宗教信仰可表现为教徒和非教徒;政府的经济政策可表现为改革开放前和改革开放后,如此等等。第4页,共103页,2024年2月25日,星期天

显然,这种不同的具体形式是无法直接引入经济计量模型中去的。但由于这类变量通常表现为品质、属性、种类的出现或者未出现,所以我们可以根据质量变量的这一特征将其数量化。第5页,共103页,2024年2月25日,星期天

虚拟变量:给定某一质量变量某属性的出现为1,未出现为0,称这样的变量为虚拟变量。第6页,共103页,2024年2月25日,星期天把哪种情况取0,哪种情况取1要视研究情况而定。0和1只是一个符号而已,不代表他们有高低的意义。第7页,共103页,2024年2月25日,星期天虚拟变量主要是用来代表质的因素,但是有些情况下也可以用来代表数量因素。例如建立储蓄函数时,“收入”显然是一个重要解释变量,虽然是“数量”因素,但是为了方便也可以用虚拟变量表示。第8页,共103页,2024年2月25日,星期天虚拟解释变量模型的设定因为质的因素的多少和这些因素特征的多少而引入的虚拟变量也会不同。第二节虚拟解释变量的设定第9页,共103页,2024年2月25日,星期天以一个最简单的虚拟变量模型为例,如果只包含一个质的因素,而且这个因素仅有两个特征,则回归模型中只需引入一个虚拟变量。如果是含有多个质的因素,自然要引入多个虚拟变量。第10页,共103页,2024年2月25日,星期天如果只有一个质的因素,且具有m个特征,那么如果是含有截距项的,就要引入m-1个虚拟变量;不含有截距项的,应该引入m个虚拟变量,这就是虚拟变量的设定原则。第11页,共103页,2024年2月25日,星期天一、截距变动模型和斜率变动模型(一)包含一个虚拟变量的截距变动模型假设只有一个定性因素影响被解释变量的变化,而且这个因素仅有两种特征,这时候只需要引入一个虚拟变量。

第12页,共103页,2024年2月25日,星期天

【例8.1】假设有一个包括正常年份和非正常年份(亚洲金融危机或SARS的影响)居民消费的样本,并打算用这些数据估计消费函数。由于在正常年份和非正常年份居民在消费水平上存在明显差异,所以一些外界的影响是一个重要的解释变量。

第13页,共103页,2024年2月25日,星期天

用一个虚拟变量来表示这个质的因素,消费函数为

式中,Yi=第个居民的消费水平,Xi=第个居民的收入水平,D为虚拟变量。我们用D=1表示正常年份这一特征,用D=0来表示非正常年份(8.1)第14页,共103页,2024年2月25日,星期天假设E(ui)=0,式(8.1)可以写成(8.3)(8.2)第15页,共103页,2024年2月25日,星期天式(8.2)和式(8.3)分别为正常年份和非正常年份的居民消费水平。二者具有相同的斜率,但是截距不同。第16页,共103页,2024年2月25日,星期天对β1作t检验,若β1显著地不为0,我们就认为正常年份和非正常年份居民在消费行为上的差异是明显的。若β1

>0,则正常年份的居民消费水平高于非正常年份的居民消费水平。

利用最小二乘法对式(8.1)进行估计,可得到(8.4)第17页,共103页,2024年2月25日,星期天通过例8.1,我们可以找出虚拟变量模型的一些特征。

1.用“1”来代表质的因素的哪个特征是可以任意设定的。我们一般认为,“1”代表具有某些特征,但没有具体规定。在上例中,也可以指定D=1时为非正常年份,而D=0就必然为正常年份。在这种情况下,正常年份和非正常年份的消费函数分别为第18页,共103页,2024年2月25日,星期天如果我们绘制图形,得到的结果仍然是一样的。此时,β1<0,非正常年份的线低于正常年份的线,代表非正常年份的消费水平低于正常年份的消费水平。第19页,共103页,2024年2月25日,星期天2.虚拟变量D=0所代表的特性或状态通常称为基础类型。和其它特征或状态比较的意义上说,基础类型为对比的基础。第20页,共103页,2024年2月25日,星期天模型中的系数β0为基础类型的截距项,称为公共截距项;系数β1称为差别截距系数,指的是D取1时截距系数和基础类型的截距系数的差异。第21页,共103页,2024年2月25日,星期天

3.如果一个回归模型有截距项,而且这个质的因素又有两种特征,也就是将其分两类,则我们只需要引入一个虚拟变量。如我们的例8.1所示。如果一个回归方程有截距项,只有一个质的因素影响被解释变量,它有个m特征,我们就要引入m-1个虚拟变量;

第22页,共103页,2024年2月25日,星期天如果回归方程没有截距项,那么这个质的因素有多少个特征就要设多少个虚拟变量,这就是虚拟变量的使用原则。第23页,共103页,2024年2月25日,星期天虚拟变量陷阱:如果虚拟变量设定不当,会使最小二乘法无解,称这种情况为虚拟变量陷阱。第24页,共103页,2024年2月25日,星期天引入两个虚拟变量对有截距项和没有截距项的情况分别讨论。

(1)对有截距项的情况,我们如果设两个虚拟变量,则回归模型为(8.7)第25页,共103页,2024年2月25日,星期天式(8.7)也可表示为其中,,显然如下等式成立。

(8.8)(8.9)第26页,共103页,2024年2月25日,星期天式(8.9)表明模型(8.8)即原模型(8.7)中有完全的多重共线性,将导致最小二乘估计无解。我们称该情景为掉入虚拟变量陷阱。所以,在有截距项的情况下,如果一个质的因素有多少个特征就引入多少个虚拟变量是行不通的。第27页,共103页,2024年2月25日,星期天

(2)对没有截距的情况,我们如果设两个虚拟变量,显然模型(8.10)中,解释变量D1,D2和X之间无完全的多重共线性。可以使用普通最小二乘法估计式(8.10)的参数。

(8.10)第28页,共103页,2024年2月25日,星期天(二)斜率变动模型在实际问题中,斜率单独变动出现的情形一般比较少,它指的是改变了变动的速率也就是弹性。例如城镇居民家庭与农村居民家庭的消费函数,在边际消费倾向(斜率)上可能会有所不同,假设它们的消费函数在截距项没有区别。第29页,共103页,2024年2月25日,星期天那么回归模型可记为(8.11)其中,Yi=第个家庭的消费水平,Xi=第个家庭的收入水平,第30页,共103页,2024年2月25日,星期天式(8.11)可以表示为(8.12)(8.13)第31页,共103页,2024年2月25日,星期天

(三)包含多个虚拟变量的截距变动模型如果一个质的因素仅有两种特征,只需引入一个虚拟变量。但是,很多质的因素往往不只具有两个特征,例如全世界的国家可以分为发达国家、发展中国家、不发达国家。第32页,共103页,2024年2月25日,星期天我国少数民族在很多问题上有差异,所以当把民族作为虚拟变量时,不能简单将其分为汉族和非汉族;季节因素是我们最常见的质的因素,它具有四个特征,按照前面的原则,我们要引入三个虚拟变量。第33页,共103页,2024年2月25日,星期天例如,我们用季度资料研究各种商品消费额在季节上有没有什么区别?可以建立模型如下:(8.14)其中,Yt=季度的消费,Xt=季度的收入,对于四个季度,我们引入了三个虚拟变量:第34页,共103页,2024年2月25日,星期天这里,第四季度为基础类型,其截距项为β0。而其它三个季度的截距项分别为β0+β1,β0+β2,β0+β3。β1,β2,β3代表季节变动引起的消费差异。第35页,共103页,2024年2月25日,星期天四个季度的回归模型分别为(8.15)(8.16)(8.17)(8.18)第36页,共103页,2024年2月25日,星期天(四)截距和斜率同时变动模型在多数情况下,质的因素不但对回归模型的截距有影响,而且还会改变模型的斜率。第37页,共103页,2024年2月25日,星期天例如城镇居民和农村居民的消费函数不但在斜率上有差异,在截距上也是有可能不一致的,将两个问题同时考虑进来,我们可以得到回归方程第38页,共103页,2024年2月25日,星期天(8.19)式中,Yi=第个家庭的消费水平,Xi=第个家庭的收入水平,第39页,共103页,2024年2月25日,星期天

β1和β3分别表示城镇居民家庭和农村居民家庭的消费函数在截距和斜率上的差异。式(8.19)可以表示为(8.20)(8.21)第40页,共103页,2024年2月25日,星期天我们一般通过t检验来判定它们之间是否有差异。1.若β1≠0,β3≠0,则为截距和斜率同时变动模型;2.若β1≠0,β3=0,则为截距变动模型;3.若β1=0,β3=0,则表示城镇居民家庭和农村居民家庭有着完全相同的消费模式;4.若β1=0,β3≠0,则为斜率变动模型,这种情况在现实中出现得不是很多。第41页,共103页,2024年2月25日,星期天下面,以我国的农村和城市的消费样本为例,实际体会虚拟变量模型从建模到检验再到估计参数最后下结论的全过程。

【例8.2】已有数据资料为我国城镇居民家庭1955年至1985年人均收入和人均储蓄。根据经验,也就是先验信息,再通过某些检验,我们发现储蓄和收入有很强的相关关系而且收入的变化会引起储蓄的变化。第42页,共103页,2024年2月25日,星期天假定它们之间为线性关系,我们可以建立储蓄模型如下式中,St=人均储蓄,Xt=人均收入,t=年份(t=1955,1956,…,1985)。

(8.22)第43页,共103页,2024年2月25日,星期天把1955年作为基期并把该期的价格水平定为100,再分别扣除包含在和中的物价上涨因素。用最小二乘法估计式(8.22),得到

R2

=0.833,DW=0.398

(8.22)第44页,共103页,2024年2月25日,星期天模型(8.23)包含了这样一个假定,那就是在1955到1985年期间我国城镇居民家庭的储蓄行为大体保持不变。第45页,共103页,2024年2月25日,星期天这一假定实际上是行不通的,因为在十一届三中全会召开之后,居民的收入大大增加,而且与居民储蓄有关的许多重要因素在1979年以后发生了明显变化。在改革开放之前,我国居民的收入水平仅仅能够维持温饱水平,根本不可能有多少储蓄。第46页,共103页,2024年2月25日,星期天1979年以后,我国居民的收入水平大幅度提高,同时,居民储蓄也在大幅度增长。从这些可以看出来,1979年前后两个时期,我国居民的边际储蓄倾向有显著性差异。第47页,共103页,2024年2月25日,星期天在改革开放前的大多数年份,我国的消费市场常常是供不应求,许多商品要国家下达计划指标,居民凭票证购买,经常出现的问题是顾客即使有钱也难买到需要的商品,就不得不把钱存起来。这时候的储蓄就带有非自愿的性质。第48页,共103页,2024年2月25日,星期天而在1979年以后,物资逐渐丰富,商品的买卖也取消了票证的限制,消费者储蓄的主要目的之一是购买高档耐用消费品,储蓄不再具有“被迫”的性质。第49页,共103页,2024年2月25日,星期天为了验证城镇居民的储蓄行为是否有显著变化,可以建立下面的截距和斜率同时变动模型。(8.24)式中,St和Xt仍代表人均储蓄和人均收入,D为虚拟变量,第50页,共103页,2024年2月25日,星期天用最小二乘法估计式(8.24),可以得到(8.25)第51页,共103页,2024年2月25日,星期天其中,参数估计值下面括号中的数字为统计值。显然,在1979年前后储蓄模型的截距和斜率有明显差异。式(8.25)可以写为两个方程(8.26)(8.27)第52页,共103页,2024年2月25日,星期天由以上模型可知,我国城镇居民的边际储蓄倾向在1979年以前仅为0.004,也就是收入增加1元,储蓄平均增加4厘;而从1979年到1985年这段时间,城镇居民的边际储蓄倾向增至0.256。第53页,共103页,2024年2月25日,星期天然而,在式(8.23)中得到的边际储蓄倾向却是0.17。很明显,式(8.23)既不代表改革开放之前城镇居民的消费行为,也不能正确描述1979年以后城镇居民储蓄与收入之间的关系。

第54页,共103页,2024年2月25日,星期天我们单从模型的拟合也可以看出引进虚拟变量可以改善估计效果。式(8.23)中的随机误差项存在正自相关(DW=0.398),拟合优度效果也不太好(R2=0.833)。引入虚拟变量后的模型消除了自相关(DW=1.67),判定系数也上升到0.967。所以,虚拟变量的引入很有必要。第55页,共103页,2024年2月25日,星期天

二、多个质的因素的虚拟变量模型我们讨论的回归模型只包括一个质的因素,但是在很多情形下,往往有两个以上的质的因素影响回归模型的被解释变量。例如,在考察居民的食品消费行为时,可以考虑的质的因素有居民的性别、民族、受教育程度、地理区域等等。第56页,共103页,2024年2月25日,星期天再如,除收入水平外,冰琪凌消费量还会受到季节和地区等质的因素影响。这些质的因素可能不仅仅改变模型的截距和斜率,质的因素之间也往往有相互影响。例如,高收入水平和低收入水平的居民在家电消费量上的差异会随着季节不同而改变的。为了方便,我们建立以下简单的食品消费模型。第57页,共103页,2024年2月25日,星期天(8.28)第58页,共103页,2024年2月25日,星期天

式(8.28)中,Ct和At分别表示居民的食品消费和居民的收入,D1,D2,D3,D4,D5是虚拟变量,分别表示性别因素、年龄因素和学历因素。性别因素只有两个特征男和女,设一个虚拟变量D1。第59页,共103页,2024年2月25日,星期天年龄分为三个层次,25岁以下、25到50岁和50岁以上,设二个虚拟变量D2和D3。受教育程度分为三个层次,初中以下、高中和高中以上,设二个虚拟变量D4

和D5。模型中还有虚拟变量之间的乘积,考虑了截距项的各种变化可能。

第60页,共103页,2024年2月25日,星期天Di取值不同,截距不同,如:其余的依次类推。β6和β7为性别和年龄层次的相互影响系数。采用通常的统计检验方法对各种可能的情况进行检验。第61页,共103页,2024年2月25日,星期天

例如,如果β1在统计上显著说明性别这个质的因素会明显影响食品的消费量。同时,β2在统计上显著,就表明25岁以下居民在食品消费上和别的层次的居民是有显著差异的,那么年龄也会是个很重要的影响因素。第62页,共103页,2024年2月25日,星期天上述假定虚拟变量仅仅影响回归模型的截距,由此可以推广到更一般的情形,也就是虚拟变量同时改变回归模型的截距和斜率,那样考虑得更周全,但是也会更复杂,在这里我们不作讨论。第63页,共103页,2024年2月25日,星期天第三节变参数模型和分段回归一、变参数模型

从上一节的讨论可知,由于引入了虚拟变量,回归模型的截距或斜率不再是固定不变的。但是模型中参数的变化是离散的,而不是连续的。第64页,共103页,2024年2月25日,星期天例如,在式(8.24)中,只是假定在1979年以前和1979年以后两个时期城镇居民有不同的消费行为,也就是说,回归模型的截距和斜率并不是每年都发生变化。变参数模型是虚拟变量模型的推广,它认为回归模型的截距或斜率会随着样本观察值的改变而系统地改变。第65页,共103页,2024年2月25日,星期天(一)截距变动模型系统变参数模型也可以分为截距变动模型和截距、斜率同时变动模型。设线性回归模型为(8.28)第66页,共103页,2024年2月25日,星期天式中,X=解释变量,Y=被解释变量。如果的变化为非随机的,而且这种变化完全由外生变量决定,那么式(8.29)就是一个非随机变参数模型。第67页,共103页,2024年2月25日,星期天我们观察到截距项和我们前面的虚拟变量模型的截距项有所不同,下面多了一个下标t。这就是说,虽然回归模型斜率在整个样本时期保持不变,但是截距项是随着时间的变化而变化的。第68页,共103页,2024年2月25日,星期天β1t定义如下(8.30)式中,α0和α1为我们要求的参数,也可以称为“超参数”,Zt是用来解释β1t变动情况的外生变量将式(8.30)代入式(8.29)中,整理得到第69页,共103页,2024年2月25日,星期天(8.31)可用最小二乘法对式(8.31)中的超参数和其它参数一并进行估计。如果Zt为虚拟变量,那么式(8.31)就是一个虚拟变量模型,而且是一个截距项变动斜率不变的模型。因此,虚拟变量模型是变参数模型的一种特殊形式。

第70页,共103页,2024年2月25日,星期天(二)截距和斜率同时变动模型和虚拟变量模型的思路一样,再来讨论斜率和截距同时存在系统变动的情况。我们只需要在式(8.31)的基础上进行改进。将换为,且假定有如下关系式:

(8.32)第71页,共103页,2024年2月25日,星期天将式(8.32)代入式(8.31),则有(8.33)第72页,共103页,2024年2月25日,星期天以上模型只假定β1t和β2t存在系统变化,实际上还有很多参数都可能存在这种变化,甚至可能存在β1t和β2t等系数有可能不是线性变化的,也就是说超参数本身可能不为常数。这种情况只是在理论上提出来,实际操作会因为太复杂而没有太多的应用。第73页,共103页,2024年2月25日,星期天用最小二乘估计得到式(8.33)中的参数估计值后,就可以对参数是否存在系统变化进行统计检验。如果α1和b1在统计上不显著,就可以把β1和β1看作常数;否则,我们认为β1和β2存在系统变化。

第74页,共103页,2024年2月25日,星期天显然,如果错误地把β1和β2当作常数,就等同于错误地解释了经济变量之间的关系。此外,由于相当于省略了重要的解释变量Zt和Wt,还可能会产生自相关等问题。第75页,共103页,2024年2月25日,星期天

(三)应用案例

【例8.3】众所周知,我国居民的消费行为在经济体制改革开放前后存在巨大差异。但是,在这期间居民的消费行为是否也在不断变化?我国的经济体制改革走的是一条渐进的道路,与居民消费有关的诸多因素必然会随着改革开放的不断推进而逐步改变。第76页,共103页,2024年2月25日,星期天这些变化对居民消费的影响主要有三个方面:第一、观念的变化。与改革开放初期相比,我国居民的观念已经发生了深刻的变化。人们的市场意识、风险意识、对通货膨胀的心理承受能力等均大大增强;对“铁”饭碗的依赖思想已明显减弱。第77页,共103页,2024年2月25日,星期天第二,消费者的经济决策权逐渐扩大,消费品市场供给日益丰富;劳动力市场的建立使人们有越来越多的择业机会;居民金融资产的迅速积累,使消费者可以在一定时间范围内提前或延期消费。第78页,共103页,2024年2月25日,星期天第三,不确定因素增多。随着市场因素的增多,经济生活的不确定因素也在增加。例如,职工的实际收入已不再是完全“刚性”,个人的实际收入可能会因为通货膨胀、企业经济效益下降而减少。不确定因素的增加,迫使消费者在安排消费时更多顾及长远利益,消费行为渐趋向理性。第79页,共103页,2024年2月25日,星期天

综上所述,我们似乎没有理由认为居民消费行为在1979年以后是固定不变的。但是这种变动是否显著?变动趋势是怎么样的?这一切还需要用系统变参数模型加以验证。第80页,共103页,2024年2月25日,星期天利用1979年至1997年我国城镇居民家庭收支调查资料,可以建立一个简单的系统变参数模型:(8.34)式中,Xt和Yt分别代表城镇居民家庭某年人均实际收入和人均实际支出(以1980年的价格水平为100,从收入和支出中分别扣除价格上涨因素的影响)。t=年份,ut=随机误差项。

第81页,共103页,2024年2月25日,星期天注意到模型的截距β1t和边际消费倾向β2t是随着时间的推移而不断变化的,也就是说,消费与收入的关系是逐年变化的。引起β1t和β2t变化的因素中有许多是不可观测或难以度量的,所以无法把这些因素作为解释变量直接引入模型。第82页,共103页,2024年2月25日,星期天因此,我们可以用时间序号T来代表这些因素。假定β1t和β2t的变化可以由下面的关系式来表示:(8.35)(8.36)第83页,共103页,2024年2月25日,星期天

将式(8.35)和式(8.36)代入式(8.34),得到(8.37)第84页,共103页,2024年2月25日,星期天用最小二乘法估计式(8.37)的参数,得到参数估计值后,可以对a1,a2和b1,b2进行统计检验。如果a1,a2和b1,b2部分或全部显著地不为零,则表明在经济体制改革期间消费模型参数存在系统的变化;反之,就认为消费模型在改革期间是稳定的。第85页,共103页,2024年2月25日,星期天经试算发现a0

,a2和b2在统计上都不显著,所以把模型确定为(8.38)用最小二乘法估计式(8.38),得到结果如下(8.39)第86页,共103页,2024年2月25日,星期天(8.40)式(8.40)中,参数估计值下面括号中的数字是统计值。由R2和DW值可知,模型对消费支出Yt变化的拟合程度很好,而且不存在自相关问题。第87页,共103页,2024年2月25日,星期天估计和检验结果表明:1.a1,

b1在统计上是高度显著的,从而证明我国城镇居民的消费行为在改革期间是不断变化的。2.由a2=4.5047可知,我国城镇居民的消费水平呈现逐年上升的趋势;

第88页,共103页,2024年2月25日,星期天

3.由可知,我国城镇居民的边际消费倾向呈下降趋势,这一结果与改革以来居民金融资产迅速增加的事实相吻合。第89页,共103页,2024年2月25日,星期天4.边际消费倾向的变动曲线为

(8.41)即,边际消费倾向的变化未线性下降趋势。第90页,共103页,2024年2月25日,星期天5.如果忽略居民消费行为的变化,将模型设定为(8.42)则估计结果为(8.43)第91页,共103页,2024年2月25日,星期天

显然,虽然模型的拟合优度很高,但是由于边际消费倾向是固定不变的,模型(8.43)错误的描述了消费和收入的关系。而且,如果将其用于预测,随着时间的推移误差会越来越大。第92页,共103页,2024年2月25日,星期天在前面的内容,我们都是用虚拟变量代表质的因素。但在有些情况下,虚拟变量也可以代表量的因素,分段线性回归就属于这种类型。

二、分段回归第93页,共103页,2024年2月25日,星期天

在经济关系中常有这样的情况:当解释变量X的值达到某水平X*之前,与被解释变量Y之间存在某种线性关系;当解释变量X的值达到或超过X*以后,与

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论