回归方程的变量和形式_第1页
回归方程的变量和形式_第2页
回归方程的变量和形式_第3页
回归方程的变量和形式_第4页
回归方程的变量和形式_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第七章 回归方程的变量和形式,目 录,7.1 回归方程中遗漏和冗余变量问题 7.2 模型的稳定性检验 7.3 包含虚拟变量的回归模型 7.4 可线性化的非线性模型 7.5 不可线性化的非线性模型,7.1 回归方程中遗漏和冗余变量问题,1、一个简单例子:未偿付抵押贷款债务 假定Y表示未偿付抵押债务(亿美元); X2表示个人收入(亿美元) ; X3表示新住宅抵押贷款费用(%),包括对常规抵押贷款和手续费收取的利率。一般地预期抵押债务与收入正相关,因为个人收入越高,则其借贷购买新房的能力就越强;预期抵押债务与抵押费用负相关,因为在其他条件不变时如果购房费用上升,则对住房的需求下降,从而减少了对新的抵

2、押贷款的需求。 (1)首先简单做Y(抵押贷款债务)对X2(个人收入)回归,得到以下结果,7.1 回归方程中遗漏和冗余变量问题,2)将抵押债务Y对收入和抵押费用同时回归,得到以下结果,7.1 回归方程中遗漏和冗余变量问题,3)比较两个模型 收入变量回归系数、截距和拟合优度的差异 关于个人收入对抵押贷款的影响,本质上前一个模型只是简单略去了抵押费用变量,反映了个人收入对抵押贷款的总效果(直接的个人收入效果与间接的抵押贷款费用效果);而后一个模型是假设抵押贷款费用为常数,反应了个人收入对抵押贷款的净影响或净效果。两个回归结果的差异性很好地反映了偏回归系数的“偏”的含义。 如果从模型中将抵押贷款变量略

3、去,会导致(模型的)设定偏差或设定误差(specification error)。所以在设定模型时要以经济理论为根据并充分利用已有研究的经验,设定回归变量,7.1 回归方程中遗漏和冗余变量问题,2、遗漏(omitted)变量检验 检验对现有模型添加某些变量后,新变量是否对因变量的解释有显著贡献。检验的零假设时新变量都是不显著的。检验要求前后两个模型的观测样本是相同的,增加滞后变量作为新变量,该检验是失效的。 检验统计量为 其中右边中括号内分别表示约束条件合无约束条件下方程的对数似然值,在零假设下统计量服从渐进的2(m)分布,这里m代表约束条件的个数,比如增加变量的数目,7.1 回归方程中遗漏和

4、冗余变量问题,2、遗漏(omitted)变量检验 Eviews实现:ViewCoefficient TestsOmitted VariablesLikelihood Ratio。 举例:柯布道格拉斯生产函数 采用美国27家主要金属行业SIC33的观测值,被解释变量Y代表产出,解释变量为劳动投入L和资本投入K,利用基本模型形式YAKLeu进行估计,检验(1)规模报酬不变的假设;(2)利用遗漏变量检验是否能够采用超越对数生产函数形式,7.1 回归方程中遗漏和冗余变量问题,2、冗余(Redundant)变量检验 检验一部分变量的统计显著性,通过判断方程中一部分变量系数是否与0没有显著差异,决定是否从

5、方程中剔除这些变量,检验方法可以通过F检验和似然比(LR)检验。 Eviews实现:ViewCoefficient TestsRedundant VariablesLikelihood Ratio,7.2 模型的稳定性检验,1、Chow断点(Breakpoint)检验 思想:是对每个子样本单独拟合方程,并与对于全部样本拟合方程进行比较,来观察每个子样本的估计方程是否有显著差异,判断是否存在结构变化。 零假设:两个子样本拟合的方程无显著差异。 而有显著差异意味着模型中存在结构变化,7.2 模型的稳定性检验,1、Chow断点(Breakpoint)检验 检验之前,需先把数据分成两个或更多的子样本,

6、每个子样本的观察数必须多于方程参数的个数,这样才能对每个子样本分别拟合方程。对总体样本可单独拟合一个方程,对子样本可分别拟合方程,Chows断点检验基于这两组方程的残差平方和的比较。可构造统计量: 其中ee是利用整个样本数据进行回归得到的残差平方和, eiei是第i个子样本回归的残差平方和,7.2 模型的稳定性检验,1、Chow断点(Breakpoint)检验 Chow检验时的限制条件 (1)应用Chow检验必须满足子样本回归模型的随机误差项是独立同分布,均服从正态分布。 (2)Chow检验的结果仅仅告知以子样本的回归方程是否相同,而无法告知导致这种差异的原因。 (3)Chow检验假定知道结构

7、发生变化的时间点,1、Chow断点(Breakpoint)检验 实例一:估计C-D函数 (1)19291967年数据估计如下 (2)分1929-1948和19491967两段数据估计如下,7.2 模型的稳定性检验,从而有RSSu0.035550.00336=0.0389 F统计量为 Eviews应用步骤: Viewstability test chow breakpoint test 输入断点,为第二个数据集的第一个,1、Chow断点(Breakpoint)检验 实例二:美国个人可支配收入与个人储蓄的相关性分析 给出美国19701995年美国个人可支配收入与个人储蓄的数据,估计个人储蓄Y对个人

8、可支配收入X的变化,但考虑到在1982年美国遭受到了和平期间最严重的经济衰退,当年的城市失业率高达9.7%,是自1948年以来失业率最高的一年,类似这种事件会扰乱收入和储蓄之间的关系。这可以借助Chow检验建立回归方程,7.2 模型的稳定性检验,1、Chow断点(Breakpoint)检验 实例三:中国消费函数稳定性检验 20世纪90年代前的中国仍然处于卖方市场,虽然居民收入水平增幅较大,但商品供给有限,而且当时的利息率较高,因而居民收入更加倾向于储蓄增值而不是消费,1994年我国开始全面的体制改革和制度创新。随着国有企业体制改革的推进和大量非国有企业的兴起并日益壮大,国内商品市场日益繁荣,商

9、品品种更加丰富,使得居民收入用入消费的部分增加,试用Chow检验判断1994年之前和之后两段时期消费函数是否产生显著的差异,7.2 模型的稳定性检验,2、Chow预测检验检验 Chow预测检验是先对包含前T1个观察值的子样本建立模型,然后用这个模型对后T2个观察值的自变量进行预测,如果实际值与预测值有很大变动,就可以怀疑模型中存在结构性变化。T1 和T2的相对大小,没有确定的规则,可能根据如战争、石油危机、经济改革等明显的转折点来确定,如果不存在这样明显的转折点,常用的方法是用85%-90%的数据进行估计,剩余的数据进行检验,7.2 模型的稳定性检验,1、模型中引入虚拟变量的必要性 计量经济学

10、模型,需要经常考虑属性因素(定性变量)的影响。例如职业、战争与和平、繁荣与萧条、文化程度、灾害等;这些变量往往很难直接度量它们的大小,只能建立人工变量给予赋值:“D=1”或”D=0”、或者它们的程度或等级 回归模型中有必要引入虚拟变量,以表示这些质的区别。例如消费函数,对于平时与战时,萧条与繁荣,乃至性别、教育程度、季节性等等,都会因质的不同表现出不同的差异,7.3 包含虚拟变量的回归模型,例:文化程度,1、模型中引入虚拟变量的必要性 例如考虑是否受过大学教育对收入的影响,可以建立定性变量,并赋值为0(非大学毕业)或1(大学毕业),用D表示。像这样只取0和1两个值的变量称为虚拟变量(dummy

11、 variable). 可以构造以下回归模型,7.3 包含虚拟变量的回归模型,2、虚拟变量模型 (1)方差分析模型(ANOVA):回归模型中,解释变量仅是虚拟变量的模型。例如前述是否大学毕业对初始年薪的影响模型,大学毕业生的初始年薪期望值为 非大学毕业生的初始年薪期望为,7.3 包含虚拟变量的回归模型,举例:工作权利法对工会会员的影响,Brennan等(1987)建立了工会会员对工作权利法的函数模型。研究包括50个州,其中19个州制定了工作权利法,31个州允许有工会会员制度(即工会允许进行劳资谈判)。 基本模型为 Yab*D 其中Y表示工会会员占工人的比例(1980),D1表示制定工人工作权利

12、法的州,D0表示未制定工人工作权利法的州。回归结果如下,7.3 包含虚拟变量的回归模型,2、虚拟变量模型 (2)协方差分析模型(ANCOVA)。指引入虚拟变量后,回归方程中同时含有一般解释变量和虚拟变量的模型。例如 其中y为大学教师的年薪,x为教龄,D1表示男教师,D=0表示女教师,通过求期望可以得到男女教师的平均年薪,注意的几个问题,在模型中引入多个虚拟变量时,虚拟变量的个数应按下列原则确定:如果模型中含有常数项,对于有 m 种互斥的属性类型,在模型中引入 m-1 个虚拟变量,即每个虚拟变量的个数要比该变量的分类数少1。例如性别有2个互斥的属性,引用2-1=1个虚拟变量。否则就会陷入虚拟变量

13、陷阱,存在完全的多重共线性,不能得到参数的唯一估计值。 赋值为0的一类称为基准类、对比类等。 虚拟变量D的系数称为差别截距系数,用3个虚拟变量表示4个季度,这里用3个虚拟变量表示4个季度,Q2、Q3、Q4同时取不同值组合起来表示4个季节春、夏、秋和冬,7.3 包含虚拟变量的回归模型,3、虚拟变量的引入方式 (1)加法方式影响截距 虚拟变量D 与其它解释变量在模型中是相加关系,称为虚拟变量的加法引入方式。加法引入方式引起截距变动 例如讨论消费问题,消费水平C主要由收入水平Y决定,但是当特殊情况出现时政府会采取对消费品限量供应措施,因此引入虚拟变量D来表示这些特殊情况与非特殊情况,例:消费问题的虚

14、拟变量模型,以D=1表示 反常年份,D=0 表示正常年份 C = b0 + b1 x + b2D +e 反常年份消费函数 (截距不同斜率同) 正常年份消费函数 (截距不同斜率同,运用虚拟变量改变回归直线的截距,7.3 包含虚拟变量的回归模型,3、虚拟变量的引入方式 (2)乘法方式影响斜率 模型中虚拟变量与其它解释变量是相乘关系,称为虚拟变量的乘法引入方式。乘法引入方式引起斜率变动 例如D=1 异常时期 D=0 正常时期,设定以下模型 Y= b0 + b1 X+b2 D X +e, b2表示差别斜率 则异常时期模型:(截距相同斜率不同) Y= b0 + (b1 +b2 ) X +e 则正常时期模

15、型:(截距相同斜率不同) Y= b0 + b1 X +e,运用虚拟变量改变回归直线的斜率,加法与乘法组合引入截距与斜率均不同,例如D=1表示异常时期,D=0 表示正常时期,设定模型 Y=b0+ b1 X+ b2D + b3D X +e 则异常时期模型:(截距与斜率均不同) Y= (b0 + b2) +(b1 +b3) x +e 反常时期模型:(截距与斜率均不同) Y= b0 + b1 x +e,运用虚拟变量同时改变回归直线的截距和斜率,7.3 包含虚拟变量的回归模型,3、虚拟变量的引入方式 (3)临界指标的虚拟变量的引入 在经济转折时期,可以建立临界值指标的虚拟变量模型来反映。设转折时期t*

16、,转折时期的指标值= x*,设定虚拟变量 D=1( t = t*) D=0( t = t* 时 y = b0 -b2 x*+ (b1+ b2) x +e 当t = t*时, x=x* 两式计算的y 相等,两条直线在转折期连接成一条折线,临界折线的图例,折线回归,4、对虚拟变量的解释 例如Log(wage)=0.417-0.297female+0.080educ +0.029exper+ Female的系数近似表示在educ、exper等相同水平上,女人比男人约少挣 1000.297%=29.7% 精确的百分比如何计算?(25.7,7.3 包含虚拟变量的回归模型,7.3 包含虚拟变量的回归模型,

17、5、应用举例 例1、棒球运动员薪水影响因素模型 在前述棒球运动员薪水的数据中,运动员有如下六个位置可供选择:frstbase, scndbase, thrdbase, shrtstop, outfield和catcher。为了说明不同位置上薪水的差异,以外场手(outfield)那一组为基组,应将哪些虚拟变量作为自变量,7.3 包含虚拟变量的回归模型,5、应用举例 例2、工资上性别歧视的检验 基本模型如下: Log(wage)=a0+a1*female+a2*educ+a3*exper +a4*tenure 其中tenure表示现职任期。模型中可以包含female与educ的交叉项,以反映男女

18、在受教育回报中的差异,也可在回归中包括exper和tenure的二次项。采用Wooldridge中的数据集Wage1.Raw估计不同模型,7.4 可线性化的非线性模型,1、(双)对数模型(幂函数曲线) 该模型能够对弹性进行度量,模型中B2度量了y对x的弹性。由于由双对数模型所得到的弹性是一个常数,所以双对数模型又称为不变弹性模型。 如何选择(对数)线性模型: 根据经验来选择。 根据数据作散点图,再比较,实例:利用双对数模型估计对Widget的需求 lnY=3.9617-0.2272lnX 线性模型与对数线性模型的比较: (1)根据散点图进行确定; (2)R2系数不能作为选择的根据; (3)模型

19、中变量之间的相关性(以经济理论为基础)、预期的解释变量系数的符号、统计显著性以及类似弹性系数等应该成为选择模型的基本准则; (4)两类模型弹性系数的比较:平均弹性与不变弹性系数,2、多元对数线性回归模型 其中B2、B3又称为偏弹性系数。 实例:能源需求函数 给出1960-1982年间7个OECD国家(美国、加拿大、德国、英国、意大利、日本、法国)的总最终能源需求指数(Y)、实际的GDP(X2)、实际能源价格(X3)的数据,所有指数均以1970年为基准,建立能源需求函数,7.4 可线性化的非线性模型,3、对数线性模型 其中B2表示y对x的半弹性,即当x增加一单位时y的百分数变化。 例1:美国未偿

20、付消费者信贷的增长 由复利计算公式Yt=Y0(1+r)t 可以得到 ln Yt=B1+B2t+ut 例2:我国实际GDP平均增长率,7.4 可线性化的非线性模型,4、线性对数模型(对数曲线) 模型给出了x变动一个百分点时y的绝对变动量 例:美国GNP与货币供给间的关系 假定美联储很关注货币供给的变动对GNP的影响(货币供给是由FED控制的),建立GNP和货币供给(M2)之间的模型 Y=B1+B2lnX2+u,7.4 可线性化的非线性模型,7.4 可线性化的非线性模型,5、双曲函数模型(双曲线) 由于B1、B2符号的差异双曲函数模型具有不同的形状。 举例:美国的菲利普斯曲线 利用美国1955-1

21、984年的数据,建立通货膨胀率和失业率之间的反向关系,建立双曲函数;如果考虑到20世纪70年代出现的石油危机所引发的滞胀,通货膨胀伴随着高失业率,进一步在模型中引入代表通货膨胀预期变量(例如用通货膨胀前期值来表示),重新建立模型,6、多项式模型 例1:环境Kuznets曲线 例2:总成本函数曲线,利用以下数据估计以上多项式模型,7.4 可线性化的非线性模型,7、Box-Cox转换 如果1,模型是线性的, 0,模型是对数线性或半对数线性的; 1,模型是双曲形式; 的其他不同取值会产生不同的函数形式,7.4 可线性化的非线性模型,不同函数形式模型小结,实例 某企业在16个月的某产品产量和单位成本资料,试分别采用双曲线、对数曲线和幂函数曲线模型分析二者的关系。其中X表示产量(台),Y表示单机成本(元/台,7.5 不可线性化的非线性模型,1、一般形式 2、非线性最小二乘法 3、根据前述数据利用NLS方法建立单位成本的双曲线模型,实例1: 建立中国粮食生产函数模型。 给定我国1975-199

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论