计量经济学(研1)ppt课件_第1页
计量经济学(研1)ppt课件_第2页
计量经济学(研1)ppt课件_第3页
计量经济学(研1)ppt课件_第4页
计量经济学(研1)ppt课件_第5页
已阅读5页,还剩152页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

计 量 经 济 学 (研究生用),深圳大学经济学院 徐 晓 光,第一章 导 论,1.1 计量经济学概述 Econometrics中文译名:计量经济学、经济计量学 一、计量经济学定义 计量经济学是经济学的一个分支,是以经济理论为前提 利用数学、统计学、计算技术,根据实际观测资料来研 究经济关系与经济活动数量规律,并以建立和应用计量 量经济模型为核心的一门科学。,二、计量经济学的产生及发展 早在17世纪英国经济学家、统计学家威廉.配第(W.Petty)在政治算术一书中运用统计学方法研究社会经济问题。1838年法国数理经济学家古诺(A.Cournot)出版了财富理论的数学原理,认为需求、供给、价格之间可视为函数关系,用数学语言系统阐述了某些经济规律。1874年法国经济学家瓦尔拉斯(L.Walras)在纯粹政治经济学纲要中提出“一般均衡理论”,使用联立方程组进行一般均衡条件研究。1890年马歇尔(A.Marshell)的经济学原理问世后,数学方法在当时西方经济理论研究中已成了不可缺少的工具。 20世纪20年代末30年代初爆发了世界性的经济大危机,使西方经济关于资本主义市场经济能够自行调节、保持均衡发展的传统理论陷于破产。许多问题困扰着决策者。例如:在一次衰退中,有人提出消减工资-可增加企业利润-刺激生产;有人提出增加工资-刺激消费者需求-刺激生产。有人提出降低利率-刺激企业投资;有人提出提高利率-增加银行存款-提高银行贷款能力-增加企业投资。定性分析无法给出解决方案,必须进行定量分析。 1926年挪威的经济学家费瑞希(Ragnar Frish)提出计量经济学一词,是诞生标志。,1930年年底在美国俄亥俄州克里富兰城,由费里希、丁伯根和费歇尔等经济学家发起成立了“国际计量经济学学会”。 1933年正式出版了计量经济学会刊Econometrics,标志计量经济学已成为一门独立的新兴学科。 20世纪30至60年代主要研究微观经济。如费瑞希研究需求弹性、边际生产力,柯布道格拉斯研究生产函数等。 20世纪40年代至70年代,重点研究宏观经济;美国著名经济学家克莱因发表了美国经济变动1921-1941、美国的一个计量经济模型1929-1952 等论文,泰尔(H.Theil)发表了二阶段最小二乘法等。 20世纪80年代至今计量经济学的理论及应用都有了较大的发展。英国学者亨德利(D.F.Hundry)提出了协整理论,使计量经济学进入一个新的理论体系,对策论、贝叶斯理论等在计量经济学中具体的应用。 可以说经济学的数量化和定量化是经济学迅速科学化的标志,数学推动了经济学的发展。计量经济学越来越受到经济学家们的重视,正如克莱因所说:“计量经济学已经在经济学科中居于最重要的地位。”“在大多数的大学与学院中,计量经济学的讲授已经成为经济学课程表中最有权威的一部分。”萨缪尔森甚至说:“二战之后的经济学是计量经济学时代。” 据统计,在诺贝尔经济学奖的获奖成果中,3/4都与计量经济学密切相关。,三、计量经济学在我国的发展 1959年中国社会科学院的学者考察前苏联后,提出引入计量经济学。 1979年成立了中国数量经济研究会和数量经济研究所,并出版了会刊数量经济技术经济研究。 1980年克莱因应邀来华讲学。 1982年召开了第一届数量经济学会年会。 1998年经教育部专业教学指导委员会审定“计量经济学”被确认为经济类个专业八门核心课程之一。(八门核心课程:政治经济学、西方经济学、计量经济学、货币银行学、财政学、统计学、会计学、国际经济学),四、计量经济学与其它学科的关系 1、计量经济学与数理经济学 区别:数理经济学通过数学符号阐述经济理论,用精确的数学形式表达各种经济关系。所采用的模型称数理经济模型,不为参数提供数值。 (模型是对现实的描述和模拟。对现实的各种不同描述和模拟方法,就构成了各种不同的模型。) 计量经济学用数学形式表达经济关系,但不假定这种经济关系是精确的。采用的模型为计量经济模型。在模型中列出起主要作用的经济变量,并含有一个随机变量。给出模型参数估计值。 联系:数理经济学与理论经济学的区别只是表述形式不同,它把经济关系数学化、公式化,为计量经济学研究奠定了基础。,2、计量经济学与经济统计学 区别: 经济统计学是指对经济统计资料的收集加工和整理,并列表图示形式表达数据,以描述在整个观察期间的发展形式,而并不利用所收集的数据来验证经济理论。计量经济学利用经济统计所提供的数据来估计经济变量之间的数量关系并加以验证。 联系:计量经济学研究离不开经济统计资料 3、计量经济学与数理统计学 区别:数理统计学是以概率论为基础,研究随机现象规律性的学科。偏重于数学推导。有严格的假定条件。计量经济学是在数理统计学基础上开发出的特有的分析方法技术。 联系:数理统计学是计量经济学研究的基础,数理统计方法是计量经济研究中的主要建模工具。,五、计量经济学内容体系 从学科角度分为: 广义计量经济学、狭义计量经济学 广义的计量经济学:包括回归分析、投入产出分析、时间序列分析等。即数量经济学。 狭义的计量经济学:只包括回归分析。即通常提及的计量经济学。 从内容角度分为: 理论计量经济学(方法论):研究如何建立合适的方法去测定由计量经济模型所确定的经济关系。研究目的在于为应用计量经济学提供方法论。 应用计量经济学(实际应用):研究目的在于进行经济结构分析、经济预测、经济政策评价、检验与发展经济理论。,1.2 计量经济学基本概念 一、经济变量:用来描述经济因素数量水平的指标。 经济变量可分为若干类型: 1、解释变量、被解释变量 2、内生变量、外生变量 3、滞后变量 4、前定变量 5、控制变量(政策变量) 6、虚拟变量 二、数据 1、时间序列数据 2、截面数据 3、混合数据(面板数据) 4、虚拟变量数据,三、计量经济模型 模型是对现实的描述与模拟。对现实的各种不同描述 和模拟方法就构成了各种不同的模型。 经济数学模型是用数学方法描述经济活动。所采用的数 学方法不同,构成各类不同的经济数学模型。 计量经济模型是用随机性的数学方程描述经济活动,揭 示经济活动中各个因素之间的定量关系。 计量经济模型中,每一个特定方程的解释变量的系数称 为变量参数。变量参数一般未知,需要根据样本信息加 以估计,由于抽样误差及估计方法的误差,所得到的参 数估计值与总体参数的真值并不一致,通常选择参数估 计值时应参照无偏性、最小方差性及一致性准则。,1.3 计量经济学研究经济问题的步骤 一、模型设计 二、收集样本数据 三、估计参数 四、模型检验 五、应用模型,1.4 相关知识回顾 一、 1、随机事件:结果具有不确定性的事件。 2、概率:某随机事件在试验中发生的可能性的大小。 其值在0到1之间,必然事件的概率为1,不可能事件的概率为0。 3、随机变量:如果一个变量在随机试验中取得不同的值, 而这些数值在试验前无法确定,对于一次具体的试验, 其取值又是确定的。 随机变量分为离散型的随机变量和连续型的随机变量。,4、离散型随机变量:只取有限个或至多可列个可能值的随机变量。 5、离散型随机变量的概率分布函数:给定随机变量 ,它的取值不超过实数x的事件的概率 P( x)是x的函数,称为 的概率分布函数,简称分布函数,记为F(x)=P( x), - x+ 6、离散型随机变量的数学期望(均值):将随机变量的每一个可能取值乘以该值发生的概率再相加。记为: E(x) = x i p i 7、离散型随机变量的方差:是随机变量的可能取值与均值之差的平方的均值,记为: D(x) =E(xi-E(x)2 = (xi-E(x)2 p i,8、连续型随机变量: 若随机变量 可取某个区间c,d或(- ,+ )中的一切值,而且其分布函数能表示为 F(x)= 其中 f(y) 0 ,则称 为连续型随机变量,称 f(y) 为 的概率密度函数(或分布密度函数)。 9、连续型随机变量的概率分布: 连续型随机变量在区间(x1 , x2 )上的概率分布为: P(x1 , x2 )= 其中, f(x)称为概率密度函数 10、连续型随机变量的均值与方差: E(x)= D(x)= ( x-E(x)2 f(x)dx,7、几种常用的连续型随机变量的分布 正态分布 若随机变量的概率密度函数为 其中 ,与 均为常数, 相应的分布函数为 则称该随机变量服从正态分布, 记N( ) N(0,1)称为标准正态分布。,0,-分布: 设x1,x2,,xn是相互独立,且同服从于N(0,1)分布的随机变量,则称随机变量 = 所服从的分布为 -分布。 定理1 -分布密度函数为 其中,参数n称自由度,,n=6,n=2,n=1,0,t-分布 设xN(0,1),Y (n),且x和Y相互独立,则称随机变量 所服从的分布为t-分布, n 称为它的自由度,记Tt(n)。 定理1 T的分布密度函数为 定理2 设xN( , ),Y (n),且x和Y相互独立, 则随机变量, t(n),0,x,t(x;n),F-分布 设x和Y是相互独立的 -分布的随机变量,自由度分别为m和n,则称随机变量 所服从的分布为F-分布,(m,n)称为它的自由度,记为FF (m,n)。 定理1 F-分布的概率密度函数为,f (x),x,m=10,n=10,m=10,n=4,二、求偏导数 三、矩阵求秩,第二章 简单的一元线性回归模型,2.1 一元线性回归模型的概念与基本假设 形如: y = b0 + b1x + u (或 yt = b0 + b1xt + ut , t=1,2, )的模型 称为简单的一元线性回归模型。其中u(ut )为随机误差项, 随机误差项u包括: 1、模型中省略掉的影响因素造成的误差 2、模型设定误差 3、变量的测量误差 4、随机误差 线性是指y关于b0、b1线性,为对上述模型中的参数b0 、 b1使用普通最小二乘法进行估计,因此对 u 作如下假设(称古典假定): E(ut)=0, t=1,2, Var(ut)=E(ut2)= , t=1,2, cov(ut , us)=E(ut us )=0 , t s, t=1,2, cov(ut , Xt)=0 , t=1,2, ut N(0, ), X是确定的变量。 未知。,2.2 模型参数的最小二乘估计 一、最小二乘估计量: 是指使残差平方和 最小的估计量。 其中Yt 是观测值, 为估计值 。 应用极值原理,得到参数的估计式为 则回归方程为: 二、最小二乘估计量的统计性质: 线性性(可表示成Y的线性函数) 无偏性(参数估计量的数学期望等于这个参数) 有效性(最小方差性),三、参数估计量的分布、随机项方差的估计量、参数(回归系数)的区间估计 2.3 一元线性回归模型的假设检验 一、模型估计式检验的必要性 二、模型估计式的理论检验 三、 回归参数估计量的显著性检验 检验检验 与 是否显著成立。 也即b0和b1是否显著为零。,检验的步骤(以 为例): (1)提出原假设 H0: b1=0 备择假设 H1:b1 0 (2)计算统计量: T = 其中, 是 标准差的估计值。 (3)给定显著水平 ,查自由度为 n-2 的 t 分布表,得临界值 t /2(n-2)。 (4)如果 t /2(n-2),接受H0:b1=0,X与Y线性不显著。 如果 t / 2(n-2),拒绝H0: b1=0 ,接受备择假设H1: b1 0 ,X与Y线性显著,即认为 显著成立。 对 的显著性检验只需把上述的b1( ) 换成b0( ) 即可。,四、拟合优度测定 1、总离差(变差)平方和的分解公式 总离差(变差)平方和 = 回归(解释变差)平方和 + 残差(未解释变差)平方和 记 TSS = ESS + RSS 2、样本决定系数 样本决定系数取值区间0,1 3、相关系数及显著性检验 相关关系及种类 客观世界中的许多现象都存在一定的关系,这种关系一般可通过数量关系反映出来,这种关系归纳起来可分为两种: 一种是确定性关系,称为函数关系; 另一种是非确定性关系称为相关关系。,相关关系的种类: 两个现象按相关程度的不同分为 不相关:两个现象互不影响,彼此数量变化相互独立。 完全相关:一个现象的数量变化由另一个现象的数量变化所唯一确定。此种相关关系实际是函数关系,所以函数关系是相关关系的特例。 不完全相关:介于不相关与完全相关之间。 按相关方向不同分为 正相关:两现象之间的数值变化呈同方向变动。 负相关:两现象之间的数值变化呈反方向变动。 按相关的形式不同分为 线性相关:如果两现象的对应数据在散点图中的分布近似表现为直线形式 非线性相关:如果两现象的对应数据在散点图中的分布表现为各种不同的曲线形式 按相关因素的多少分为 简单相关:指两个现象的相关关系。 复相关(多重相关):指三个或三个以上现象之间的相关关系。,相关系数 变量之间线性相关的程度,常用相关系数度量。 总体相关系数的取值范围为-1,1,当取值为0时表示总体x与 y不相关,取1(-1)时表示总体x与y完全正相关或完全负相关 相关分析与回归分析区别及联系 联系:相关分析是回归分析的基础和前提,回归分析是相关分析的深入和继续。相关分析和回归分析的有关指标之间存在计算上的内在联系。 区别:回归分析强调因果关系,变量分为解释变量和被解释变量。 相关分析不关心因果关系,变量是对等的关系 决定系数与相关系数的关系,五、正态性检验:Jarque-Bera检验(雅克-贝拉检验、JB检验) 检验ut是否服从正态分布 ut 不可观测,可根据它的近似值et来研究,JB检验是依据OLS的et对大样本的一种检验方法(或称渐进检验)。 首先计算偏度系数S(对概率密度函数对称性的度量),2.4 利用一元线性回归方程进行预测 一元线性回归方程为 1、点预测: 已知x的一特定值x0,利用回归方程求得y0的估计值(点 预测值) : 2、区间预测: y0的预测区间 给定显著水平 ,在100(1- )%的置信水平下,y0 的预测区间为: 其中,,均值E(y0)的预测区间 给定显著水平 ,在100(1- )%的置信水平下,查自由度为n-2的t分布表得临界值 E(y0)的预测区间为:,第三章 多元线性回归模型,3.1 多元线性回归模型的估计 一、概念: 多元线性回归模型形如: y=b0+b1x1+b2x2+ +bkxk+u , 或 yt=b0+b1x1t+b2x2t+ +bktxkt+ut , t=1,2, ,n 即 其中u为随机项,包含的内容与一元情形相同。,将多元线性回归模型写成矩阵形式:Y=Xb+u Y= X= b= u= 为了对多元线性回归模型的参数采用普通最小二乘法进 行估计,作如下假设: E(ut)=0, t=1,2, ,n Var(ut)= ,t=1,2, ,n cov(ut , uj )=0 ,t j, t=1,2, ,n cov(ut , xjt)=0 , t =1,2, ,n , j=1,2, ,k。 ut N(0, ), xjt是确定的变量。 未知。 r(X)=k+1n,即解释变量之间不存在线性相关。,二、 参数的最小二乘估计 1、参数的最小二乘估计量: 使得残差平方和 最小的 称多元线性回归模型参数的最小二乘估 计量。 根据极值原理: 令 i=0,1,2 , ,k 得参数的最小二乘估计量的矩阵形式:,2、参数估计式的统计性质 线性性 无偏性 最小方差性 三、随机项u的方差 的估计量 随机项u的方差 的无偏估计量为,3.2 多元线性回归模型的显著性检验 一、 拟合优度检验 1、总离差平方和分解 总离差平方和(TSS)=回归平方和(ESS)+残差平方和(RSS) 2、样本决定系数 样本决定系数 调整样本决定系数,三、回归模型的总体显著性检验:F检验 回归方程的一般形式为 对回归方程进行显著性检验,即检验回归方程是否显著 成立,就是检验总体y与x1,x2, xn之间线性关系是 否显著成立,即检验是否有 b1=b2= =bk=0 . 检验步骤: 1、假设H0 : b1=b2= =bk=0 2、由数理统计的知识知,在H0成立的条件下,统计量 计算F值,3、给定显著水平 ,查第一自由度为k,第二自由度为n-k-1的F分布表,得临界值F 4、判断:当 FF 时,拒绝H0 :b1=b2= =bk=0 ,则认为回归方程显著成立, 当 FF 时,接受H0 :b1=b2= =bk=0 ,则认为回归方程无显著意义。 四、回归参数的显著性检验 回归方程显著成立,并不意味着每个解释变量x1,x2, xk对因变量y影响都重要,如果某个解释变量对Y影响不重要,就可把它从模型中剔除,重新建立更简单的模型。 多元线性回归分析中,对回归参数的检验,目的在于检验当其他解释变量不变时,该回归系数对应的解释变量是否对被解释变量有显著影响。就是要检验是否bt=0,若是,则 bt显著为零,说明在其他解释变量不变的情况下,xt对y的影响不显著。若否,则 bt显著不为零,说明在其他解释变量不变的情况下,xt对y的影响显著。,检验步骤: 1、提出原假设H0 : bi=0 备择假设H1: bi 0 2、计算T统计量: T= 3、给出显著水平 ,查自由度为n-k-1的分布表得临界值t /2 当 t /2 时,拒绝H0 : bi=0,接受H1: bi 0,认为参数估计值显著成立 当 t /2 时,接受H0 : bi=0 ,认为参数估计值不显著成立. 五、模型的结构稳定性检验:Chow检验 邹氏(邹至庄)转折点检验的目的:检验整个样本的各子样本中模型的系数是否相等。如果在不同的子样本中模型的系数不同,说明该模型中存在转折点。 检验方法:,建立多元线性回归模型: 检验原假设H0: j=0,1, k 对(1)和(2)用OLS进行估计得回归方程 残差平方和分别为 和 若原假设成立,则两个回归模型可合并为一个,两组样本观测 值可合并成一组样本观测值,回归模型及回归方程如下: yt=b0+b1x1t+b2x2t+ +bktxkt+ut , t=1,2, ,n1+n2 残差平方和为,Chow统计量 在H0成立条件下,F统计量服从自由度为(k+1, n1+n2-2k-2)的F分布. 给定显著水平 查第一自由度k+1,第二自由度n1+n2-2k-2的F 分布表,的临界值F ,当FF ,拒绝H0,认为两个子样本所 反映的经济关系显著不同,经济结构发生了变化;反之认为经 济结构关系比较稳定,3.3 利用多元线性回归方程进行预测 1、点预测: 给出解释变量一组特定值,X0=(1,x10,x20 , xK0) 代入多元线性回归方程得: 计算出的 就是 y0 的点预测值。 2、区间预测:y0的预测区间 其中 E(Y0)的预测区间,3.4 复杂的线性回归模型 1、多项式函数模型(总成本函数,以产量为解释变量) 形如:y=b0+b1x+b2x2+ +bmxm+u 进行变量替换 Zt=xt ,t=1,2, , m 变换后的模型为 y=b0+b1Z1+b2 Z2+ +bmZm+u 这是线性回归模型,可利用线性回归分析方法理。 2、对数函数模型 y= b0+b1lnx+u lny= b0+b1x+u lny= b0+b1lnx+u 对于上述三种模型,可令:y*=lny , x*=lnx 则化成 y= b0+b1 x*+u y*= b0+b1x+u y*= b0+b1 x*+u,3.5 非线性回归模型 (一)内蕴线性回归模型 1、倒数模型(工资变动率与失业率、平均固定成本与产量) 令 y*= x*= 则原模型化成:y*=b0+b1x*+u,2、幂函数模型 y=AL K eu ,A0,L0,K0,y0 两边取对数得 :lny=lnA+ lnL+ lnK+u 令 y*=lny, L*=lnL ,K*=lnK, a=lnA 则原模型化为 y*= a+ L*+ K* +u 3、指数函数模型 y=aebx+u ,a0, 两边取对数得 :lny=lna+bx+u 令 y *=lny , b0=lna 则原模型化为 y *=b0 +bx+u,4、成长曲线模型(新产品销售) 逻辑成长(S)曲线模型 经过简化变为 其函数图形如图 y K t 可化为线性模型。 龚珀兹成长曲线模型 与逻辑成长曲线图形类似 可化为线性模型。,(二)内蕴非线性模型 内蕴非线性模型是指不论经过怎样的替换,都不能化成 线性回归模型的非线性回归模型。 例如:y=AL K +u ,A0,L0,K0,y0 Y=a0+a1x1a2+a3x2a4+u(消费函数模型C=b0+b1yb2+u) 求此类模型的参数估计值,采用高斯-牛顿迭代法。 迭代估计法基本思想: 通过泰勒级数展开先使非线性函数在某一组初始参数估计值附近线性化,然后对这一线性模型应用OLS法,得出一组新的参数估计值。再使非线性函数在新参数估计值附近线性化,对新的线性模型再应用OLS法,又得出一组新的参数估计值。不断重复上述过程,直到参数估计值收敛为止。,第四章 异方差,4.1 异方差性 1、概念 若Var(ut)= (t=1,2, ,n) ,则称ut存在异方差。 2、异方差产生的原因 经济现象本身存在异方差性;模型忽略了某些变量;模型的形式设定不当;统计资料存在误差等。 4.2、异方差性的后果 若仍用OLS估计参数,则参数估计值仍是无偏的,但不具有最小方差性;变量的显著性检验失去了意义;模型的预测精度降低。 4.3 异方差性检验 方法有多种:图示法、Goldfeld-Quand(戈德菲尔特-夸特检验)、 Glejser (戈里瑟)检验等。 由于异方差存在是由于解释变量取不同值产生的,所以,这些检验方法的思路就是检验随机项的方差与解释变量之间的相关性。,这些方法中,如果是一元线性回归模型,应用图示法较简单,即做出x与y的散点图,如果这些点在两条平行直 线内,则随机项同方差,否则异方差。 多元情形下,可采用其他方法,如戈里瑟检验法。 哥德非尔特-夸特检验(G-Q检验) 若随机项方差又逐渐增大的可能 将解释变量由小到大排序,被解释变量与之对应,将样本按解释变量大小分成两部分,利用两组样本分别建立线性回归模型,并求出各自的残差平方和,若两者之间存在较大差异,则存在异方差,若差异不大则具有等方差性。 一般把样本中间部分(约c=n/4)去掉,用剩余的两部分分别作回归求出残差平方和,RSS1和RSS2,H.White test(怀特检验) 要求大样本 以二元线性回归模型yt=b0+b1x1t+b2x2t+vt为例 步骤: 1、用OLS估计模型,算出残差平方和et2,作辅助回归模型:et2=a0+a1x1t+a2x2t+a3x1t2+a4x2t2+a5x1tx2t+vt 2、原假设H0:a0=a1=a2=a3=a4=a5=0 3、H0成立条件下,统计量nR2渐进地服从自由度为5的 分布(一元自由度为2) 4、给定显著水平,查表得临界值,当nR2大于临界值时,则拒绝H0,存在异方差;当nR2小于临界值时,则接受H0,不存在异方差;,Glejser test(戈里瑟检验)和Park test(帕克检验) 戈里瑟提出如下假定函数形式:,4.4 异方差性的解决方法 (1)模型变换法 设线性回归模型为: Yt = b0 + b1x1t + +bkxkt + ut , t=1,2, ,n 随机项存在异方差,由于随机项的方差与x有关,可设: Var(ut)= = f(x1t , xkt), f(x1t , xkt) 0, 为常数。 则可用 去除线性回归模型两端,得: 令,则Var( )= ,Cov( , )=0, i j, i,j=1,2, ,n 这样,异方差模型就变成等方差模型,如果其他假定都 满足,则可应用OLS进行参数估计。函数 f 如何选取有 很大的随意性。戈里瑟检验提供了相应的信息。 如假设: Var(ut)= = Xjt 或 Var(ut)= = X2jt (2)加权最小二乘法(WLS) 加权最小二乘法就是对原模型加权,使之变成一个新的 不存在异方差性的模型, 然后采用普通最小二乘法估计 其参数。 设线性回归模型为如下矩阵形式: Y=Xb+ 存在异方差,其他假定均满足。则模型的期望、方差协 方差阵为:,E( )=0 ,Var-Cov( )=E( )= W W= 即随机项存在异方差性。由于W是正定对称阵,则存在 非奇异阵 ,使得 W= 用 左乘模型两端,得新模型: Y= X b + 令Y* = Y X*= X u*= 则模型变为 Y*= X*b+ u*,该模型具有同方差性,对该模型应用普通最小二乘 估计,得参数估计量为: 加权最小二乘估计量具有线性性、无偏性、最小方差性。 (3)模型的对数变换 若在模型yt=b0+b1xt+ut中,变量yt、xt分别用lnyt、 lnxt取代,对lnyt=b0+b1lnxt+ut进行回归,通常可降 低异方差的影响。,第五章 自相关 5.1 自相关性 1、概念 自相关(或序列相关)是指随机变量u不同期值相关。即 Cov(ui ,uj) 0, i j, i,j =1,2, ,n 2、自相关产生的原因 被解释变量存在自相关;一些不重要的且不同期取值相 关的解释变量含在u中;模型设定的偏误及数据资料调 整;u本身有自相关。 3、自相关的后果 如果随机项存在自相关,用OLS估计参数,出现后果: 得到的参数估计量仍是无偏的,但不具有最小方差性; 参数估计值的显著性T检验及回归方程显著性F检验失效,5.2 自相关形式 1、若随机变量的取值只与前一期取值有关,即 ut =f(ut-1) , 则称u为一阶自相关。 2、如果u一阶自相关,且形如: ut= ut-1+ , 为随机变量,且满足古典假定: E( )=0 Var( )=E( )= ,t=1,2, ,n Cov( )=E( )=0 , t1 t2 , t1,t2=1,2, ,n Cov(ut-1, )=E(ut-1 )=0 则称u具有一阶自回归形式,3、若随机变量的取值只与前几期取值有关, 即ut =f(ut-1, ut-2, ),则称u为高阶自相关。 4、如果u高阶自相关,且形如: 称u具有高阶自回归形式。 5.3 自相关检验 1、图示法 以t为横轴,et为纵轴作图,残差et随时间的变化呈现有规律的变动,则et存在自相关,即ut存在自相关。,2、Durbin-Watson检验(DW检验)。 适用于检验一阶自回归形式。 D-W检验内容: 计算D-W统计量 可以证明此值约在04之间。根据样本容量n和解释变量数k查 D-W分布表,得到临界值dl和du,然后按照下列标准考察计算 得到的D-W值,以判断模型的自相关状态。,注意: (1)、D-W检验只能判断是否存在一阶自相关,对于高阶自相关或非自相关皆不适用。 (2)、不适用于联立方程组中的各方程随机项的序列相关检验。 (3)、不适用于模型中含有滞后的被解释变量的情况。 例:yt=b0+b1xt+b2yt-1+ut 此时即使模型存在自相关,DW值也经常接近2,因此不能用D-W检验。杜 宾提出了Durbin-h统计量: 杜宾证明:当一阶自相关系数 时,h统计量近似服从标准正态分布, 所以利用正态分布可以对一阶自相关性进行检验。,3、回归检验法 建立线性回归模型,用ols法求出残差et(为ut的估计值) 建立et与et-1、et-2的相互关系模型(用多种函数形式试验) 对不同的形式用ols进行参数估计,再进行显著性检验,如果估计是显著成立,说明随机项ut存在序列相关。 4、高阶自回归形式检验 Breusch-Godfrey(布罗斯-戈弗雷)检验或拉格朗日乘数检验 对模型y=b0+b1x1i+bkxki+ut 设自相关形式为:,5.4 自相关模型的经济计量方法 针对自相关产生的原因,可给出不同的处理方法。 如果是模型中省略了重要的解释变量,使随机项产生了 自相关,则应重新建立模型; 如果是模型建立不当,应重新建立模型; 如果是由于数据加工的原因,可增加样本容量、变换数 据处理形式等。 除了上述原因外还存在自相关,这就是真正的自相关。 如果模型存在真正自相关,其他假定都满足,则可采用广 义最小二乘法、差分法、迭代法等估计参数。,(1)广义差分法 若自相关系数已知 以一元为例,设模型为 Yt=b0+b1Xt+ut , t=1,2, , n (1) 随机项具有一阶自回归形式: ut= ut-1+ , 是随机变量,满足前述假定。 将模型(1)减去(1)滞后一期并乘以 得: Yt- Yt-1=b0(1- )+b1(Xt- Xt-1)+ (2) 令Yt*= Yt- Yt-1 Xt*=Xt- Xt-1 ,t=2, ,n 此种变换称为广义差分变换。这种变换损失了一个观测 值,为避免损失,K.R.凯迪雅勒提出做如下变换: Y1*= Y1 X1*= X1 (2)式写成: Y1*= b0(1- )+b1 Xt*+ (3) 这样就可对(3)应用OLS进行参数估计。 如果是多元线性回归模型,处理方法类似。,(3)迭代估计或Cochranc-Orcutt(科克伦-奥克特)估计,(2)广义最小二乘法(GLS) 适用于异方差及自相关(方差及协方差已知)的情况。加 权最小二乘法是广义最小二乘法的特例。 设线性回归模型为如下矩阵形式: Y=Xb+U 存在异方差及自相关,其他假定均满足。则模型的期 望、方差协方差阵为: E(U)=0 , Var-Cov(U)=E( )= W W=,设W是已知的正定对称阵,则存在非奇异阵, 使得 从而 用 左乘模型两端,得新模型: Y = Xb + U 令Y* = Y X*= X U*= U 则模型变为 Y*= X*b+ U* 该模型具有同方差性,对该模型应用普通最小二乘估计,得参 数估计量为: 广义最小二乘估计量具有线性性、无偏性、最小方差性。,第六章 多重共线性 6.1 多重共线性 1、概念 多重共线性包括解释变量之间完全线性关系和接近线性关系。 完全线性关系是指多元线性回归模型解释变量之间出现了线性相关。即存在不全为零的常数 , , , 使得 x1t+ x2t + + xkt =0 接近线性关系是指多元线性回归模型解释变量接近线性相关。即存在不全为零的常数 , , , 使得 x1t+ x2t + + xkt 0 或 x1t+ x2t + + xkt +ut=0 ut为随机项。 解释变量之间不存在完全的和接近的线性关系,则称无多重共线性。,2、多重共线性产生的原因 各经济变量之间的内在联系(生产函数中肥料、种植面 积等具有同方向变动趋势);经济变量数据在时间上具 有同方向变动趋势;模型中引入了滞后变量(如Xt,Xt-1) 6.2 多重共线性的后果 解释变量之间如果存在多重共线性,仍用普通最小二乘 法会产生以下后果: 若解释变量之间存在完全多重共线性,则无法求出参数 估计值(因 的逆不存在);若解释变量之间存在不 完全线性关系,参数可以估计,但参数的方差很大, 在对参数进行T检验时,增大了接受零假设的可能性,错 误地舍弃了重要的解释变量。预测也就失效。也会导致参数的符号不符合经济意义。,6.3 多重共线性的检验 检验方法主要有判定系数法、相关系数法(适用于两个解释变量的情形)、方差膨胀因子检验、逐步回归法等。 判定系数法: 对于 k个解释变量,把其中一个解释变量对其他k-1个解 释变量进行线性回归,然后根据其判定系数的大小,来 判定是否存在多重共线性。即分别做以下回归: X1=a1X2 +a2X3+ +ak-1Xk+ut X2=a1X1 +a2X3+ +ak-1Xk+ut Xk=a1X1 +a2X2+ +ak-1Xk-1+ut 各回归方程的判定系数为R12,R22, ,Rk2,从中找出 最大者,如Rj2,若Rj2接近于1,则可判定Xj与其他解释变 量中的一个或多个相关程度高。从而判定原模型中由于 引进了解释变量Xj,而导致高度的多重共线性。,方差膨胀因子检验 对于多元线性回归模型,参数b1估计值方差可以表示成,6.4 克服多重共线性的方法 1、除去不重要的解释变量; 2、利用已知信息。 柯布-道格拉斯生产函数,当规模报酬不变时,就可消除 解释变量之间存在的多重共线性。 Y=AL K eu ,A0,L0,K0,Y0 两边取对数得 :lnY=lnA+ lnL+ lnK+u 若 则 ln = lnA+ ln +u 令 Y*=ln , X*=ln ,a=lnA , 则原模型化为 Y*= a+ X*+u 这是不存在多重共线性的一元线性回归模型。,3、逐步回归法 步骤(1)设有k个解释变量,分别建立k个一元线性回归模型,取显著成立中样本决定系数最大的一个为基本方程。 (2)在基本方程中分别引入第二个变量,建立k-1个二元线性回归模型,从中选较优的: 如果新引进的解释变量符合经济意义,使拟合优度R2有所提高,并且每个参数统计检验显著,则引入该变量; 如果新引进的解释变量不能提高拟合优度R2,对其他参数无明显影响,则可舍弃改变量; 如果新引进的解释变量提高拟合优度R2,对其他参数的符号和数值有明显影响,统计检验也不显著,可以断定新引入的解释变量引起了多重共线性。在共线性程度最高的两个解释变量中,舍弃对被解释变量影响较小的。 (3)在选定的二元线性回归模型中,再加入第三个变量,如此下去,直至无法引入新变量为止。 4、改变模型的形式; 5、增加样本容量;,第七章 单方程回归模型的几个专题 7.1 虚拟变量 7.1.1 概念 一、在现实经济生活中,除了一些可以直接获得实际观测 数据的定量变量外,还有一些定性(或属性)因素变量,例 如年龄、性别、天气等,在一般情况下是不可计量的,称这 样的变量为虚拟变量。 二、经济模型中引入虚拟变量的作用 1、可以描述和测量定性(或属性)因素的影响; 2、能正确反映经济变量之间的相互关系,提高模型的精度; 3、便于处理异常数据。,三、虚拟变量取值 为了将这些变量引入模型,必须将其数量化,比如当虚拟变量 起作用时取值为1(或0),不起作用时取值为0(或1)。 含有虚拟变量的模型称虚拟变量模型。 虚拟变量通常作为解释变量。 7.1.2 虚拟变量的设置 1、虚拟变量的设置规则 (1)一个因素m个属性,在模型中引入m-1个虚拟变量,否则产生多重共线性。 (2)m个因素各两种属性,则引入m个虚拟变量。 (3)虚拟变量的取值(1或0)应从分析问题的目的出发予以界定。 (4)虚拟变量在单一方程中可作为解释变量,也可作为被解释变量。,2、虚拟变量的引入方式 (1)一个因素两种属性,模型中引入一个虚拟变量 例1:研究消费问题时,消费主要是由收入决定,但同 时必须考虑一些反常年份,如战争、天灾等。 假如边际消费倾向不变,可设消费函数模型为 Ct=b0+b1xt+b3Dt+ut, Ct:消费,xt:收入, Dt= 当这一模型满足普通最小二乘法假定条件时,可应用 普通最小二乘法求出消费函数回归方程 :,例2:对某地区生产同一产品的各企业生产进行研究,产量(Y)不仅受资金投入(K)、劳动力投入(L)影响,而且与生产工艺有关,假设用甲、乙两种不同的生产工艺,就可以建立虚拟变量模型。 引入虚拟变量,(2)一个因素多个(m个)属性,引入m-1个虚拟变量,这样可避免产生多重共线性。 例:设公司职员的年薪(y)与工龄(x)及学历(D)有关,学历因素分三种属性:大专以下、本科、研究生,应设置两个虚拟变量。虚拟变量模型为 yt=b0+b1xt+b2D1t+b3D2t+ut (3)多个(m)因素两种属性,引入个虚拟变量。 例:住房消费问题支出的影响因素有可支配收入、城乡差异、不同收入层次等因素,虚拟变量模型为 yt=b0+b1xt+b2D1t+b3D2t+ut,2、虚拟变量的引入方式 (1)加法引入虚拟变量 (2)乘法引入虚拟变量 (3)加法和乘法引入虚拟变量 7.1.3 虚拟变量的特殊应用 1、调整季节波动 例如:利用季节数据分析某公司利润(y)与销售收入(x)之间的关系时,为研究四个季度对利润的季节性影响,引入三个虚拟变量, 利润函数为 yt=b0+b1xt+a1D1t+a2D2t+a3D3t+ut,2、检验模型结构的稳定性 设同一总体两个样本的回归模型分别为 样本1:yt=b0+b1xt+ut 样本2:yt=a0+a1xt+ut 设虚拟变量 将样本1与样本2合并,建立以下模型: yt=b0+(a0-b0)Dt+b1xt+(a1-b1)xtDt+ut 利用t检验判断a0-b0和a1-b1是否显著为零。 当a0=b0和a1=b1显著成立时,表明两模型之间没有显著差异,称为“重合回归”,模型结构稳定。 当a1=b1 显著成立, a0=b0不显著成立时,表明两模型之间差异表现在截距上,称“平行回归”,模型结构不稳定。,当a0=b0显著成立,a1=b1不显著成立时,表明两模型之间差异表现在斜率上,称“汇合回归”,模型结构不稳定。 当a0=b0与a1=b1均不显著成立时,表明两模型之间差异显著,称“相异回归”,模型结构不稳定。 3、分段回归 分段回归:在解释变量x的值达到某一水平x*之前,解释变量与被解释变量存在某种线性关系;当x的值超过某一水平x*之后,解释变量与被解释变量的关系就会发生变化。此时,如果已知x*,我们就可以用虚拟变量来估计每一段斜率。 例:进口商品的消费支出(y)受国民生产总值(x)的影响,1978年前后,两者的回归关系明显不同,此时可建立虚拟变量模型,以1978年为转折点,1978年的国民生产总值x=x*为临界值,建立如下模型: Yt=b0+b1xt+a(xt-x*t)Dt+ut,4、混合回归 建立计量经济模型时,时序数据与截面数据都能得到,能否将它们“混合”成一个样本来估计模型?只要模型参数不随时间而改变,并且在各个截面之间没有差异,就可以使用混合样本估计模型。 因此在合并样本之前,需要比较使用不同样本建立的模型之间是否存在显著差异。即判断各时点用截面数据建立的模型结构是否稳定。 例7.11,7.2 模型的设定误差 1、模型中解释变量的构成、模型的函数形式及有关随机的若 干假定等内容的设定与客观实际不一致,利用计量经济模 型就会产生误差,把这种误差称为模型的设定误差。 2、模型设定误差的类型 遗漏了重要的解释变量;包含无关的解释变量;采用了不 正确的函数形式 3、模型存在设定误差的后果 遗漏了重要的解释变量,其参数最小二乘估计量是有偏的或非一致的;模型包含无关的解释变量其参数最小二乘估计量是无偏的,但非有效(不具有方差最小性)。,4、模型设定误差的检验 (1)模型是否包含无关解释变量的检验 用t检验 (2)模型遗漏重要解释变量和采用错误形式的检验 看残差大小、调整的样本决定系数大小、DW检验值等。 应用随机误差项项的估计量进行检验 第一步:对所建立的模型应用相宜的计量经济学方法进行估计。 第二步:求残差et 第三步:以et为纵轴,以各解释变量为横轴描绘出散点图,如果对于解释变量的n个观测值,et的绝对值都很小,且波动也不大,说明模型没遗漏重要的解释变量和采用了错误的函数形式。否则应重新构建模型。,应用DW统计量进行检验 基本思想:若模型遗漏了重要的解释变量,这个解释变量就应含在随机项中,因此随机项存在序列相关。 7.3 模型变量的观测误差 若模型存在观测误差,用OLS法进行参数估计常常低估了回归参数。 观测误差问题是是数据问题,目前没有有效的解决方法,一般忽略此问题。,7.4 随机解释变量 解释变量是随机变量,在经济现象中是常见的,因许多 经济变量不能用控制的方法进行观测。 分以下两种情形讨论: 1、当解释变量X与随机变量u不相关,即Cov(X,u) = 0 (可用OLS估计参数): 当X与u独立,用OLS估计参数,得到的估计量是无偏的。 当X与u不独立,用OLS估计参数,得到的估计量是一致的。 对参数估计仍可采用最小二乘估计法。 2、当解释变量X与随机变量u相关,即Cov(X,u) 0,若用OLS估计参数,估计量非无偏、非一致。 对参数估计应用工具变量法。,工具变量法的基本思路:当随机解释变量与随机误差项相关时,则寻找另一个变量,使之与随机解释变量高度相关,但与随机误差项不相关,称其为工具变量,用其代替随机解释变量。 选择工具变量的要素: 工具变量必须是有明确经济含义的外生变量; 与随机解释变量高度相关,而又与随机误差项不相关; 与模型中的其他解释变量也不相关; 模型中多个工具变量不相关。 工具变量法的缺陷: 寻找工具变量难 工具变量选取不同,模型参数估计值也不一致 使用工具变量得到的估计值,有可能产生较高的标准差。,第八章 分布滞后模型 一、滞后变量与滞后变量模型 Xt 为即期变量,Xt 1,Xt 2, ,Xt s 称为滞后一期、滞后两 期 滞后s期变量,统称为滞后变量。 把滞后变量作为解释变量的模型称滞后变量模型。例如: Yt=a+b0Xt+b1Xt-1+ +bsXt-s+ c1Yt-1+ +csYt-k+ut S、k分别为滞后期长度。若滞后其长度有限(无限),称为有限(无限)滞后变量模型。 1、分布滞后模型 如果滞后变量模型中没有滞后被解释变量,形如: Yt=a+b0Xt+b1Xt-1+ +bsXt-s+ut 2、自回归模型 如果模型仅包含解释现期值和被解释变量的若干滞后值,形如: Yt=a+b0Xt+ b1Yt-1+ +bsYt-k+ut 称k为自回归阶数。,二、有限分布滞后模型及其估计 Yt=a+b0Xt+b1Xt-1+ +bsXt-s+ut 不能采用OLS,因可能出现多重共线性,且在s较大,样本较小时,很难对众多的参数进行估计。 可采用经验加权法、阿尔蒙多项式法。 1、经验加权法 根据实际经济问题对滞后变量赋于一定的权数。递减滞后型;不变滞后型;A型滞后型。 2、阿尔蒙多项式法 将分布滞后模型中的参数bi近似用一个关于i的低阶多项式表示(bi=a0+a1i+a2i2+amim,mk),从而减少模型中的参数。M的确定具有主观性。 滞后期长度s的确定:可凭经验,也可通过统计检验。如检验被解释变量与解释变量各期的相关系数;观察调整的样本决定系数,在模型中逐步添加滞后变量、扩大滞后期

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论