Chapter1线性回归模型OLS估计_第1页
Chapter1线性回归模型OLS估计_第2页
Chapter1线性回归模型OLS估计_第3页
Chapter1线性回归模型OLS估计_第4页
Chapter1线性回归模型OLS估计_第5页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

观察多个自变量对一个因变量的影响。比方,施肥量、土质与农业产量的关系,受教育年数、工龄、性别对收入的影响,警察数目、下岗员工对城市犯法率的影响等。以双变量为例。x1、x2对y存在影响,同时x1和x2之间也存在有关关系。以下图。X1yX21.1模型设定假定变量yt与k个变量xtj,j=1,,k,存在线性关系。多元线性回归模型表示为,yt01x1tLkxktut错误!文档中没有指定款式的文字。.1此中y是被解说变量(因变量),xjt是解说变量(自变量),u是随机偏差项,i,i=0,tt1,,k是回归参数(往常未知)。这说明xjt,j=1,,k,是yt的重要解说变量。ut代表其余影响yt变化的随机要素。给定一个样本(yt,xt1,xt2,,xtk),t=1,2,,T,上述模型表示为,y11x11Lxj1Lxk10u1y21x12Lxj2Lxk21u2错误!文档中没有MLLLLLLMMyT(T1)1x1TLxjTLxkTT(k1)k(k1)1uT(T1)指定款式的文字。.2令y11x11Lxj1Lxk1y2,1x12Lxj2Lxk2yXLLLLLMLyT(T1)1x1TLxjTLxkTT(k1)0u1β1u2,uMMk(k1)1uT(T1)则式能够写为,y=X+u错误!文档中没有指定款式的文字。.31.2参数预计参数的点预计1.最小二乘法(OLS)设残差平方和用Q表示,??????Xβ)'(yXβ)Q=u'u=(yy)'(yy)(y????错误!文档中y'yβ'X'yy'Xββ'X'Xβ???y'y2y'Xββ'X'Xβ没有指定款式的文字。.4上式中,因为????的一阶偏导数,并令其为β'X'y是一个标量,所以有β'X'yy'Xβ。求Q对β'零,Q?错误!文档中没2X'y2X'Xβ0?β有指定款式的文字。.5化简得,X'y?X'Xβ假定1解说变量之间线性没关。Rank(X'X)=Rank(X)=K+1错误!文档中没有指定款式的文字。.6此中Rank()表示矩阵的秩。即解说变量之间相互线性没关。假如假定1成立,能够直接获得β的最小二乘预计量?β,?1错误!文档中β(X'X)X'y没有指定款式的文字。.7y????形式:?X'XX'yPy错误!文档中没有yX指定款式的文字。.8??[IXX'']uyyyPyXXy[IXX'XX'](Xβu)XβuXβXX'XX'u[IXX'XX']uMu

错误!文档中没有指定款式的文字。.9此中,PXX'XX',称为映照矩阵。Py表示y对X回归的拟合值。MIXX'XX',称为零化子矩阵。My表示y对X的残差项。所以,y老是能够表示为y=Py+My。能够证明,P和M都是对称幂等矩阵,即M=M',P=P'M2=M'M=M',P2=P'P=P'错误!文档中没有指定款式的文字。.10且有PX=X,MX=0错误!文档中没有指定款式的文字。.11M+P=I,PM=0由正规方程组可得??0。从而可得????。即X'(yX)0,即X'u(Py)'Myy'P'Myy'PMy0FML定理接下来我们介绍OLS预计量的一个重要性质,即FML定理(FrischandWaugh(1933)、Lovell(1963))。这必定理表现了线性回归模型参数的经济含义。在虚构变量等问题的处理中重要的应用。将所有的解说变量拆分为两部分。模型表述为:yXβXβu错误!文档中没1122有指定款式的文字。.12残差平方和为:Q(y?X?X?X?X1β12β2)'(y1β12β2)y'y?X2?(X?X??X?错误!文档中没112y'y?X??1'??2'1?2??'2')XXXβXββXβXββ有指定款式的文字。.13对应的正规方程组为:Q??0?X1'y2X1'X1β1X1'X2β2β1错误!文档中没有QX2'y2X'X?X'X??22β2β0β2指定款式的文字。.14由(1)式可得:?(')11'(')1'?1X1X1XyX1X1X1X2β2β错误!文档中没有1(X1'X1)X1'(yX2β2)指定款式的文字。.15由此能够看出,假如?1X1'X20,则β1(X1'X1)X1'y。即当X2与X1正交时,模型yX1β1X2β2u与yX1β1u的参数预计量是完整相同的。将()式带入正规方程(2)可获得解:?1X2'[IX1X1'X1X1']X2X2'[IX1X1'X1X1']yβ2错误!文档中没1X2'M1X2X2'M1y有指定款式的文字。.16此中,M1表示X1的零化矩阵,依据零化矩阵的性质,?M1Myβ(X2'1X2)(X2')21(X2'M1'M1X2)1(X2'M1'M1y)错误!文档中没有??1??(u21'u21)(u21'uy1)指定款式的文字。.17此中,?21回归的残差项,?1回归的残差项。由u21M1X2表示X对Xuy1M1y表示y对X此获得以下定理。Frisch-Waugh定理:yX1β1X2β2u与M1y(M1X2)β2v获得相同的预计量和残差。即,y对X、X的回归方程中,X的参数预计量等价于y对X回归的残差项对X对X回归的122121残差项进行回归获得的参数预计量,两者的残差也是相同的。这必定理表示,多元回归模型yX1β1X2β2u中,回归参数β2表现了“清除”(partialout)X1影响后的“净”影响。所以,β2也称作“偏回归系数”,表现了X2对y的净影响,称之为“偏影响”(partialeffect)。也正是因为回归参数β表现了清除X21影响后的“净”影响,所以把X称作“控制变量”。也就是说,固然实质经济环境中,我1们几乎不可以控制X的变化。但在多元回归模型中,β已经把X的影响清除去了,所以β2121理解为“当其余条件不变的状况下”,X2对y的边沿影响。对于以下构造关系:X1X2y假如回归模型y01x11x2u,参数1的预计量不会明显,因为将x2的影响清除后,x1对y不存在任何影响。参数预计量的散布特色设真切的DGP为y=X0+u此中,0为真切的参数。假如模型设定正确的话,即y=X+u我们来看参数预计量的统计特色。对于模型错误设定的状况,请拜见本章“模型的设定剖析”部分。1.一致性设模型的参数为???拥有一致性。一致性意味θ,预计量为θn。假如plimθnθ,则称θn着跟着样本量的增添,参数预计量能够无穷靠近真切参数,即预计量的散布为真切参数那一点。也就是说,跟着样本量的增添,我们能够对真切参数作出愈来愈精准的推测。一致性是对参数预计量的最低要求。假如预计偏差与样本量没有关系,那么很难成立真切参数与参数预计量之间的关系。?1(X'y)β(X'X)1(X'u)β(N1X'X)1(N1X'u)错误!文档中没β(X'X)有指定款式的文字。.18由假定Rank(X)=K和大数定律,样本均值的概率极限等于整体均值,可得:Plim(N1X'X)E(X'X)A错误!文档中没Plim(N1X'u)E(X'u)0有指定款式的文字。.19又由Slustky定理,Plim(N1X'X)1A1。由此可得?10β错误!文档中没PlimββA有指定款式的文字。.20?2.β的无偏性?u的随机性,所以,将?β的随机性根源于β写为对于u的表达式。?111错误!文档中没β(X'X)X'y(X'X)X'(Xβ0u)β0(X'X)X'u有指定款式的文字。.21即?是随机向量u的线性组合。β假如X为确立性变量,则?β的希望为:?β0E[(X'X)1X'u]β0(X'X)1X'E(u)0E(β)所以,?是的线性无偏预计量。β

错误!文档中没有指定款式的文字。.22但将X做为确立性变量过于简单。大部分状况下,X与y相同,拥有明显的随机特色。假定2u对于X的条件希望为0。E[u|X]=0。假定2也称作X拥有严分外生性。拥有两个基本含义。第一个含义是,u的无条件均值也为0。这一特色能够经过迭代希望公式直接导出。E(u|X)=0E(u)=E[E(u|X)]=0错误!文档中没有指定款式的文字。.23第二个含义是,u与X以及X的任何函数正交,不有关。Eg(X)uEEg(X)u|XEg(X)E(u|X)0错误!文档中没有指定款式的文字。.24Cov(g(X),u)=E{[g(X)-E(g(X))][u-E(u)]}=E[(X-E(X))u]=E{[g(X)-E(g(X))]u}=E{g(X)u–E[g(X)u]}E[g(X)u]-E[g(X)]E(u)=0当g(X)=X时,u与X正交,u与X不有关。E(Xu|X)=XE(u|X)=0,E(Xu)=E[E(Xu|X)]=E(X)E(u|X)=0Cov(X,u)=E[(X-E(X))(u-E(u))]=E[(X-E(X))u]=E[Xu]-E(X)E(u)=0?β的条件希望为:?β0E[(X'X)1X'u|X]β0(X'X)1X'E(u|X)β0错误!文档E(β|X)中没有指定款式的文字。.25自然,?的无条件希望为:βE(?)EE(?|)|Xβ0错误!文档中ββX没有指定款式的文字。.26?0的线性无偏预计量,拥有无偏性。所以,β是与之有关的此外一个较弱的假定是,u对于X的条件希望为0。E[u|X]=0。tttt3.?的有效性β假定3随机偏差项向量u是同方差、无序列有关的。即协方差矩阵为:100Var(u|X)=2I=200错误!文档中没有指001定款式的文字。.27OLS预计量的方差矩阵为:Var(?|)E[(?)(?)'|X]βXββ0ββ0E[(X'X)1X'uu'X(X'X)1|X]错误!文档中2(X'X)1没有指定款式的文字。.28此中,2(X'X)-1第i行第j列的元素表示第i个参数预计量和和第j个参数预计量的协方差。当i=j时(即对角线上的元素),表示第i个(包含常数项)参数预计量的标准差。高斯马尔科夫定理:在假定1~3成立的条件下,OLS预计量是最有效的线性无偏预计量。?%?%即:设β是OLS预计量,β为其余无偏预计量,那么var(β|X)var(β|X)。依据迭代希望公式,能够获得?%。将线性回归模型中OLS预计量称之为最var(β)var(β)佳线性无偏预计量(BLUE)。4.方差根源的方差对于统计推测以及经济解说都是至关重要的。方差越大,说明预计量越不精准,β所以参数的置信区间就越大,假定查验也就越不正确。假定关注变量x2,设DGP为yX1β10x220u,模型设定为yX1β1x22u。依据FML定理,?[x2'M1x2]1[x2'M1y]2[x2'M1x2]1[x2'M1(X1β1x2β2u)][x2'M1x2]1[x2'M1x2β2x2'M1u]2[x2'M1x2]1x2'M1u其方差为:Var(?2)E(x2'M1x2)1x2'M1uu'M1x2(x2'M1x2)102(x2'M1x2)1此中,(x2'M1x2)表示x2对X1回归的残差平方和。所以,方差也能够表述为:Var(?)222(x'Mx)100错误!文档中没02221SSE2(1R22)SST2有指定款式的文字。.292回归的残差平方和与可决系数,T表示x22212此中,SSE、R表示x对X2t1(x2tx2)SST?2的方差根源于三部份:回归标准差2的离差平方和。所以,σ0、解说变量之间的有关性、x2的颠簸。2表现了模型中噪音的成分,2越大),那么解说变量的影响回归标准差σ0噪音越多(σ0就越难以判断,预计量的就越不正确。2σ0是一个整体观点,与样本没关。但它是未知的,在后边的章节推导出其无偏预计量。给定被解说变量y,要想降低σ2,那就需要将更多的成分从随机扰动项中提拿出来,方法只有一个:加入新的解说变量。但加入新的变量其实不总是有效的,后边的章节还会详尽地加以解说。Ri2表现了xi与其余解说变量的线性有关程度。有关程度越高,Ri2就越高,var(?i)就越大。当Ri2→1时,var(?i)→∝。这时,我们称之为多重共线性(multicollinearity)。自然,假如部分解说变量之间存在多重共线性,不会影响其余的参数预计。比方,在下面的模型中:yt=0+1x1t+2x2t+3x3t+ut假如x2t与x3t高度有关,那么var(?2)和var(?3)会比较大。但x2t与x3t的有关性对var(?i)没有影响。事实上,假如x1t、2t都与x3t不有关,即2→0,那么?2x2t、1/1,与xRvar(i)=σSSTx3t之间的有关性没有任何关系。所以,假如模型关注的是x1t,那么就没有必需在意x2t、x3t之间的多重共线性问题。给定其余条件不变的状况下,xi的离差平方和越大,?xi的离差平方β的方差越小。提升和的方法是增添样本容量。当样本容量不停增添时,离差平方和能够无穷大,能够有力地降?针对人们面对多重共线性问题的困扰提出了小样本问题低β的方差。ArthurGoldbergermicronumerosity),拜见Goldberger(1991)。区间预计我们已经知道了?。依据前文所β的散布形式,假如进行区间预计的话,还需要预计述,u?=Mu。残差平方和为??u'Mu错误!文档中没u'u(Mu)'Muu'M'Mu有指定款式的文字。.30则残差的方差预计量s2??错误!文档中没u'u/(TK1)u'Mu/(TK1)有指定款式的文字。.31因s2是一个标量,所以有E(u?u?E[tr(u'Mu)]E[tr(Muu')]')tr[E(Muu')]tr[ME(uu')]tr[M2I]2tr[M]2tr[IXX'XX']2tr(I)tr[XX'XX']2Ntr[X'XX'X]2(NK1)??K1)]2?2??E[u'u/(Nu'u/(NK1)

错误!文档中没有指定款式的文字。.32此中tr()表示矩阵的迹。tr(I)=T,tr(X(X'X)-1X')=k+1。因为对于矩阵ABC有tr(ABC)=tr(BCA)=tr(CAB),所以tr(X(X'X)-1X')=tr((X'X)-1X'X)=tr(I)=k+1。因而可知s2是的无偏预计量。获得了?的方差预计量,就能够建立区间预计了。方法与第一章相同,此处不予赘述。β残差的散布接下来我们进一步观察残差的特色。上边我们利用残差预计随机偏差项的方差,后边很多统计查验都要利用残差。由u?Mu,?0E(u)???2MVar(u)E(uu')E(Muu'M')能够获得几个基本结论。(1)每个残差都是所有偏差项的线性组合。所以,固然u同方差、无序列有关,但?是异方差、存在序列有关的。(2)Var(u?i)2(1hii)。所以,残差的方差u小于随机偏差项的方差。杠杆越高的观察值,残差的方差越小。与之有关系的此外两种残差为标准化残差与学生化残差。标准化残差为eiuis1hii),学生化残差为?/(?/(s(i)1hii)。此中,s(i)表示删除第i个观察值后偏差项的标准差。riui标准化的回归系数参数预计量是有量纲的,所以不可以直接比较不一样解说变量的相对重要性。假如要比较不同变量的相对重要性,能够第一将所有的解说变量进行标准化,这样便将其变换为没有量纲的观点了。yt*yty,xkt*xktxk,ut*utus(yt)s(xt)s(ut)而后利用标准化后的解说变量进行回归,****L***yt01x1tkxktut标准化的回归系数0*,1*,L,k*除去了量纲,能够直接用于比较不一样变量重要性。思虑题:标准化的回归系数0*,1*,L,k*与最先模型的回归系数(0,0,,k)存在什么关系?例错误!文档中没有指定款式的文字。.1观察CEO年薪方程Salary=0+1roe+2sale+3ros+u此中,salary表示CEO年薪(千美元),roe为前三年的均匀财产利润率(%),sale表示公司销售额(百万美元),ros表示股票利润率(%)。(数据文件:ceosal)(1)计算OLS预计量、95%的置信区间。.regresssalaryroesaleros,level(95)noheader(2)计算残差、标准化残差、学生化残差;察看每个指标的描绘指标.predictres,residual.predictres_std,rstandard.predictres_stu,rstudent.summresres_*例错误!文档中没有指定款式的文字。.2预计薪资收入方程,wage=0+1educ+2exper+3tenure+u此中,wage表示薪资(千美元),educ表示接受教育的程度(年),exper表示工龄(年),tenure表示在现有岗位的任职时间(年)。(数据文件:wage1)(1)计算OLS预计量、99%的置信区间。.regresswageeducexperexpersqage,level(99)noheader(2)计算标准化的回归系数.regresswageeducexperexpersqage,betalevel(95)noheader1.3模型查验拟合优度y的变化由两部分惹起,一是解说变量X=(x1,x2,,xk)(注意,X不包含常数项),二是随机偏差项。那么解说变量与偏差项对y的变化所作的贡献怎样权衡呢?拟合优度即回归线对散点的拟合程度。回归线拟合散点的程度越好,则表示解说变量对y的解说能力就越强。1.可决系数考虑以下两个模型:yy

01x1Lkxkuv模型中不包含X只有常数项时,0的OLS预计量为y,残差为v?yy。将X归入模型以后,获得的残差项为?y?。因为X的加入,使得模型的偏差项减小了uy????y。这即是被X所解说的部分。所以,能够经过被X所解说的部vu(yy)(yy)y分在y的离差中所占比率来权衡X对y的解说能力。总离差平方和T2T2T22SSTt1(yty)t1yt2yt1ytTyy'yTy,错误!文档中没有指定款式的文字。.33回归平方和为T)2T22T2SSR(?ty?ty?tTyt1yt1yt1y由回归直线的性质:y与y?的均值相同,可得T2,所以回归平方和又能够写为:y?Tyt1ytSSR??Ty2错误!文档中没y'y有指定款式的文字。.34残差平方和为T?T??错误文档中没SSE)2?2t1(ytytt1utu'u!有指定款式的文字。.35则有以下关系存在,SST=SSR+SSE错误!文档中没有指定款式的文字。.36证明:y'y???u?'u?y?'y??u?'u?y?'y?u?'u?β'X'Xβ2β'X'u?2β'X'u?因为?,所以X'u0y'y????????错误!文档中β'X'Xβu'uy'yu'u没有指定款式的文字。.37y'yTy2??????2??β'X'Xβu'u(y'yTy)u'u平方和除以它相应的自由度称为均方。回归均方定义为MSR=SSR/k,偏差均方定义为MSESSE/(T-k-1)(即随机偏差项的方差预计量)。2.拟合优度R2计算y?的变差占y的变差的比值是评论一个预计模型好坏的方法之一。多重可决系数定义以下:2SSRy?y?Ty2R'错误!文档SSTy'y-Ty2中没有指定款式的文字。.38明显有0R21。R2越靠近1,预计的回归函数对样本点的拟合优度越好,即解说变量对被解说变量的解说作用越强。3.调整的拟合优度R2对于给定的样本值yt,总离差平方和是固定不变的。但跟着模型中解说变量个数的增添,残差平方和渐渐减小,所以可决系数R2渐渐增添。结论1:增添解说变量时,残差平方和的变化。在模型yXβu中加入新的解说变量z时,yXβzu的残差平方和为:%%u?'u?2%%错误!文档中没有指定u'uc?(uzX'uzX)款式的文字。.39此中,%表示yXβzu的残差平方和,u?表示yXβu的残差平方和,zX表示zu%对X回归的残差平方和。证明:设yXβzu的回归纳果为y%u%。依据分块矩阵的预计公式,Xβzc?1?β(X1'X)X1'(y),可得:11X2β2%1?1β(X'X)X'(yzc)β(X'X)X'zc错误!文档中没有指定款式的文字。.40所以,%%?1uyXβzcyXβX(X'X)X'zczc?1错误!文档中u[IX(X'X)X']zcu?Mzcu?u?zXc没有指定款式的文字。.41新模型的残差平方和为:u'u(u?u?zXc)'(u?u?zXc)u?'u?2u?'u?zXccu?zX'u?zX错误!文档中%%2没有指定款式的文字。.42依据Frisch-Waugh定理,c(zMz)1(zMy)(u?zX'u?zX)1(u?u?错误文档中''zX')!没有指定款式的文字。.43即?'?(?'?)。所以,uzXucuzXuzXu'uu?'u?cu?zX'u?zX!文档中%%2错误没有指定款式的文字。.44结论2:增添解说变量时,可决系数的变化由上述结论,u%%'uu?'u?(u?zX'u?)2/(u?zX'u?zX)u?'u?(1ryz2)错误!文档中没有指定款式的文字。.45此中,ryz2表示控制变量X时y与z的偏有关系数。上式两边同时除以总离差平方和,可得RXz2RX2(1R2X)ryz2错误!文档中没有指定款式的文字。.46所以,当模型中加入新的解说变量的时候,模型的残差平方和老是递减的,可决系数总是递加的。为考虑模型中解说变量个数的变化对R2的影响,定义调整的多重可决系数R2如下,R21SSE/(Tk1)T1SSTSSRSST/(T1(k)()1)T1SST错误!文档中没T11()(1R2)Tk1有指定款式的文字。.47当在模型中增添解说变量时,SSE将减小,同时T-k-1也减小。从而使SSE的减小量得到必定赔偿。往常R2的值比R2小。有时还会出现取负值的状况。增添新的解说变量时,R2可能会增添,也可能会降低。这取决于新的解说变量对y的解说能力。结论3:增添解说变量时,调整的可决系数的变化。假如新增添的变量的t统计量大于(小于)1,则模型的调整的可决系数会增添(降落)。4.非中心化的R2当模型中没有常数项时,?的均值不必定为0,y与?的均值也不必定相同。所以,等uy式SST=SSR+SSE不必定成立,即总离差平方和(SST)不可以分解为回归平方和(SSR)与残差平方和(SSE)两部分。这时R2可能会出现负值或许大于1的状况。这时可采纳非中心化的拟合优度。我们知道,()式老是成立的,即y的平方和恰巧分解为拟合值的平方和与残差平方和。定义非中心化的可决系数为:Ru2y?'y?(Py)'(Py)1(My)'(My)错误!文档中没y'yy'yy'y有指定款式的文字。.48对照可决系数与非中心化的可决系数能够看出,假如模型中存在常数项,当y的均值为时,两者是完整相同的。对y进行线性变换*2不变。即,y由以米为单位变成以厘米为单位,或许以u公斤为单位变成以斤为单位不会改变2*=al+y,则R2会发生相uu应的变化。alyP(aly)M(aly)alPyMyRu2yy?'?(alPy)'(alPy)1(My)'(My)yy'(aly)'(aly)(aly)'(aly)X中不包含常数项。当a增添时,Ru2也随之增添。所以,当模型中包含常数项时,假如2会比较高。但2常数项比较大,则RuRu更多地是由常数项带来的,并无直观的经济意义。所以,在解说模型的可决系数或非中心化的可决系数时,第一要明确2的计算方法及Ru其可能存在的问题,防止对模型的错误会读。例错误!文档中没有指定款式的文字。.3计算例的方差剖析表及R2等指标。.regressceosalret例错误!文档中没有指定款式的文字。.4计算例的方差剖析表及R2等指标。.regresswageeducexperexpersqage整个方程的明显性查验假定4:随机偏差项听从正态散布。当查验被解说变量yt与一组解说变量x1,x2,...,xk能否存在回归关系时,给出的零假定与备择假定分别是H:1=2=...=k=0;0H1:i,i=1,...,k不全为零。查验思路:无拘束模型为:t=0+11t2x2t++kktt(a)yx+x+u,受拘束模型:yt=0+vt(b)假如原假定成立,那么模型(a)中的参数1,,k均不明显,模型(a)与模型(b)的残差平方和近似相等。假如备择假定成立,那么模型(a)中起码有一个变量是明显的,而模型(b)中的随机扰动项ut包含了这些明显性的变量,所以模型(b)的残差平方和会明显高于模型(a)的残差平方和。模型(a)的残差平方和表示为SSE(此中U表示没有拘束(Unrestricted))UT??L?2SSEUt1(yt01x1tkxkt)模型(b)的残差平方和表示为R(此中R表示带有拘束(Restricted))SSESSERT%2t1(yt0)所以,能够依据残差项方差的变化来查验假定是不是正确的。假如(SSER-SSEU)比较大(小),则偏向于拒绝(接受)原假定。正式的统计查验是经过建立以下F统计量来达成的。(SSERSSEU)/k错误!文档中没有F1)SSE/(TkU指定款式的文字。.49在H0成立条件下,有F(k,T–k–1)由查验思路能够看出,F统计量越大(小),我们越偏向于拒绝(接受)原假定。所以,这是右单端查验。查验能够临界值方法和建立p值的方法来达成。设查验水平为,查验规则以下。1.临界值法:若FF(k,T–k–1),则接受H;若F>F(k,T–k–1),则拒绝H。002.P值法:若P(x>F)>α,接受H0;若P(x>F)<α,,拒绝H0。拒绝H0意味着必定有解说变量与yt存在回归关系。若F查验的结论是接受H0,则说明k个解说变量都不与yt存在回归关系。此时,假定查验应当到此为止。当F查验的结论是拒绝H0时,应当进一步做t查验,从而确立模型中哪些是重要解说变量,哪些是非重要解说变量。查验统计量还能够写为此外一种形式。拘束模型(b)中的0预计量为%y,所以,0其残差平方和又等于离差平方和SST。所以,F统计量又能够写为:(SSERSSE)/k(SSTSSE)/kSSR/kFUUU错误!文档中没SSEU/(Tk1)SSEU/(Tk1)SSEU/(Tk1)有指定款式的文字。.50此中,SSRU表示无拘束模型的回归平方和。注:当模型中没有常数项时,Stata输出的R2为非中心化R2;而F统计量也是鉴于非中心化的F统计量,即(SSR/k)/[SSE/(n-k)]。思虑题:证明,在一元回归模型中,F统计量与t统计量存在关系:F=t2?单个回归参数的拘束查验当F查验拒绝H0时,其实不见得每个解说变量都对yt有明显的解说作用(即不见得每一个都是重要解说变量),所以还应付每个解说变量的系数进行明显性查验。查验统计量为:tj(?jj*)s(?j)错误!文档中没有指定款式的文字。.51结论:在基本假定1~4的条件下,上式中的t统计量听从(N-K-1)个自由度的t散布。?*?j*2证明:tjjjj?2(X'X)jj12(X'X)jj1?2?*?jj令zj~Normal(0,1),由β~Normal[β,(X'X)]可知,zj~Normal(0,1)。2(X'X)jj1tjzjzj错误!文档中?2/2??2)/(NK1)(u'u/没有指定款式的文字。.52假如(?'?/2)~2j独立的话,就能够证明上述结论。uu(NK1),并且与zu?u?u'Muuu'22'M错误!文档中没有指定款式的文字。.53依据概率统计中的两个基本结论:(1)假如向量x~(,),为幂等矩阵,则x'Ax~2,即自由度为矩阵A的秩;()Rank(A)N0InA2假如A为幂等矩阵,则Rank(A)=Trace(A)以及基本假定u~N(0,2I),可得:u'u/22~(NK1)由M'X'可得NK。所以,??2的自由度为--1。Trace(M)=--1u'u/NK由?X'X?ββX'u及uMu,可得,??E[X'XX'uu'M|X]cov(β,u|X)X'XX'E[uu'|X]M2X'XX'[IXX'XX']0综上所述,可获得结论:tj(?jj*)s(?j)~t(NK1)

错误!文档中没有指定款式的文字。.54查验的鉴别方法与简单线性模型的完整相同,此处不予赘述。线性拘束查验与整个方程的明显性相近似,假如仅对此中部分变量的结合明显性进行查验,也能够按照相同的思路利用F查验来进行。将所有的解说变量分解为两部分,X1=(1,x1,x2,,xJ)和X2=(xJ+1,,xK)。模型从头表述为:y=X1β1+X2β2+u错误!文档中没有指定款式的文字。.55此中,共有K个变量,此中X1含有K1个变量,X2含有K2个变量,K=K1+K2。原假定与备择假定分别是H0:β2=0;H1:β2≠0。无拘束模型为:y=X1β1+X2β2+u错误!文档中没有指定款式的文字。.56受拘束模型为:y=X1β1+u错误!文档中没有指定款式的文字。.57假如原假定成立,则无拘束模型的残差平方不可以明显地提升模型的解说能力;假如备择假定成立,能无拘束模型应明显地降低受拘束模型的残差平方和。F统计量为:(SSERSSEU)/K2(RU2RR2)/K2错误!文档中没有指F(1RR2)/(TK)SSEU/(TK)定款式的文字。.58在H0成立条件下,有F(K2,T–K–1)判断规则与整个方程的判断规则完整相同。例错误!文档中没有指定款式的文字。.5在例中,利用F统计量查验变量educ、tenure的结合明显性.testeducexper多个变量的明显性查验-LM查验拉格朗日乘子查验是查验多个变量结合明显性的此外一种常用方法。其基本思路以下。在无拘束模型中,随机扰动项u与X2不有关。假如原假定成立,利用受拘束模型获得的残差项%与X2也不有关。但假如原假定不可立,利用受拘束模型获得的残差项%与X2就会出现uu高度有关。LM查验步骤以下。Step1:回归受拘束模型,提取残差项%;uStep2:利用OLS方法回归协助方程:uαXαXv,记其拟合优度为22R;%112uStep3:LM统计量(也称为得分统计量)为:LMNRu2~K22。需要注意的是,(1)在协助回归方程中,固然u%X1放在模型中;与X1是正交的,也要把不然,查验统计量不再渐进听从卡方散布。1中,假如1(2)常数项包含在XX中不包含常数项,则2%1Ru采纳非中心化的可决系数。事实上,因为0均值,所以,X包含常数项的时u为候,可决系数与非中心化的可决系数是相同的。线性拘束的F查验线性拘束查验是指查验回归系数的某个或某几个线性组合。对于模型y=X1β1+X2β2+u原假定形式为:H0:Rβq此中,R为J×K矩阵,J表示对K个参数的J个线性拘束。对于上述原假定建立F统计量?1?F(Rβq)'[R(X'X)R'](Rβq)/J错误!文档中没u?'u?/(NK)有指定款式的文字。.59结论:假定1~4成立,假如原假定成立,则上述F统计量听从自由度为(J,N-K)的F散布。证明:将F统计量写为:?2R(X'X)1R']1?F(Rβq)'[(Rβq)/J错误!文档中没u?u?/2)/(NK)('有指定款式的文字。.60令?211???22wR(X'X)R']/~(NK)。此刻只要要证明w(Rβq)'[(Rβq)。前文已经证明u'u听从卡方散布,且与u?'u?/2互相独立刻可。令v????Rβq,假如原假定成立,则vRβqRβ(Rβ)R(ββ)。其希望和方差分别为:E(v)E[R(?)]0ββ?2R(X'X)1R'var(v)Rvar(ββ)R'依据结论:假如n维随机向量x~N(μΣ,),则(xμ)'Σ1(xμ)~2(n),可得w~(2J)。是?2?2wβ的函数,而u?'u?/是u?的函数。前文已经证明,β与u?w与u?'u?/是独立的。所以,也互相独立。?2R(X'X)1R']1?综上所述,(Rβq)'[(Rβq)/JF(u?'u?/2)/(N~F(J,NK)。K)查验步骤以下。Step1:依据上式计算F统计量。Step2:依据对应自由度的F散布查临界值Fcrit。Step3:假如F>Fcrit,则拒绝原假定;不然,接受原假定。实质上,前面的整个方程的明显性查验、部分参数的结合明显性查验、单个参数的明显性查验都是线性拘束查验的特别形式。比方,在模型lwage=0+1exper+2educ+u查验1=0,即010012'0查验1=2=0,即010'00001201查验1=2,即011012'01个自由度的t散布的平方为1个自由度的卡方散布,所以假如只有一个拘束时,F~F(`1,NK)t(2NK)。所以,对于参数关系的单个拘束也能够利用t查验来达成。例错误!文档中没有指定款式的文字。.6教育(educ)和工作时间(tenure)的对薪资的影响相同,即查验:1=2。.testeduc=tenure工龄(exper)对薪资没有影响,即查验:3=0。.testexper对上边两个假定进行结合查验,即查验:1=2,=0。3.testeduc=tenureexper说明:与整个方程的明显性相近似,线性拘束的F统计量也是经过比较受拘束模型与无拘束模型的残差平方和来建立。无拘束模型:yXβu受拘束模型:yXβu,st..Rβq对于受拘束模型的OLS预计,最小化残差平方和%%%%L(βλ,)(yXβ)'(yXβ)2λ'(Rβq)%%L(βλ,)%2X(yXβ)2R'λ0β%%L(βλ,)λ2(Rβq)0利用分块矩阵求解,可得:%?1R'[R(X'X)1R']1?ββ(X'X)(Rβq)11?λR'[R(X'X)R'](Rβq)残差项为:

错误!文档中没有指定款式的文字。.61错误!文档中没有指定款式的文字。.62错误!文档中没有指定款式的文字。.63%?%?%?u%yXβ(yXβ)(XβXβ)u?X(ββ)

错误!文档中没有指定款式的文字。.64受拘束模型的残差平方和为:%?%?%?%?错误!文档中没有u%%'u[u?X(ββ)]'[u?X(ββ)]u?'u?(ββ)'X'X(ββ)u?'u?指定款式的文字。.65由()式,%?(X'X)1R'[R(X'X)1R']1?错误!文档中没有ββ(Rβq)指定款式的文字。.66%?%??11?(ββ)'X'X(ββ)[(Rβq)'][R(X'X)R'](Rβq)错误!文档中没有指定款式的文字。.67故而可得无拘束模型与受拘束模型的残差平方和的差为:???11?(Rβq)'[R(X'X)R'](Rβq)错误!文档中没u%%'uu'u有指定款式的文字。.68查验统计量为:(u%%'u?1R']1?22)/Ju?'u?)/J(Rβq)'[R(X'X)(Rβq)/J(RRUFu?'u?/(NK)(1R2)/(N错误!文档中u?'u?/(NK)K)没有指定款式的文字。.69鉴别方法与整个方程的明显性查验相同。(非)线性拘束的Wald查验对于一般的参数拘束(包含线性拘束和非线性拘束)的查验的此外一种常有的方法是Wald查验。原假定为:H0:c(β)qWald查验统计量为??1?wald[c(β)q]'var[c(β)q][c(β)q]

错误!文档中没有指定款式的文字。.70依据Delta方法(拜见附录:概率统计),???????var[c(β)q]C(β)var(β)C(β)',此中,C(β)c(β)/β'

错误!文档中没有指定款式的文字。.71所以,Wald统计量又能够写为:????1?错误!文档中wald[c(β)q]'C(β)var(β)C(β)'[c(β)q]没有指定款式的文字。.72结论:假如原假定成立,则Wald统计量渐进听从J个自由度的卡方散布,J表示拘束条件的个数。假如参数拘束为线性形式,即H0:c(β)qRβq0。则???C(β)c(β)/β'R??var[c(β)q]Rvar(β)R'所以,Wald统计量为??1wald?[Rβq]'Rvar(β)R'[Rβq]事实上,F统计量与Wald统计量之间的关系是渐进等价的。?1R']1?(Rβq)'[R(X'X)(RβFu?u?/(NK)'?2R(X'X)1R']1?(Rβq)'[(Rβ

/Jq)J?2/2由Plim?22,F与W*1?2R(X'X)1R']1?J(Rβq)'[(Rβq)拥有相同的极限散布。??21而Wald统计量中var[Rβq]Rvar(β)R'R(X'X)R',所以,JW*正是Wald统计量。也就是说,JF与Wald统计量都渐进听从J个自由度的卡方散布。例错误!文档中没有指定款式的文字。.7在花费模型:const=0+1inct+2const-1+ut中,长久边沿花费偏向MPC=1/(1-2),利用数据预计模型,并查验MPC>1;H0:MPC≥1;H1:MPC<1拘束形式为:c(β)1/(12);q1???[1/(12),1/(12)2]'C(β)c(β)/β'Wald统计量为:?q]'???1?wald[c(β)C(β)var(β)C(β)'[c(β)q][?1/(1?2)?2),?1/(111][1/(1?2)2]Cov(?1,?2)[1/(1?2),?1/(1?2)2][?1/(1?2)1].regressconspgdpp.testnl_b[gdpp]*(1-_b[])=1可得:F=,拒绝原假定。1.4模型的设定剖析上边所剖析的预计量的统计特色都是鉴于模型设定正确的前提。假如模型设定错误,那么会直接影响到参数预计量的统计散布特色。这里,我们介绍两种情况,过分设定和欠设定。过分设定假如模型的解说变量中加入了原来与y不有关的变量xj,我们称之为过分设定(overspecify)。设真切DGP为yXβu,u~NIID(0,2I)00但模型设定为:yXβZγu依据FML定理,%XMX1XMyβXMX1XMuβ[Z][']Z]Z'Z0[''希望值和方差分别为:%βE(β)0%E(X'MZX)1X'MZuu'MZX(X'MZX)1Var(β)02(X'MZX)1假如模型设定正确,即yXβu,则其预计量的方差为?21。由Var(β)0(X'X)X'XX'MZXX'(IMZ)XX'PZX(PZX)'PZX%?。即模型中加入剩余的变量,不会影响参数预计量的无偏性,但会可知,Var(β)Var(β)影响有效性。除非PZX%?。但在一般状况下,解说变0,即X与Z正交,则Var(β)Var(β)量会存在必定程度的有关。并且,加入的剩余变量越多,则预计量的方差越大,越不正确。欠设定与过分设定相对应,假如把原来与y有关的变量清除在模型以外,那么我们称之为欠设定(underspecifying)。设真切DGP为yXβZγu,u~NIID(0,2I)000模型设定为:yXβuOLS预计量的希望为%1X'y(X'X)1X'(Xβ0Zγ0u)β(X'X)β0(X'X)1X'Zγ0(X'X)1X'u%(')1'βXZγ00参数预计量的偏差取决于两个要素,Z对X回归的系数以及Z对y的回归系数。Z对X的影响越大,或许Z对y的影响越大,都将致使参数预计量较大偏差。只有X'Z0或γ00时,参数预计量才拥有无偏性。因为预计量是有偏的,用均方偏差(MeanSquaredError)计算预计量的精准度。%E(%%βββββMSE( )0)(0)'=E%%%%%%'ββββββββE()E( )0E( )E()0=E%%%%'%%'ββββββββE()E( )E()0E()0%E(%%'βββββ=Var())0E( )0对于无偏预计量,均方偏差等于方差。%%%%MSE(β)E(ββ0)(ββ0)'Var(β)能够计算出,预计量的MSE为%2XX1XX1XZγγZXXX1β0()()'()MSE( )'''00'''相对于过分设定模型,欠设定模型的均方偏差可能更有效、也可能非有效,取决于上述公式的第二部分的大小。例错误!文档中没有指定款式的文字。.8利用蒙特卡罗模拟观察模型过分设定与欠设定对参数预计量的影响。假定DGP为y=10+2x1+5x2+u,此中,x1与x2的有关系数为,u~NIID(0,1)。模型1设定为

y=

0+

1x1+

2x2+u,模型

2设定为

y=

0+

1x1+u,模型

3设定为

y=

0+

1x1+

2x2+

3x3+u。x1与

x3的有关系数为,

x2与

x3的有关系数为。每次生成

200个观察值,模拟

1000次,察看模型1、2、3的参数预计量的散布。(程序言件:).simulateunder_b=(r(under_b))under_se=(r(under_se))c_b=(r(c_b))c_se=(r(c_se))over_b=(r(over_b))over_se=(r(over_se)),reps(1000)nodots:spec.twoway(kdensityunder_b,lpattern(dot))(kdensityc_b,lpattern(solid))(kdensityover_b,lpattern(dash))1.5异样点检测异样点是指对预计量拥有较大影响的观察值,即假如删除某个观察值会惹起预计量的较大变化。删除第i个观察值后,参数预计量为:?(X'X)1X'y(i)(i)(i)(i)(i)能够等价地表述为:??h1XX1Xu?1βi)β(1)()。此中,hiXi(X'X)Xi',即映照矩阵的(i'ii第i个对角元素,称为杠杆。所以,第i个观察值对预计量的影响取决于一个很重点的要素,即h。h介于[0,1],且和为k+1。iihiTr[X(X'X)1X']Tr[(X'X)1X'X]k1假如一个观察值拥有较大的杠杆,则它对预计量拥有较大的潜伏影响。相同地能够求出,删除第i个观察值的残差为:??(1)1?Xiβ(i)hiui(i)yiui??(1hi)1?uiui(i)huiiDFITS(WelschandKuh,1977)、Cook距离(Cook,1977)和Welsch距离(Welsch,1982)、COVRATIO(Belsley,KuhandWelsch(1980))都是描绘杠杆与残差平方之间关系的统计量。DFITSirihii/(1hii),表现了用保存与删除第i个观察值的样安分别预计方程的拟合值的差别;Cook距离与Welsch距离表现了删除第i个观察值后系数向量之间的距离,Cook距离Di1s(i2)2,Welsch距离DiDFITSi(n1)/(1hi)。COVRATIO是Belsley,2DFITSiksKuhandWelsch(1980)提出的测度单个观察值对预计量协方差矩阵影响的统计量,它等于用保存与删除第i个观察值的样安分别预计方程的协方差矩阵的队列式的比,COVRATIO1nkei2ink11hi此中,e表示标准化的残差。对于正常的观察值,COVRATIO近似等于1。较高的残差或较高的杠杆率都会致使COVRATIO偏离1。但假如残差和杠杆率都比较高,那么COVRATIO也近似等于1,这时就没法利用COVRATIO判断异样值。DFBETA是测度不一样解说变量的单个观察值对模型预计影响的最直接的统计量,它等于用保存与删除第i个观察值的样本别预计方程的标准化参数的差别。DFBETAirimi,U2jmjU2(1hi)此中,mi表示用xj对其余解说变量回归获得的残差。假如DFITS超出2k/n(Belskey,KuhandWelsch(1980)),或许Cook距离超出4/n(BollenandJackman,1990),或许Welsch距离超出3k(ChatterjeeandHadi,1988),或许|COVRATIO1|3k/n(Belsley,KuhandWelsch(1980))、或许DFBETA超出2/n,都是值得关注或作进一步观察的样本点。此中,k表示模型中的解说变量个数(包含常数项)。例错误!文档中没有指定款式的文字。.9利用DFBETA、CORATIO等统计量观察例的异样点(1)利用杠杆-残差平方图进行察看.regresssalaryroesaleros.lvr2plot,mlabel(code)(2)利用DFITS、Cook距离、Welsch距离、COVRATIO、DFBETA统计量进行察看。.predictdfits,dfits.listcoderoesalerosifabs(dfits)>2*sqrt(4/209).predictcooksdife(sample),cooksd.listcoderoesaleroscooksdifcooksd>4/209.predictwelsch,welsch.listcoderoesaleroswelschifabs(welsch)>3*sqrt(4).predictcovratio,covratio.listcoderoesaleroscovratioifabs(covratio-1)>=3*4/209.predictdfbeta,dfbeta(ret).listcoderoesalerosdfbetaifabs(dfbeta)>2/sqrt(209)1.6虚构变量在实质建模过程中,被解说变量不只受定量变量影响,同时还有可能受定性变量的影响。比如需要考虑性别、民族、不一样历史时期、季节差别、公司所有制性质不一样样要素的影响。这些定性变量也应当包含在模型中。计量经济学是利用数据研究经济学识题,所以,在对这些定性变量进行模型预计以前第一需要将其量化,即用必定的数值代表其观察值。不一样的类型的变量被量化的程度是有差别的,定性变量在量化时所代表的信息是最少的。定性变量的量化称为虚构变量,马上分类变量变换为二元指示变量。虚构变量在模型中能够作为解说变量,也能够作为被解说变量。本节中所办理的是虚构变量作为解说变量的状况。虚构变量假如一个变量拥有m个类型,能够设定m个虚构变量。比方,性别设定为以下形式:1男性)0男性)。male,female女性)0女性)1学历(分为大学、中学、小学三个类型)设定为以下形式:1大学)1中学)1小学)univ其余),high其余),elem其余)000可是,要注意到male+female=l,univ+high+elem=l,即虚构变量之和恰巧等于模型中的常数变量。所以,对于m个类其余分类变量,能够依照两种方法加以设定。保存模型中的常数变量,仅加入(m-1)个虚构变量;或许m个虚构变量所有作为解说变量,将常数项删掉。被删掉的虚构变量中1所对应的类型称作基础类型。比方,季节虚构变量,1季度)12季度)13季度)D1,D20,D30,0其余季度)其余季度)其余季度)14季度)D40其余季度)模型设定为(X不包含常数变量)y1D12D23D34D4Xγu错误!文档中没有指定款式的文字。.73第1、2、3、4季度所对应的回归方程的截距项分别为、2、、4。虚构变量的13系数表示对应类其余回归方程的系数。假如将模型设定以下(以第1季度作为基础类型)y1l2D23D34D4Xγu错误!文档中没有指定款式的文字。.74上边两个方程是完整等价的。将D1+D2+D3+D4=l代入模型,可获得两个方程系数的对应关系。y1(D1D2D3D4)2D23D34D4Xβu1D1(12)D2(13)D3(14)D4Xβu所以,模型()中的常数项表示基础类其余回归方程的系数,虚构变量表示其余类型与基础类型回归系数的差别。例错误!文档中没有指定款式的文字。.10随机检查美国旧金山地域20个家庭的积蓄情况,成立年积蓄额yt(千美元)对年收入xt(千美元)的回归模型。(数据文件:save)察看两个变量的散点图,用能否租房作为标签加以标志。.twoway(scattersaveincome,mlabel(rent))明显,租房家庭与有房家庭的积蓄行为寄存明显差别。模型中加入虚构变量,rent,对于租房家庭,rent=0,对于有房家庭,rent=1。从头回归方程,.regresssaveincomerent例错误!文档中没有指定款式的文字。.11在例中,加入行业虚构变量,从头回归方程。(数据文件:ceosal)。.regresssalarysalesroeindus-utility例错误!文档中没有指定款式的文字。.12在例中加入性别、种族变量,从头回归方程。(数据文件:wage1).regresswageeducexpertenurefemalenowhite例错误!文档中没有指定款式的文字。.13NationalOpinionResearchCenter’sGeneralSocialSurvey收集了1972~1984年妇女就业、家庭等有关数据。利用数据剖析家庭儿童个数的变化规律。控制变量包含:教育程度、年纪、种族、地域、生活环境(乡村、城镇、小城市等)。(数据文件:fertil1)kids=0+1educ+2age+3age2+4race+5farm+6town+7D74+8D76+9D78+10D80+11D82+12D84+ut.regresskidseduc-d84季节虚构变量季节颠簸是好多季度数据的共同特色。对季节数据进行计量剖析时,需要第一对其进行季节调整,除去其季节颠簸成分,利用季节调整后的序列进行剖析。季节调整的方法以下。回归模型:ySγu此中,S表示季节虚构变量组成的向量。季节调整的序列则为:ysau?MSy或许ysayu?假如要同时除去序列的季节成分和趋向成分,则能够将模型为:ySγtu此中,t表示时间趋向变量。季节调整的退势序列则为:ysau?MSTy或许ysay?u例错误!文档中没有指定款式的文字。.14第一对天津市1998~2006年的季度GDP、投资等数据进行季节调整,而后对季节调整的投资对季节调整的GDP进行回归,Invest_sa=0+1GDP_sa+u。(数据文件:tjpbc2).xi:regressgdp.predictgdp_sa,res.summgdp.replacegdp_sa=gdp_sa+r(mean).xi:regressinvest.predictinvest_sa,res.summinvest.replaceinvest_sa=invest_sa+r(mean).regressinvest_sa办理季节数据的此外一种方法是,直接在模型中加入季节虚构变量,Invest=0+1GDP+2S1+3S2+4S3+u,事实上,第一进行季节调整,而后利用季节调整序列进行剖析,与在模型中直接加入季节虚构变量是等价的。依据FML定理,ySγXβv(1)中的能够经过回归以下方程获得,MSyMSXβv(2)而Msy和MsX即是季节调整后的序列。所以,表现了经过季节调整序列的X对季节调整序列y的边沿影响。对于时间序列数据,采纳季节调整序列(2)、与模型中加入季节虚构变量(1),获得相同的预计量。例错误!文档中没有指定款式的文字。.15用天津市季度GDP对季度投资数据进行回归,模型中加入季节虚构变量。(数据文件:tjpbc2).regressInvestGDP自然,实践中官方宣布的季节调整数据不是简单地利用虚构变量来进行办理的。所以,利用其季节调整序列与在模型中直接加入虚构变量会获得不一样的预计结果。1.7线性回归模型的构造剖析构造模型中,观察变量构造关系的两个常用观点是边沿与弹性。前文所介绍线性模型中,变量x对y的边沿影响是常数。接下来我们来看在其余几种常有模型中的构造解说。对数模型先来观察几种常有对数模型。对数函数:yt=0+1Lnxt+ut错误!文档中没有指定款式的文字。.75指数函数:Lnyt=β0+β1xt+ut错误!文档中没有指定款式的文字。.76幂函数:Lnyt=β0+β1Lnxt+ut错误!文档中没有指定款式的文字。.77此中Ln表示自然对数。方程()中,y与x是对数函数;方程()中,y与x是指数函数;方程()中,y与x是幂函数。这些方程中,被解说变量对于参数都是线性的,所以能够直接进行OLS预计、查验。对方程求偏导数可得:dy=1dx/x错误!文档中没有指定款式的文字。.78dy/y=1dx错误!文档中没有指定款式的文字。.79d/y/y=1dx/x错误!文档中没有指定款式的文字。.80dx表示x的变化量,dx/x表示x的变化率。所以,模型()的经济含义为:其余条件不变时,x每变化100%,y相应变化β1个单位;即x每变化1%,y相应变化β1/100个单位。模型()的经济含义为:x每变化1个单位,y相应变化100β1%。模型()的经济含义为:即x每变化1%,y相应变化β1%个单位。在指数模型中,参数表现的y的变化率,而这一变化率为常数,所以也被称作常数增添率模型。下表列出了几种模型设定形式的经济解说模型形式含义经济解说t=0+β1xttd=β1dx变化一个单位,y变化β1个单位yβ+uyxyt=β0+β1Ln(xt)+utdy=β1dx/xx变化1%,y变化β1/100个单位(t)=0+1t+td=β1dxx变化一个单位,y变化(100β1)%βxuLnyβLn(y)=β+βLn(x)+dy/y=β1dx/xx变化1%,y变化β1%t01tut对变量取自然对数是对经济数据办理的常用方法。一方面,变量取自然对数后,参数体现了变化率或弹性的观点。另一方面,取自然对数有助于降低变量的颠簸,除去异方差。其三,对于时间序列,变量自然对数的差分变量近似表示变量的增添率。自然,其实不是所有的变量都合适取对数。1.假如变量不合适以增添率来表述,则不合适取对数。比方,以时间为测度单位变量,如受教育的年数、年纪、工龄等。2.比率变量一般偏向于不取对数。比方失业率、犯法率、入学率等。假如对其取对数形式,那么必定要注意其经济解说。比方,设GDP增添率对失业率回归Gowth=+Unem+u两者均以增添率(%)表示,设最先的失业率为8%。回归系数β解说为当失业率增添一个百分点的时候,即由8%增添至9%的时候,GDP增添率会变化β个百分点。假如失业率取对数形式,Gowth=+ln( )+uUnem那么回归系数β应解说为当失业率改动1%的时候,即由8%增添至8%(1+1%)=%的时候,GDP增添率会变化β/100个百分点。3.当变量y为非负数时,能够采纳ln(y+1)作为y的对数变量。除了0点以外,在其他点上,对系数的经济解说不变。上述模型中,变量取自然对数表示变化率的观点。这里的变化率是针对连续变量的状况。也能够计算失散状况下的变化率。比方,模型()=β0+1x+u,x变化一个单位时,iiiln(y)变化β1。设新的取值为yf。即yln(yf)ln(yi)ln(yf/yi)1,可得yf/yiexp(1),变化率为(yfyi)/yiexp(1)1。例错误!文档中没有指定款式的文字。.16薪资收入模型Ln(wage)=0+1educ+2exper+3tenure+4female+5nowhte+u回归模型.regresslnwageeducexpertenurefemalenowhite能够依据公式exp(1)1计算出比较精准的薪资差别。实质上,对变量取对数除了表现其变化率的观点以外,对于好多半据带来此外一种利处,即降低变量的有偏散布,使其靠近于正态散布。我们能够察看对数薪资的散布图,并与薪资的散布做比较。.histogramwage,normal.histogramlnwage,normal.tabstatsalarylnsalary,statistics(skewnesskurtosis).sktestsalarylnsalary偏度和峰度指标以及正态散布查验统计量显示,固然薪资取对数后仍旧不听从正态分布,但相对与薪资来讲,状况已经改良了好多。例错误!文档中没有指定款式的文字。.17常数增添率模型因为指数模型的回归系数表示y的变化率,而这一变化率是常数,所以指数模型在时间序列中的一个重要应用是常数增添率模型(即变量的增添率为常数)。Ln(yt)=ln(y0)+ln(1+g)*t=+t表示y的连续增添率,能够依据公式exp(1)1计算失散增添率。以利用常数增添率模型计算我国1952-2002年时期的经济增添率。(数据文件:cnmaro)。.genlny=ln(y).gentime=_n.regresslnytime年均(失散)增添率为g?exp(?)1=。附:设y的增添率为常数g,那么y的变化曲线为:yt=y0(1+g)t两边取对数,能够获得:Ln(yt)=ln(y0)+ln(1+g)*t=+t此中,=ln(y0),=ln(1+g)代表y的连续增添率,而g代表了y的失散增添率,g=exp(1)1。例错误!文档中没有指定款式的文字。.18利用ZellnerandRevankar(1970)美国制造业的数据进行以下剖析。变量包含:valueadd=各个州机械制造业的产出增添值,nfirm=各个州的公司个数,capital=各个州的公司资本,labor=各个州的公司劳动力。(数据文件:zellner)(1)预计CD生产函数.genlny=ln(valueadded/nfirm).genlnk=ln(capital/nfirm).genlnl=ln(labor/nfirm).regresslnylnklnl,noheader(2)计算模型的拟合值、残差项,并作图。.predictlny_f,xb.predictlny_fse,stdp.scatterlnylny_f(3)查验假定:行业处于规模酬劳不变的状态。.testlnk+lnl=1例错误!文档中没有指定款式的文字。.19利用ChristensenandGreene(1976)数据(文件:),预计以下成本函数Ln(Cost)=0+1Ln(Q)+2Ln(Plabor)+3Ln(Pcapital)+4Ln(Pfuel)+u依据经济理论,1表现了规模利润,而2+3+4=1。.regresslncostlnqlnpllnpklnpf.testlnpl+lnpk+lnpf=1.testlnq=1多项式模型假如模型中的解说变量含有某个变量的多项式函数,则称之为多项式函数模型。二次多项式和三次多项式是两种常有的多项式函数。三次多项式模型:y=

b0+b1x

+

b2x2+

b3x3+

u

错误!文档中没有指定款式的文字。.81二次多项式模型:y

=

b0+

b1

x+

b2x2+

u

错误!文档中没有指定款式的文字。

.82比方,拉弗曲线、库兹涅茨倒U曲线、均匀成本与产量都表现为二次多项式关系,总成本与产量表现为三次多项式关系。多项式模型表现了

x对

y的非线性影响。比方,在二次多项式模型中,

x与y

之间表现为抛物线形状,

x对

y的边沿影响为

b1

+2b2x。x

y的影响取决于

x的取值。假如

b2为负值,则表示x对y的边沿影响是递减的。例错误!文档中没有指定款式的文字。.20薪资收入模型中加入工龄的平方项,从头回归方程。log(wage)=0+1educ+2exper+3tenure+4exper2+u.genexpersq=exper^2.regreslnwageeducexperexpersqtenure交错积模型假如变量x对y的影响依靠于此外一个变量x,则我们称x与x存在交错影响。模型1212顶用交错积来表现变量的交错影响。比方,模型y01x12x23x1x2ux1对y的边沿影响为13x2。即,x1对y的影响直接取决于x2的取值。交错效应中一种常有形式是带有虚构变量的状况,或许是一个连续变量与虚构变量的交叉积,或许是两个虚构变量的交错积。例错误!文档中没有指定款式的文字。.21在积蓄方程的事例中,加入虚构变量与收入的交叉积。Save=0+1Rent+2Income+3RentIncome+u此中,1表现了租房家庭与有房家庭在截距项的差别,即相同收入水平上的有房家庭比租房家庭的积蓄额超出1。2表现了租房家庭与有房家庭的收入对积蓄的边沿影响的差异,即有房家庭比租房家庭的边沿积蓄偏向超出2。.genrent_inc=rent*income.regresssaveincomerentrent_inc例错误!文档中没有指定款式的文字。.22在薪资收入方程中,加入性别与种族的交错积,Ln(Wage)=0+1Educ+2Exper+3Tenure+4Female+5Nowhite+6Female*nowhite+u4表现了薪资的性别差别,5表现了薪资的种族差别,5表现了性别差别在不一样种族也不一样。.genfem_now=female*nowhite.regresslnwageeducexpertenurefemalenowhitefem_now例错误!文档中没有指定款式的文字。.23利用ZellnerandRevankar(1970)数据预计超对数生产函数Ln(Q)=225Ln(L)Ln(K)+u0+1Ln(L)+2Ln(K)+3Ln(L)+4Ln(K)+.regresslnqlnllnklnlsqlnksqlnllnk预计资本和劳动力的产出弹性,并对CD生产函数进行拘束查验。劳动力的产出弹性为(L)=1+23Ln(L)+5Ln(K),资本的产出弹性为(K)=2+24Ln(K)+5Ln(L),规模酬劳系数为(L)+(K)。拘束3=4=5,获得了CD生产函数。.testlnlsqlnksqlnllnk例错误!文档中没有指定款式的文字。.24观察教育程度、性别对薪资的影响。数据包含了1975、1985年的检查数据。(数据文件:cps78_85)模型设定:log(wage)=0+1y85+2educ+3y85educ+4exper+5union+6female+7y85female+u.regreslnwagey85-y85female例错误!文档中没有指定款式的文字。.25KielandMcClain(1995)研究了废物焚化厂对周边(NorthAndover,Massachusetts)房子价钱的影响。1978年有信息流传要在NorthAndover成立废物焚化厂,1981年正式动工(1985年正式营运)。利用1978年、1981年的房子价钱数据查验:废物焚化厂周边的房子价钱低于远处的房子价钱。房子价钱为实质价钱(清除物价指数的影响)。(数据文件:kielmc)方程设定以下:rprice=0+1y81+2nearinc+3(y81nearinc)+u,此中,nearinc为0-1虚构变量。0表现了远处1978年的价钱,1表现81年与78年的远处房子价钱差别,2表现了1978年远处与近处房子价钱的差别,3表现了近处与远处的房子价钱在1981的差别与1978年的差别的变化。问题归纳于查验3的明显性。.regressrpricey81nearin

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论