选择函数形式_第1页
选择函数形式_第2页
选择函数形式_第3页
选择函数形式_第4页
选择函数形式_第5页
已阅读5页,还剩53页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

选择函数形式目录6.1过原点回归6.2尺度与测量单位6.3标准化变量的回归6.4回归模型的函数形式6.5怎样测度弹性:对数线性模型6.6半对数模型:线性到对数与对数到线性模型6.7倒数模型6.8函数形式的选择6.9关于随机误差项的性质第2页,共58页,2024年2月25日,星期天6.2尺度与测量单位1988-1997年美国私人国内总投资与国内生产总值GPDIBL=以1992年10亿美元计私人国内总投资GPDIM=以1992年百万美元计私人国内总投资GDPB=以1992年10亿美元计国内生产总值GDPM=以1992年百万美元计国内生产总值第3页,共58页,2024年2月25日,星期天假使在GPDI和GDP的回归中某一研究者使用以10亿美元计的数据,而另一研究者使用以百万美元的同样变量的数据。这两种情形的回归结果是否会是一样的?为了回答Y和X的测量单位是否会造成回归结果的任何差异这个问题,我们令:其中Y=GPDI,X=GDP。定义:其中w1

和w2

为常数,称为尺度因子(scalefactors),w1

和w2

可以相等或相异。如果Y和X是以10亿美元度量的而现在改用百万美元去表示,则有第4页,共58页,2024年2月25日,星期天现考虑使用如下回归:其中我们要找出以下每组变量之间的关系式:第5页,共58页,2024年2月25日,星期天把OLS法应用于新的回归我们得到:

容易证明:第6页,共58页,2024年2月25日,星期天由此可以看出,当尺度因子相同时,即时,斜率系数及其标准差不受尺度从变到的影响。截距及其标准差放大或缩小了w1

倍。若X尺度不变(即w2=1),而Y的尺度按因子w1

改变,则斜率和截距系数以及各自的标准差都要乘以因子w1

。若Y尺度不变(即w1=1),而X尺度按因子w2

改变,则斜率系数及其标准误要乘以因子1/w2

,截距系数及其标准差不变。第7页,共58页,2024年2月25日,星期天一个数值例子:1988-1997年美国GPDI与GDP的关系GPDI和GDP都以10亿美元计算:GPDI和GDP都以百万美元计算:如理论所示,(6.2.22)中截距及其标准差都是回归(6.2.21)中相应值的1000倍(w1=1000),但斜率系数及其标准差不变。第8页,共58页,2024年2月25日,星期天一个数值例子:1988-1997年美国GPDI与GDP的关系若GPDI以10亿美元计算而GDP以百万美元计算:仅X改变尺度w2=1000,所以斜率系数及其标准差是(6.2.21)中的1/1000倍。若GPDI以百万美元计而GDP以10亿美元计算:如理论所示,X尺度不变,Y按w1改变,截距和斜率系数及其标准差都是它们在(6.2.21)中的1000倍。第9页,共58页,2024年2月25日,星期天为结果的解释进一言因为斜率系数无非就是变化率,它的单位就是如下比率的单位:因变量Y的单位解释变量X的单位

例如在回归(6.2.21)中,斜率系数0.3016的意义是,GDP每改变一个单位,即10亿美元,GPDI平均改变0.3016个10亿美元。

在回归(6.2.23)中,GDP的一个单位即1百万美元的变化,平均导致GPDI的0.000302个10亿美元的变化。

当然,这两个结果从它们的GDP对GPDI的影响看是完全相同的;只不过用不同的测量单位来表示而已。

第10页,共58页,2024年2月25日,星期天6.3标准化变量的回归刚才我们看到回归子和回归元的单位会影响到回归系数的截距。如果我们把回归子和回归元表示成标准化变量,这种影响就可以避免。于是,在Y对X的回归中,如果我们把这些变量重新定义为:其中=Y的样本均值,=Y的样本标准差,=X的样本均值,=X的样本标准差。变量和被称为标准化变量(standardizedvariables.)第11页,共58页,2024年2月25日,星期天标准化变量的一个有趣特征是,其均值总是0,标准差总是1.注:样本方差自由度为n-1,因为样本中如果知道了均值,那么只需要知道其他n-1个数就可以把样本中每个数都确定了。第12页,共58页,2024年2月25日,星期天于是我们对标准化变量做回归:由于对标准化的回归子和回归元做回归,所以截距项总是零。(截距=因变量的均值-斜率*回归元的均值,对标准化变量而言,因变量和回归元的均值都是零。)(6.3.5)是一个过原点的回归。标准化变量的回归系数(、表示)被称为β系数。如何解释β系数呢?其解释是,如果标准化回归元增加一个单位的标准差,则标准化回归子平均增加单位个标准差(标准化变量的标准差为1)。与传统模型不同,我们度量的变量影响用标准差为单位。(6.3.5)第13页,共58页,2024年2月25日,星期天回到上一例:其中GPDI和GDP以10亿美元计。标准化变量的回归结果为:解释(6.3.6):若GDP提高1美元,则GPDI平均提高0.3美元.解释(6.3.7):若GDP增加一个标准差,则GPDI平均约增加0.94个标准差。第14页,共58页,2024年2月25日,星期天标准化回归模型与传统模型相比有什么优势?1.若不止一个回归,我们就能将它们放在同等地位直接进行比较。2.可以用β系数作为各个回归元相对解释力的一种度量。如果一个标准化回归元的系数比模型中另一个标准化回归元的系数大,那么前者就能比后者更多的解释回归子。注意:传统模型的β系数与这里的β系数之间存在关系,在双变量情形中,这种关系如下:因此,若知道回归元和回归子的样本标准差,则可以将两个β系数相互转换。第15页,共58页,2024年2月25日,星期天6.4回归模型的函数形式如第3章指出的,本课程主要考虑对参数为线性的模型,对变量则可以是或不是线性的。在下面的几节中,我们考虑一些常用的回归模型,它们也许对变量是非线性的,但对参数是线性的。或者可通过适当的变量代换而转变为对参数线性。具体讨论如下的回归模型:1.对数线性模型2.半对数线性模型3.倒数模型4.对数倒数模型第16页,共58页,2024年2月25日,星期天6.5怎样测度弹性:对数线性模型考虑以指数回归模型命名的如下模型:可表达为如果写成其中,这个模型就是对参数α和β2

为线性,并且对变量Y和X的对数为线性,从而可用OLS回归来估计。由于这一的线性性质,这种模型本称为对数-对数(log-log),双对数(doublelog)或对数线性(log-linear)模型。

(6.5.3)第17页,共58页,2024年2月25日,星期天如果经典线性回归模型的假定均得到满足,则可用OLS法估计(6.5.3)中的参数。令其中,。所得的OLS估计量和将分别是α和β2

的最优线性无偏估计量。对数-对数模型一个使它普通应用的特点,是斜率系数β2

测度了Y对X的弹性,也就是由给定的X的百分比的变化引起的Y的百分比的变化。比如说,Y代表对某一商品的需求量,X代表其单位价格,则β2

测度了需求的价格弹性。如图:图6.3(a)给出了需求量与价格的关系,6.3(b)给出了价格弹性(-β2)的估计。第18页,共58页,2024年2月25日,星期天图6.3不变弹性模型第19页,共58页,2024年2月25日,星期天对数线性模型的特点1.该模型假定Y与X之间的弹性系数β2在整个研究范围内保持不变,因此又名不变弹性模型(constantelasticitymodel)。2.虽然和是α和β2

的无偏估计量,但β1

进入原始模型的参数估计本身是一个有篇估计量。然而在大多数实际问题中,截距项都居于次要地位,我们没有必要为得到一个无偏估计量而发愁。在双变量模型中,决定对数线性模型能否拟合好数据的简单办法,是描绘出lnY对lnX的散点图,看是否差不多落在如图6.3(b)那样的直线上。第20页,共58页,2024年2月25日,星期天例:耐用品支出与个人消费总支出之间的关系表6.3给出了个人消费总支出(personalconsumptionexpenditure,PCEXP)、耐用品支出(expenditureondurablegoods,EXPDUR)、非耐用品支出(expenditureonnondurablegoods,EXPNONDUR)和劳务支出(expenditureonservices,EXPSERVICES)。假设我们想求耐用品支出(EXPDUR)对个人消费支出(PCEXP)的弹性。将耐用品支出的对数相对个人消费支出的对数描点。将看到二者之间存在线性关系。因此,双对数模型可以适用。第21页,共58页,2024年2月25日,星期天运用@定义变量:serieslnexdur=@log(expdur)

serieslnpcex=@log(pcexp)第22页,共58页,2024年2月25日,星期天回归结果如下:其中*表示p值极小。如结果所示,EXDUR对PECX的弹性约为1.90这表明,若个人消费支出提高1%,耐用品支出则提高约为1.9%。因此,耐用品支出很容易受到个人消费支出变动的影响。这就是耐用品生产者总是关注个人收入和个人消费支出变动的原因之一。第23页,共58页,2024年2月25日,星期天6.6半对数模型:线性到对数与对数到线性模型经济学家,企业人员与政府常常对某些经济变量,如人口、GNP、货币供给、就业、生产力、贸易赤字等等的增长率感兴趣。假设我们相对表6.3中的数据求出个人劳务消费支出的增长率。令Yt

表示t时期对劳务的真实支出,Y0

表示劳务支出的初始值。复利公式:其中r是Y在时间上的复合的增长率。去自然对数,得现假设:则怎样测量增长率:线性到对数模型第24页,共58页,2024年2月25日,星期天加一个干扰项得:此模型和任何其他线性模型一样,也是对参数为线性的。唯一的区别,在于回归子是Y的对数而回归元是取值为1、2、3等的“时间”。此模型称为半对数模型(semilogmodel),因为只有一个变量以对数形式出现。为便于叙述,只是回归子取对数的模型叫做线性到对数模型。区别之前讲的对数线性模型(意为取对数后为线性)。稍后将考虑回归子是线性而回归元是对数的模型,称为对数到线性模型。第25页,共58页,2024年2月25日,星期天在此半对数模型中,斜率系数度量了给定回归元(在本例中为时间变量t)取值的绝对改变时Y的恒定比例或相对改变量,也就是:

(6.6.7)如果将Y的相对该变量乘以100,则(6.6.7)将给出相对于回归元X的绝对改变量的、Y的百分比变化或增长率。即100乘以β2

给出Y的增长率。100乘以β2

在文献中被称为Y对X的半弹性(semielasticity)。回归子的相对改变量回归元的绝对改变量第26页,共58页,2024年2月25日,星期天例:劳务支出的增长率根据增长模型,考虑表6.3中给出的劳务支出数据,得到回归结果如下:解释:1993年第1季度到1998年第3季度期间,劳务支出以(每季度)0.743%的速度增加。粗略的讲,这等于2.97%的年增长率。截距项7.7890=研究期初EXS的对数,所以取其反对数则得到EXS期初值(1992年第4季度末)为2413.90(单位为10亿美元)。如图是方程给出的散点图。第27页,共58页,2024年2月25日,星期天图6.41972-1991年美国实际GDP的增长:半对数模型第28页,共58页,2024年2月25日,星期天瞬时与复合增长率。增长模型中的β2

给出瞬时(指一个时点)的增长率而不是复合(指一个时期)增长率。只需取β2

估计值的反对数,再减1,再乘以100%.对于该例,估计的斜率系数为0.00743。因此(antilog(0.00743)-1)=(e^0.00743-1)=0.00746或0.746%。因此,在该例中,劳务支出的复合增长率约为每季度0.746%,略高于0.743%的瞬时增长率。这是由于复合效应所致。第29页,共58页,2024年2月25日,星期天线性趋势模型。有时研究者不去估计增长模型,而估计如下模型:不做lnY对时间的回归,而是做Y对时间的回归。该模型称为线性趋势模型(lineartrendmodel),并且把时间变量t取名为趋势变量(trendvariable)。趋势的意思,是一个变量的行为中一种持续上升或下降的运动。如果上式中的斜率系数为正,则Y有一种上升趋势,如果它是负的,则Y有一下降趋势。第30页,共58页,2024年2月25日,星期天考虑劳务支出数据,拟合线性趋势模型的结果如下:该结果释义如下:在1993年第1季度至1998年第3季度期间,劳务支出以每季度约200亿美元的速度增加。即劳务支出有上涨的趋势。增长模型与线性趋势模型之间的取舍,有赖于人们对实际GDP的相对或绝对变化的偏好。尽管对于许多研究目的来说,相对变化更为重要。第31页,共58页,2024年2月25日,星期天在增长模型中,我们感兴趣的是对X的一个绝对单位的变化,Y的百分比增长。现在我们感兴趣的是对X的一个百分比变化,找出Y的绝对变化量。这一模型可写为:我们把这一模型称为对数到线性模型。斜率系数β2

一个数的对数变化就是它的相对变化。对数到线性模型Y的变化lnX的变化Y的变化X的相对变化第32页,共58页,2024年2月25日,星期天用符号表示或这个方程即是说Y的绝对变化等于β2

乘以X的相对变化。如果后者乘以100,则该式给出了X变化1%时Y的绝对变化量。例如变化0.01个单位(或1%)时,Y的绝对变量是

。例如β2=500,那么Y的绝对变化量是0.01(500)=5.0因此,当人们用OLS来估计类似的回归时,要将斜率系数的估计值乘以0.01.第33页,共58页,2024年2月25日,星期天例:印度食物支出回归例3.2有关印度食物支出的例子。若描点则得到图6.5中的散点图。第34页,共58页,2024年2月25日,星期天恩格尔支出模型——德国统计学家ErnstEngel提出:用于食物的总支出以算术级增加,而总支出以几何级数增加。如图所示,食物支出比总支出增加的更缓慢,这可能是恩格尔法则的凭证。将数据拟合到对数线性模型的结果如下:约等于257的斜率系数意味着总支出每提高1%,导致样本中的55个家庭的食物支出平均增加约2.57卢比(注意:将斜率系数乘以0.01)。注意一旦一个模型的函数形式已知,就可根据该定义计算弹性。弹性第35页,共58页,2024年2月25日,星期天6.7倒数模型

属于以下类型的模型均称为倒数(reciprocal)模型。

(6.7.1)虽然此模型对变量X是非线性的,但模型对β1

和β2

却是线性的,因此它是一个线性回归模型。特点:随着X无限增大,项趋于零,而Y趋于极限或渐进值β1

。因此像(6.7.1)这样的模型在结构上有一内在的渐近线或极限值。当变量X值无限增大时因变量将取此极限值。如图为与(6.7.1)相符的一些可能形状。第36页,共58页,2024年2月25日,星期天图6.6倒数模型第37页,共58页,2024年2月25日,星期天图6.764个国家中儿童死亡率与人均GNP的关系第38页,共58页,2024年2月25日,星期天考虑表6.4中给出的数据,目前主要考虑儿童死亡率(CM)和人均GNP这两个变量,描出相应的点如上图。此图与图6.6(a)相似:假定所有其他变量保持不变,随着人均GNP的提高,预计儿童死亡率会因人们能承担更多的健康医疗费用而下降。但这种关系不是一条直线:随着人均GNP的增加,CM首先明显下降,但随着人均GNP继续增加,CM的下降逐渐减弱。如果我们试图拟合倒数模型,得到如下回归结果:(@inv:reciprocal,1/x)随着人均GNP无限增加,儿童死亡率趋近其渐进值,每千人中死亡82人。(1/PGNP)的正系数意味着CM与PGNP反向变化。第39页,共58页,2024年2月25日,星期天图6.6(b)的重要应用之一,是宏观经济学中著名的菲利普斯曲线。如图6.8表明,工资变化对失业水平的反应,存在有不对称性:当失业率低于自然失业率(被定义为保持通货膨胀不变所需要的失业率)Un

时,由失业的单位变化引起的工资上升,要快于当失业率高于自然水平时,由失业的同样变化引起的工资下降。而β1

表示工资变化的渐进底线。菲利普斯曲线的这一具体特征可能源于工会的讨价还价能力、最低工资规定、失业补贴等制度因素。第40页,共58页,2024年2月25日,星期天货币工资变化率,%自然失业率失业率,%第41页,共58页,2024年2月25日,星期天菲利普斯曲线几经演变,一个相对近期的表述由OlivierBlanchard提供。令表示t时期的通货膨胀率,其定义是价格水平(如消费者价格指数CPI)的百分比变化,令表示t时期的失业率,则现代版的菲利普斯曲线表述如下:其中=第t年的实际通货膨胀率=在第(t-1)年对第t年通货膨胀率的预期=第t年的实际失业率=第t年的自然失业率由于不能直接观测,所以可以简化假定,即今年的预期通货膨胀率为去年的通货膨胀率。第42页,共58页,2024年2月25日,星期天将这个假定带入(6.7.3),并写成标准形式:其中。该式说明,两个时期之间通货膨胀率的变化域当前的失业率线性相关。据经验,预计β2

为负,而β1

为正。顺带一提,(6.7.3)中的菲利普斯曲线在文献中被称为修正的菲利普斯曲线或加速主义者菲利普斯曲线(表明低失业率导致通货膨胀上升,并因而成为价格水平的。加速器)表6.5给出1960-1998年间的通货膨胀率和失业率数据,其中通货膨胀由消费者价格指数的逐年百分比(CPI膨胀)来度量,失业率指城市失业率。我们从数据可得通货膨胀率的变化,并相对城市失业率描点。Eviews中由差分表示:datainflrate1/inflrate1=D(inflrate)第43页,共58页,2024年2月25日,星期天图6.9修正的菲利普斯曲线第44页,共58页,2024年2月25日,星期天通过图6.9可以看出,恰如所料,通货膨胀率变化和失业率之间存在负向关系——低失业率导致通货膨胀率的提高,并因此使价格水平加速提升,加速主义者菲利普斯曲线因此得名。从图中并不能看出是直线回归模型还是一个倒数回归模型,我们做如下回归:线性模型倒数模型这两个模型的所有估计系数都是个别统计显著的,所有的p值都低于0.005的水平。第45页,共58页,2024年2月25日,星期天模型(6.7.5)表明,若失业率下降1个百分点,则通货膨胀率平均上升约0.7个百分点,反之亦然。模型(6.7.6)表明,即便失业率无限增加,通货膨胀率的最大变化也只下降约3.25个百分点。从方程(6.7.5)可以计算出其背后的自然失业率:即自然失业率为6.06%。经济学家认为自然失业率介于5%到6%之间。第46页,共58页,2024年2月25日,星期天对数双曲线或对数倒数模型通过考率如下形式此为对数倒数模型。如图所示Y首先以递增的速度增加,然后以递减的速度增加。这样的模型可能适合于短期生产函数模型。如果劳动和资本是一个生产函数的投入,而且我们保持资本投入不变但增加劳动投入,则产出与劳动之间的短期关系就类似该图。第47页,共58页,2024年2月25日,星期天6.8函数形式的选择在双变量情形中,通过描点就能基本上知道哪个模型合适,但涉及到多元回归模型时,选择将困难的多。在对经验估计选择适当模型时,需要大量技巧和经验,但仍有一些指导原则可供参考:1.模型背后的理论(如菲利普斯曲线)可能给出一个特定的函数形式。2.最好能求出回归子Y相对回归元X的变化率(即斜率)和回归子Y对回归元X的弹性。如表6.6给出了各种模型的斜率和弹性系数公式:第48页,共58页,2024年2月25日,星期天表6.6线性对数线性线性到对数对数到线性倒数对数倒数模型方程斜率弹性第49页,共58页,2024年2月25日,星期天3.所选模型的系数应该满足一定的先验预期。如考虑汽车的需求是价格和其他变量的函数,那我们应该预期价格变量的系数为负。4.有时不止一个模型能不错的拟合一个给定的数据集。如在修正的菲利普斯曲线一例中,我们对同样的数据拟合了一个线性模型和一个倒数模型。在两种情况下,系数都与先验预期一直,也都是统计上显著的。一个重要区别在于,线性模型的r2

值比倒数模型的r2

大。因此人们略微倾向于使用线性模型。但注意,在比较两个r2

时,两个模型的因变量必须相同,解释变量可采用任何形式。5.不应该过分强调r2

这一度量,并非模型的r2

越大越好。下一章会讨论,在模型中添加更多的回归元,r2

会不断增大。第50页,共58页,2024年2月25日,星期天6.9关于随机误差项的性质的注记考虑如下回归模型:这是一个没有误差项的模型,为了估计的目的,可把此模型表达成三种不同形式:第51页,共58页,2024年2月25日,星期天对这些方程两边取对数得:其中像(6.9.2)这样的模型本质上是线性回归模型,因为通过适当的变换即可将该模型变成对参数α和β2

是线性的。但模型(6.9.4)本质上对参数非线性,因为ln(A+B)不等于lnA+lnB。没有对其取对数的简单方法。虽然(6.9.2)和(6.9.3)同是线性回归模型,都可用OLS法加以估计,但要记得OLS的BLUE性质要求ui

有零均值、恒定方差和零自相关。还假定ui

是正态分布的。第52页

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论