逐步回归和通径分析ppt课件.ppt_第1页
逐步回归和通径分析ppt课件.ppt_第2页
逐步回归和通径分析ppt课件.ppt_第3页
逐步回归和通径分析ppt课件.ppt_第4页
逐步回归和通径分析ppt课件.ppt_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、逐步回归与通径分析,1,2,目录,逐步回归,通径分析,逐步回归,通径分析,3,逐步回归,通径分析,概念:逐步回归分析方法是针对多个自变量建立最优回归方程的一种统计方法。在有p个自变量的情况下,根据自变量的不同组合可能建立的回归方程众多。这些回归方程的效果有好有坏,而人们希望的是回归效果最好的,即“最优”的回归方程。 要求:(1)回归效果最佳 (2)自变量的个数最少 一方面对因变量起显著作用的自变量都选进回归 方程,另一方面对因变量作用不显著的自变量都剔除 回归方程,选择一个最佳的变量组合。,4,逐步回归,通径分析,方法,逐步剔除法,逐步引入法,逐步剔除法,主要步骤: (1)从包含全部p个自变量

2、组合的回归方程中逐个检验回归系数,剔除对因变量作用不显著的自变量; (2)对剔除后剩下的q个自变量建立对因变量的多元回归方程,再逐个检验回归系数,剔除不显著的变量; (3)重复上述步骤,直到保留在回归方程中自变量的作用都显著为止 缺点:一开始把全部自变量都要引入回归方程,计算量很大,实际上有些不重要的就不必引入,5,逐步回归,通径分析,逐步引入法,基本步骤: (1)先逐个比较 xl,xp 对 y 的回归方程哪些是显著的,从显著的方程中挑选 F 值最大的,相应的自变量 x 就被“引入”方程。无妨设 x 就是x1 (2)再逐个比较(x1,x2)、(x1,x3)、(x1,xp)对y的回归方程,看有没

3、有F值显著的,此时的F就是考虑添加xi之后, xi的回归系数是否显著地不为0,将显著的F中最大的F所相应的变量“引入”方程。无妨设第二次“引入”的自变量是x2 (3)再考察以x1、x2为基础,逐个添加x3、x4、xp之后的回归方程,是否较x1、x2的方程有显著的改进,有就再“引入”新的自变量,这样下去,终于到某一步就没有可以再“引入”的自变量了。这时就获得了最后的回归方程.,缺点:不能反映后来变化的状况,设想x1、x2、x3引入后,又引入了x6,也许x3、x6引入后,x1的作用就不重要了,应该予以剔除,而“逐步引入”法不能达到这个要求,6,逐步回归,通径分析,例14.1 测定了”丰产3号“小麦

4、15株的单株穗数x1、每穗结实小穗数x2、百粒重x3(g)、株高x4(cm)、单株籽粒产量y(g),结果列于表14-1,试建立y依xi的最优回归方程。P254,7,逐步回归,通径分析,1、逐步剔除法 (1)建立m元线性回归方程,表1 表14-1资料四元线性回归和偏回归系数的假设检验,表1表明,四元线性回归方程达极显著,但x2和x4偏回归系数都不显著,其中以x4的偏回归平方和最小,所以,应首先剔除x4。,8,逐步回归,通径分析,(2)建立m-1元线性回归方程:,表2 表14-1资料三元线性回归和偏回归系数的假设检验,表2表明,三元线性回归方程和三个自变量的偏回归系数均极显著或者显著,因此不需要再

5、作自变量的剔除。,最优线性回归方程: y=-46.9663+2.013139x1+0.674643x2+7.830227x3,9,逐步回归,通径分析,2、逐步引入法 P260 (1)计算相关矩阵 (2)选择第一个自变量 首先,计算各自变量的标准偏回归平方和。 其次,对偏回归平方和最大的变量进行F检验。 题中x1的最大,经检验引入该变量。 最后,变换相关矩阵 (3)选择第二个自变量:先计算余下自变量的标准偏回归平方和。接下来是重复(2)过程。选入x3 (4)选择第三个自变量。选入x2 (5)选择第四个自变量。x4不显著,不选入。 (6)选择计算偏回归系数,建立最优回归方程。 最优线性回归方程:

6、y=-46.9713+2.0131x1+0.6746x2+7.8302x3,10,逐步回归,通径分析,通径系数的基本概念,多元线性回归系数间不能直接比较各因子间的效应大小, 因为各回归系数间都带有不同的量纲,再者多变量的关系中,往往都不是独立的,有时还要研究xi通过xj对依变量y的影响, 而通径系数就能有效的表示相关变量间原因对结果的直接影响或间接影响的效应,从而区分因子的相对重要性及其关系。,通径图,y,x1,x2,图14-1a x1与x2独立时,y,x1,x2,图14-1b x1与x2不独立时,直接通径:,间接通径:,x1 x2 y,x2 x1 y,符号: 表示通径线,x1 y, x2 y

7、,11,逐步回归,通径分析,通径系数的概念,表示各条通径对于改变y变量的相对重要性的统计量称通径系数,常用q表示。直接通径系数就是逐步回归中的偏回归系数bi。,通径系数的性质,1.当自变量为 p 时,共有p个直接通径,p(p -1)个间接通径系数。 2.通径系数能够表示变量间的因果关系, 所以具有回归系数的性质。 3.通径系数是相对数,且有方向性,因而具有相关系数的性质。,12,逐步回归,通径分析,通径系数的计算过程 1、通径系数正规方程组,前面已经提过,直接通径系数就是逐步回归分析中变量标准化变换后的偏回归系数,所以可解下列正规方程组求得 q , q , q。(q = b),每个自变量xi与

8、y的相关系数均可剖分为xi对y的直接作用和间接作用的代数和。,13,逐步回归,通径分析, xi 对 y 的直接通径 xi y xi 对 y 的间接通径 xi xj y,由方程1可看出第1个自变量x1与y的相关关系r 可看成 x1对y的直接通径部分q ; 还有 x1 与 x2; x1与x3的间接通径 r q 和 r q 部分。,如:当 P=3 时xi对y的相关关系可列出方程式,通式:,12,2,13,3,1y,1,14,逐步回归,通径分析,例题:计算例14.1资料的通径系数P265 前面已经计算出相关系数,将其带入方程,得标准正规方程组(由于x4已经剔除,不再参加通径分析)。,y,x3,x2,x

9、1,e,15,逐步回归,通径分析,通径分析的假设检验,回归方程的检验,通径系数的检验,16,逐步回归,通径分析,(1),对(1)进行标准化变换,令:,标准化变量的m元线性回归方程为:,(2),17,逐步回归,通径分析,令,则(2)可改为,(3),决定系数,自变量 通过 对依变量y的间接决定系数,而决定系数R2等于各直接与间接决定系数之和。,18,逐步回归,通径分析,回归平方和U为:,剩余因子e假设与各个xi独立,其通径系数qe为:,则有:,剩余平方和,则对标准化变量多元线性回归方程检验的F值为:,19,逐步回归,通径分析,各xi对y的通径系数qi的检验可用F检验和t检验两种方法。,1、F检验,2、t检验,先求出通径系数的标准误sqi,其t值为:,注意:这里介绍的F检验和t检验是等价的,在实际进行通径系数假设检验时,只须选其中一种方法即可。,20,逐步回归,通径分析,例题:对上个例题所计算的通径系数进行显著性检验p268,(1) 对标准化变量多元线性回归方程检验的F值为: F=42.4388* 说明每株穗数x1、每穗结实小穗数x2、百粒重x3标准化后的 多元线性回归方程呈

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论