相关分析和检验_第1页
相关分析和检验_第2页
相关分析和检验_第3页
相关分析和检验_第4页
相关分析和检验_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三节相关分析 和偏相关分析( Correlation analysis and partial correlation analysis ),安徽岳西小区试验结果。降雨因素和土壤侵蚀之间是否存在相关关系?,问题实例,问题分解 采用什么指标度量变量间的关系? 采用什么方法来评价相关是否显著?,相关分析:研究变量之间相互关联程度大小,采用合理的指标对相关事物的观测值进行统计分析。 相关分析内容:相关程度的度量;相关程度的检验 相关关系与函数关系的区别 函数关系:变量之间是一种完全确定性的关系,并可用数学公式表示出来。如长方形的面积 (S) 与 长(a)和 宽(b)的关系。 相关关系:变量间不是完

2、全确定的关系,且不能用数学公式准确表示出来。 函数关系可以看作是相关关系的特例,即函数关系是完全的相关关系。相关关系是相关分析的研究对象。 相关不等于有因果。相互关联事物的至少2种解释: X是Y的因或果; X与Y均为第3个变量的因或果,相关分析的概念,相关类型图,这种相关计算方法称积差相关或积矩相关,是由英国统计学家皮尔逊(Pearson)提出的,又称皮尔逊相关。反映的是线性相关。 相关系数与协方差。 需要指出的是:参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个。 计算积差相关系数条件:两变量为等距或等比数据;两变量正态分布;两变量具备一一对应关系。,相关系数两个变量

3、相关程度大小的数量化指标(r表示)。,相关系数:两个变量相关程度大小的数量化指标(r表示)。 取值范围:11之间; 正相关: 负相关: 完全相关: 零相关:,相关系数取值,相关系数的计算,第1式:计算均值-计算标准差-计算离均差;计算离均差乘积;计算相关系数。 第2式:计算和-计算交叉乘积和-计算平方和;计算和的平方;计算相关系数。 针对实例问题:r=0.892,是否线性相关?,对容易一个r值,如r = 0.25,可能会想到两种情况: 由于r=0.250,说明两变量之间在总体上是相关的。 虽然r=0.250,但这可能是偶然情况,是取样造成,实际两变量在总体上是不相关的。所以需要进行检验。,问题

4、的第2个方面: 评价相关是否显著相关显著性检验,建立假设 假设总体相关系数为 H0: = 0, H1: 0 确定单尾还是双尾检验 双尾 选择显著性水平 最常用的数值是0.05,这是一种约定俗成。 针对实例问题: 0.05,相关显著性检验步骤,选择统计量并计算 t检验:,针对实例问题:,F检验:,根据显著性水平和分布查表求临界值t 针对问题实例: df=n-2=44 t0.052.02 判断与结论 如果t t ,拒绝H0 ,显著差异;否则接受H0 ,无显著差异。 针对问题实例: t13.09 t0.052.02 拒绝H0,说明在安徽岳西地区降雨量和土壤侵蚀的相关性显著。,统计学家为方便应用,根据

5、上述t检验制成了相关系数显著性表 在实际应用中,更多的是直接根据相关系数大小查相关系数显著性表判断r是否显著 方法根据自由度和显著性水平查相关系数显著性表得到临界r值,如果计算r值大于临界r值,则相关性显著。,延伸的问题: 如果有很多相关系数需要检验,怎么办?,针对实例问题: r= 0.892 df=n-2=46-2=44,查相关系数显著性表得到临界r值: r0.05 = 0.288 因r= 0.892 r0.05 = 0.288 所以判断在安徽岳西地区降雨量和土壤侵蚀的相关性是显著的。,等级相关,计算积差相关前提或要求:两变量正态分布;两变量为等距或等比数据。 如果上述两条件之一不满足,此时

6、宜采用等级相关分析。 最常用的为Spearman等级相关。 适用于度量定序变量与定序变量之间的相关; 不要求正态分布。,Spearman等级相关系数计算,或,Spearman等级相关检验,Spearman等级相关检验,判断是否线性相关,这是进行相关分析的前提; 散点图的重要性:线性相关?;相关程度判断;异常点影响;分层资料影响; 变量数据类型选择积差相关或等级相关; 参与相关分析的两个变量是对等的,不分自变量和因变量; 相关系数检验是否存在相关或总体相关系数是否为0的判断。,相关分析要点,练习安徽岳西 侵蚀.xls 如果存在相同等级情况出现,等级相关系数计算公式为:,SPPS 练习文件,偏相关

7、分析,事物之间的联系往往十分复杂,一个结果常常是受到多种因素相互综合作用下产生的。在多变量的情况下,变量之间的相关关系是很复杂的。 例:在研究某作物产量与降雨量时,作物产量和降雨量之间的关系中实际还包含了温度对产量的影响,在这种情况下单纯计算简单相关系数,显然不能准确地反映事物之间地相关关系,而需要在剔除其他相关因素影响的条件下计算相关系数。偏相关分析正是用来解决这个问题的。因此多元相关分析除了要利用上一节的简单相关系数外,还要进行偏相关分析,计算偏相关系数。,偏相关分析是指在对其他变量的影响进行控制的条件下,分析多个变量中某两个变量之间的线性相关程度,计算偏相关系数。 计算简单相关系数只需要掌握两个变量的观测数据,并不考虑其他变量对这两个变量可能产生的影响。 计算偏相关系数时需要掌握多个变量的数据,一方面考虑多个变量相互之间可能产生的影响,一方面又采用一定方法控制其他变量,考察两个特定变量的净相关关系。 变量之间存在错综复杂的关系,偏相关系数与简单相关系数在数值上可能相差很大,甚至符号都可能相反,偏相关系数更能反映现象之间的真实关系。 例:商品的需求同时受收入水平和价格的影响,在一定的收入水

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论