第十一章相关分析.ppt_第1页
第十一章相关分析.ppt_第2页
第十一章相关分析.ppt_第3页
第十一章相关分析.ppt_第4页
第十一章相关分析.ppt_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第十一章 相关分析,社会研究的主要目的 探索和分析社会现象之间的关系 了解社会现象发生和变化的原因 解释社会现象的发展和规律,第一节 相关的基本性质,两变量的相关(Correlation) 若一个变量的值发生改变,另一变量的值也会发生相应的变化,一、相关关系的程度,相关程度 相关关系的强弱或大小 以相关系数度量 相关系数 取值范围-1,1 绝对值越大表示相关性越强,反之亦然 不相关=0,全相关=1,a=d=0,或b=c=0,X与Y全相关 ad=bc, X和Y无关 adbc,或adbc,X与Y相关,a=d=0,全相关,ad=bc,无关,父母与态度有关,父母与态度有关,一、相关关系的程度,一般不可

2、能达到全相关(-1或1) 相关系数不是相关数值的等单位度量 如相关系数0.8的两个变量的关系比相关系数0.4的两个变量关系更强,不能说0.8是相关系数0.4的两倍!,二、相关系数的方向,正相关与负相关 表示方式:相关系数前加上+或- 尤尔Q系数(Yules Q),合适两分变量,即2X2的交互分类表,三、相关系数的类型,非对称关系X影响Y,Y不影响X 因果关系 因即自变量引起其他变量变化的变量,X 果即因变量因自变量的变化而发生变化的变量,Y XY,四、相关的对称性,四、相关的对称性,对称关系X影响Y,Y影响X 根据研究目的选择X和Y 相关关系是因果关系的三个条件,五、消减误差比例的意义,PRE

3、消减误差比例 PRE数值越大,表示以X预测Y,减少误差的比例越大,X和Y的关系越强 PRE值域为0,1,第二节 相关测量法,相关系数用以测量相关关系的统计值 选择法则 两变量的测量层次 两变量的影响方向(对称与否) 尽可能选择有消减误差比例意义的相关测量法,根据变量层次选择合适的相关测量法 定类变量定类变量 定序变量定序变量 定距变量定距变量 定类变量定序变量 定类变量定距变量 定序变量定距变量,一、两个定类变量:,y,相关测量法原理 若两定类变量相关,以一个变量的值预测另一变量时,倘若用众值预测,可消减多少误差。 0,1 对称形式和非对称形式,一组数据中出现次数最多的变量值,对称形式,假设两

4、变量关系对称,不分自变量和因变量,X和Y的众数次数或频数,总例数,y每个取值类别下x的众数次数,对称形式,父母择偶标准(x)和子女择偶标准(y)之间的关系 x和y互相影响-用测定相关性强度,My,Mx, =0.38,父母的择偶标准与子女的相关系数0.38,若以两变量互相预测,可消减38%的误差,非对称形式,两变量关系非对称,自变量x和因变量y 表示X预测y能消减的误差,My,my,my, =0.27,以性别预测青年的就业取向,可消减27%的误差,y 测量法,弥补众数都在同行产生的相关系数为0的问题(表11-4) 非对称测,要求自变量x和因变量y,最好选此法 0,1 考虑交互分类表所有数值 公式

5、略,二、两个定序变量:Gamma,dy,Goodman和Kruskal的Gamma系数(对称适用) Somers的dy系数 (非对称适用) -1,1 消减误差比例的意义 级序相关法,二、两个定序变量:Gamma,dy,根据任何两个个案在某变量上的等级来预测它们在另一变量的等级时,可减少的误差是多少 以每对个案取值的等级作为预测准则 对指个案两两组合(下表:10对C25),1.同对序 某对个案在两个变量上的相对等级是相同的,Ns 个案A在X变量的等级为XA,在Y变量等级为YA XA XB , YA YB 2.异对序 某对个案在两个变量上的相对等级上不相同, Nd XA XB ,YA YB 3.X

6、同分对 两个个案在X变量等级是相同的,TX XA= XB ,YA YB 4.Y同分对 两个个案在y变量等级是相同的,Ty XA XB ,YA =YB 5.X、Y同分对 两个个案在X和Y变量等级是相同的Txy XA = XB ,YA =YB,相关测量法:Gamma和dy,Gamma测量法属于对称相关测量法 值域-1,1 dy测量法适用于非对称关系 值域-1,1,a 系数 b 系数 c 系数(无消减误差比例的意义,不及G广泛) rho系数,测量定序变量的对称关系用的其他测量法,简单线性回归(b) 进一步确定两个变量是否存在线性关系 以自变量X的数值预测或估计因变量 Y的数值 积矩相关(r) 测量两

7、个变量的相关程度和方向,三、两个定距变量:b,r,(一)简单线性回归分析,Y= a + bx,截距,回归系数,根据回归方程预测的Y值,每个个案的X值未知时,要预测每个个案的Y值,用Y的均值估计,所犯错误最小 最小二乘法准则 要求回归方程 的总误差最小,(一)简单线性回归分析,Y=a+bx的估计值,实际得到的Y值,(一)简单线性回归分析,最小平方准则,(一)简单线性回归分析,Y=a+bX,分别算出a和b,得Y=1.22+0.90X 将不同的X值代入该线性方程,做预测用 b反映X对Y的影响,每增加一个X,Y的变化量 b=0,表示X对Y无影响;b值大,变化快,b的正负代表X对Y的正负影响 标准化直线

8、回归方程,X和Y的标准差,(二)积矩相关系数r,两定距变量的相关关系Pearson积矩相关系数r 值域-1,1 决定系数r2,具有消减误差比例的意义,(二)积矩相关系数r,r系数是对称相关测量法 r系数和简单线性回归分析建立在X和Y有线性关系的假设基础上。若该假设不符合实际情况,会出现错误,四、定类变量和定序变量:,y,系数,非对称测量法 值域0,1 无消减误差比例的意义 ,y测量法,定序变量作定类变量看待,常用 例:表11-9,“文化程度”定序-定类,五、定类变量和定距变量:相关比率,eta平方系数,E2 根据自变量的每一个值来估计或预测因变量的均值 0,1 具有消减误差比例的意义 例:表1

9、1-10,六、定序变量和定距变量:相关比率E2,测量的是对称关系 把定序变量看成定类处理 值域0,1 具有消减误差比例的意义 例:表11-10 定序变量通过赋值转化为定距变量-可用 b和r,第三节 相关系数的假设检验,两变量相关关系检验常用方法:Z检验、t检验和F检验等,一、两定类变量:卡方检验,卡方检验步骤 建立两个变量有无关系的假设 H1:X和Y相关 H0:X和Y不相关 计算卡方值,二、两定序变量:Z检验、t检验,以Gamma值求出样本中X和Y的关系 以Z检验法或t检验法推论总体中X和Y的关系 H1:总体中Gamma0 (或0或不为0) H0:总体中Gamma=0 三条件:随机样本、两变量

10、为定序变量和正态分布,二、两定序变量:Z检验、t检验,由上表(样本)得G=0.28 - 总体中工人的工作满意度和归属感也有相关关系? H1:Gamma0 ;H0: Gamma=0 检验过程略。 检验值若接近否定域,改为检验S (Ns-Nd)值: H1: S0; H0: S0, Z=S/ SE=3.37,三、两定距变量:F检验,F检验检验总体中的两定距变量的关系能否用积矩相关系数和简单线性回归系数反映 三条件:随机样本、定距变量和正态总体 H1:r0,b 0; H0:r=0,b=0 t检验也可检验积矩相关系数和简单线性回归系数 检验前提:X和Y的关系直线-需检验(F检验,用E2) H1:r E2

11、 (非直线关系); H0:r = E2 (直线关系),四、定类/定距变量:F检验(或ANOVA),F检验检验相关比率E2 ,一个定距变量和一个定类变量的相关关系 条件:随机样本、其中一个变量是定距的、正态总体、方差齐 H1:1 2; H0: 1= 2 无需计算相关比率的方法,ANOVA,五、总结:相关测量法和检验法,相关测量法测量的对象是样本,不考虑样本随机性,而假设检验分析的是随机样本 假设检验:随机样本;调查的是总体的情况;检验目的在于两变量是否存在相关,而非相关程度强弱 大样本 选用方法时首先考虑变量的测量层次,再考虑相关的对称性,五、总结:相关测量法和检验法,谢 谢!,相关测量和检验的

12、SPSS应用,PearsonR和Spearman系数,提供两个定类、两个定序、两个定距,一个定类和一个定距的相关测量法,两变量为定类变量时选,两个定序变量时选,一个定类和一个定距,Eta系数,列联C系数,V和phi系数,系数,不确定系数,Gamma系数,Dy系数,b系数,c系数,例1:年龄和年收入的相关性分析 分析:年龄和年收入在数据文件里均为定距变量 两定距变量的相关性用Pearson积矩相关系数(R系数)分析(不管两变量是否对称,都可用R系数),PearsonR系数结果看这行,r系数=0.335,对r系数做假设检验,p=0.000,定距X定距,定序X定序,Spearman系数=0.401,

13、例2:性别和婚姻状况之间的相关性分析 1.交互分类表 性别X婚姻状况 Analyze-Descriptive Statistics-Crosstabs 2.由于性别和婚姻状况都是定类变量,因此选Nominal-Lamda,对称测量的=0.036,的假设检验,T值和P值,p=0.020,非对称测量的结果,二、Correlate中的相关分析,两变量相关测量 偏相关系数 距离分析,Bivariate 主要提供的是定序及以上层次变量的测量:Pearson积矩相关系数(两个定距及以上), b(两个定序),Spearman 系数(两个定序) Test of Significance: Two-tailed,对称相关分析;One-tailed非对称相关分析,例1:年龄和年收入的相关性分析 分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论