《卡方检验Chi》PPT课件.ppt_第1页
《卡方检验Chi》PPT课件.ppt_第2页
《卡方检验Chi》PPT课件.ppt_第3页
《卡方检验Chi》PPT课件.ppt_第4页
《卡方检验Chi》PPT课件.ppt_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十二章 非参数检验,一、参数与非参数检验,参数检验 用于等比/等距型数据 参数检验的前提:正态分布和方差同质 非参数检验 不用对参数进行假设 对分布较少有要求,也叫distribution-free tests 用于名义/顺序型数据,参数统计和非参数统计优缺点,参数统计 优点: 对资料的分析利用充分 统计分析的效率高 缺点: 对资料的要求高 适用范围有限,非参数统计 优点:对资料的没有特殊要求 不受分布的影响(偏态、分布不明的资料) 不受方差齐性的限制 不受变量类型的影响 不受样本量的影响 缺点: 检验效率低(易犯型错误) 对信息的利用不充分。,因此在二者都可用时,总是用参数检验,第一节 2检验,(卡方Chi-square),提纲: 卡方检验概述 卡方检验的前提和限制 卡方匹配度检验 卡方独立性检验 卡方检验的应用 曼-惠特尼U检验 相关样本的非参数检验,一、卡方检验概述,实际应用情况:调查、问卷、访谈等方法中,按性质划分类别,然后将结果按类计点人数或个数,得到计数数据。 类别变量(1)只能划分为类别,如性别、民族;(2)人为划分类别,如学习成绩(连续数据)分成优、良、中、差。 这些计数数据不能使用前几章所讲的统计方法,需要用到计数数据专用的统计方法,这些分析方法主要是根据2(卡方)分布进行的,故称为卡方检验。这类数据大都以表格形式表示,所以又称列联表分析。,2 分布图,(一)卡方检验的意义,1卡方检验对总体的分布状态不作任何假定,非参数检验方法。 2. 分为单变量的卡方检验和独立类别的卡方检验,(一)卡方检验的意义,1.单变量的卡方检验:同时检验一个因素两项或多项分类的实际观察数与某理论次数分布是否相一致的问题,或说有无显著差异的问题。这种检验又称为配合度检验。 理论次数是指根据概率原理、某种理论、某种理论次数分布或经验次数分布所计算出来的次数。 3独立类别的卡方检验:用于检验两个或两个以上因素(变量)各有多项分类之间是否有关联或是否具有独立性的问题。如不同性别的人在态度上是否有差异。这类检验又称独立性检验。,(二)卡方检验的基本公式,实际观察次数与某理论次数之差的平方再除以理论次数,即 2= (f0-f e)2/ f e f0:观察次数 f e :期望次数 其中,f e 期望次数越大(大于5),分布越接近卡方分布。,三、卡方匹配度检验,指用样本数据检验总体分布的形状或比率,以确定与假设的总体性质的匹配度,是对次数分布的检验。 (一)研究情境 主要用于实际观察次数与某理论次数是否有差别的分析。例如, 在医生职业中,男的多还是女的多? 在三种咖啡中,哪种被国人最喜欢? 在北京大学中,各国留学生的比例有代表性吗?,(二)统计假设及相关计算,H0: f 0 = f e H1: f 0 f e 运用基本公式计算出卡方值 查表,比较其与临界卡方值的大小,如果 注意:卡方值分布全部为正值,但f0-f e可能是负值,因此,卡方检验是双侧检验,0.05和0.01是指双侧概率而言。 自由度一般是资料的分类或分组的数目减1。(对测量数据分布的拟合度检验除外) 配合度检验需要先计算理论次数,这是计算卡方值的关键性步骤。(一般根据某种理论或经验),(三)卡方匹配度检验的公式,2= (f0-f e)2/ f e f e=pn df =C-1 f0:观察次数 f e :期望次数 C:类目的个数 2:统计量,(四)配合度检验应用举例,某项民意测验,答案有同意、不置可否、不同意3种,调查结果如下: 同意 不置可否 不同意 N f0 24 12 12 48 问:3种意见的人数是否有显著不同? 解:此题为检验无差假说,分类的项数为3,故各项分类假设实计数相等,则概率应为1/3。则: f e= 48*1/3 =16 代入公式计算卡方: 2= (f0-16)2/ 16=(24-16)2/16+=6 df=3-1=2 查表,临界值为5.99,故 此项民意测验的态度有显著差异,作此推论,犯错误的概率小于0.05。,高校女生对自身体重的观念,df=3-1=2 查表,0.05水平上临界值为5.99,故 df=3-1=2 查表, 0.01水平上临界值为9.21,三、卡方独立性检验,(一)适用材料 主要用于两个或两个以上因素多项分类的计数资料分析。如果要研究的两个自变量之间是否具有独立性或有无关联或有无“交互作用”的存在,就要应用卡方独立性检验。 如果两个子变量是独立的,无关联的,就意味着对其中一个自变量来说,另一个自变量的多项分类次数上的变化是在取样误差的范围之内。假如两个因素是非独立,则称两变量有交互作用。,(二)卡方独立性检验的公式, 2= (f0-f e)2/ f e f e=(row total)(column total)/n, df =(R-1)(C-1) F0:观察次数 f e :期望次数 R :行类目的个数 C:列类目的个数 2:统计量,(三)统计假设,虚无假设:两变量(或多变量)之间是独立的或无关联的 备择假设:两变量之间有关联或差异显著,一般用文字叙述,不用统计符号。 例题:某学校对学生的课外活动内容进行调查,结果整理成下表:,应用举例一,虚无假设:体重自我知觉与性别无关,计算,2 (1)=594.44 df=1 a= 0.05 临界值3.84,例题二,想了解性别与活动内容是否有关联,即两者是否独立,以及男女学生在课外活动内容上是否存在显著差异,这都是独立性检验要回答的问题。(上表即称为列联表),总数 N = 97 “体育”的和为27,其与总数之比为27/97,练习: 2检验,1、调查了n=200个不同年龄组的被试对手表显示的偏好程度,独立样本设计:曼-惠特尼U检验,Mann-Whitney U- test 替代t检验,因变量可以是顺序变量,或者等距、等比但分布不正态。 U=N1N2+N1(N1+1)/2-R1 U=N1N2+N2(N2+1)/2-R2 虚拟假设:两样本所来自的总体分不相同,应用实例:药物对视觉刺激反应时的影响。(负偏态),U=11 0.05水平,双尾检验,临界值10(要想达到显著需要小于10),接受虚无假设。 计算U或U均可,只要它们落在及限制以外。,相关样本的非参数检验,(一)符号检验 理论假设:成对的测量值之间必须彼此独立。 缺点:完全忽略了数据中可能存在的定量信息,只看正负号。,应用举例,删除掉数值相同的组 虚拟假设:一半正向变化,一半负向 H0: P=Q=0.5 9个正,3个负 查表, 0.05 双尾检验 临界值10(必须大于等与临界值才显著),使用9或3均可 接受虚无假设,(二)威尔科克松配对符号等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论