卡方检验统计课件_第1页
卡方检验统计课件_第2页
卡方检验统计课件_第3页
卡方检验统计课件_第4页
卡方检验统计课件_第5页
已阅读5页,还剩67页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11Chi-squaretest卡方检验11/30/2022page1马金凤bluerui123456@引言populationsample

随机抽样

statistic

parameter

11/30/20222Chi-squareTest引言统计分析Statisticalanalysis统计描述Statisticaldescription统计推断Statisticalinference统计图statisticalgraph统计指标statisticaltarget参数估计estimationofparameters假设检验Hypothesistest统计表statisticaltable11/30/20223Chi-squareTest引言假设检验Hypothesistest计量资料的假设检验计数资料的假设检验等级资料的假设检验卡方检验Chi-squaretestt检验方差分析11/30/20225Chi-squareTest卡方检验Chi-squaretest读作

chi2卡方2检验(chi-squaretest)是现代统计学的创始人KarlPearson(1857-1936)于1900年提出的一种具有广泛用途的计数资料的统计推断方法。11/30/20226Chi-squareTest卡方检验Chi-squaretest用途:两个样本率或多个样本率的比较两个构成比或多个构成比的比较关联性检验拟合优度检验等11/30/20227Chi-squareTest2分布和拟合优度检验11/30/2022page8马金凤bluerui123456@2分布chisquaredistribution2分布是一种连续型随机变量的概率分布若有k个相互独立的标准正态分布随机变量Z1、Z2、…、Zk,则其平方和(Z12+Z22+…+Zk2)的分布称为服从自由度v=k的2分布,记为:2(v)11/30/202210Chi-squareTest2分布chisquaredistribution11/30/202212Chi-squareTest拟合优度检验goodnessoffittest根据样本的频率分布,检验其总体分布是否服从于某种分布(正态分布、Poisson分布等)基本思想是判断实际频数(actualfrequency)和理论频数(theoreticalfrequency)的差别是否由抽样误差所引起11/30/202214Chi-squareTest拟合优度检验goodnessoffittest拟合优度检验(goodnessoffittest)实际频数用A表示,根据H0确定的理论频数用T表示,则构造的2统计量为:11/30/202215Chi-squareTest拟合优度检验goodnessoffittest拟合优度检验(goodnessoffittest)2值的大小反映了实际频数与理论频数的吻合程度。在H0成立的条件下,实际频数与理论频数相差不应该很大,即2值不会太大;若一次抽样得到的2值超过的预先规定检验水准所对应的2界值,则有理由怀疑H0的成立11/30/202216Chi-squareTest拟合优度检验goodnessoffittest例1判断表1所示数据是否服从正态分布?表1136例体模骨密度测量值频数分布组段实际频数A1.228~21.234~21.240~71.246~171.252~251.258~371.264~251.270~161.276~41.282~1合计13611/30/202217Chi-squareTest拟合优度检验goodnessoffittest例1判断表1所示数据是否服从正态分布?对该数据作正态分布拟合优度检验。136例体模骨密度测量值的均数=1.260标准差=0.010检验的假设:H0:总体分布为均数为1.260,标准差为0.010的正态分布H1:总体分布不服从该正态分布

11/30/202218Chi-squareTest计算统计量:推断结论:自由度=10-1-2=7,查附表8,得到,P>0.50,可以认为该样本服从正态分布。计算T时的参数有2个(均数和标准差)拟合优度检验goodnessoffittest11/30/202220Chi-squareTest拟合优度检验goodnessoffittest判断样本观察频数是否与某一理论频数相符,即了解样本是否来自某理论分布类别或组段观察频数(A)理论频数(T)1A1T12A2T23A3T34A4T4………kAkTk11/30/202221Chi-squareTest练习某医学院校医生随机抽取100名一年级医学生,测定空腹血糖值(mmol/L),其频数分布如右表中第(1)栏和第(2)栏所示,试用检验判断该资料是否符合正态分布。空腹血糖值频数2.65~52.95~53.25~43.55~193.85~124.15~124.45~244.75~105.05~55.35~5.654合计10011/30/202223Chi-squareTest完全随机化设计两样本率比较例2将病情相似的169名消化道溃疡患者随机分为两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?表两种药物治疗消化道溃疡患者4周后的疗效处理愈合未愈合合计愈合率(%)洛赛克64(57.84)21(27.16)8575.29雷尼替丁51(57.16)33(26.84)8460.71合计1155416968.0511/30/202225Chi-squareTest完全随机化设计两样本率比较例2将病情相似的169名消化道溃疡患者随机分为两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?表两种药物治疗消化道溃疡患者4周后的疗效药物愈合未愈合合计愈合率(%)洛赛克64(57.84)21(27.16)8575.29雷尼替丁51(57.16)33(26.84)8460.71合计1155416968.0511/30/202226Chi-squareTest完全随机化设计两样本率比较原始数据四格表(2×2表)数据普通四格表的基本形式表1普通四格表的基本形式group+-totalAaba+bBcdc+dtotala+c

b+dn11/30/202227Chi-squareTest完全随机化设计两样本率比较基本思想:可通过卡方检验的基本公式来理解理论频数的计算理论数T的计算是在假设检验H0成立的条件下,用两样本合计率来估计的。11/30/202228Chi-squareTest完全随机化设计两样本率比较(4)确定P值查附表8,2界值表,20.05,1=3.84,P<0.05。(5)结论:按检验水准,拒绝H0,接受H1,两样本频率的差异有统计学意义。可认为洛赛克、雷尼替丁两种药物治疗消化道溃疡的效果有差别。鉴于洛赛克的治愈率是75.29%,雷尼替丁的愈合率为60.71%,可以认为洛赛克的愈合率比雷尼替丁的愈合率高。

11/30/202230Chi-squareTest完全随机化设计两样本率比较四格表资料2检验专用公式药物愈合未愈合合计洛赛克64(a)21(b)85(a+b)雷尼替丁51(c)33(d)84(c+d)合计115(a+c)54(b+d)16911/30/202231Chi-squareTest完全随机设计两样本率比较当n≥40时,如果有某个格子出现1≤T<5,一般需用校正公式11/30/202232Chi-squareTest完全随机设计两样本率比较例3将病情相似的淋巴系肿瘤患者随机分成两组,分别做单纯化疗与复合化疗,两组的缓解率见下表,问两疗法的总体缓解率是否不同?表两种疗法缓解率的比较分组缓解未缓解合计缓解率%单纯化疗2(4.8)10(7.2)1216.7复合化疗14(11.2)14(16.8)2850.0合计16244040.011/30/202233Chi-squareTest完全随机设计两样本率比较建立检验假设H0:两法总体缓解概率相同H1:两法总体缓解概率不同检验水准

=0.05=(2-1)(2-1)=1确定P值:查附表8,2界值表,20.10,1=1.21,P>0.10在

=0.05水准上不拒绝H0,差别无统计学意义,尚不能认为两种治疗方案的总体缓解概率不同。

11/30/202234Chi-squareTest完全随机设计两样本率比较特别注意:

当四格表出现T<1或n<40时,校正2值也不恰当,这时必须用四格表的确切概率计算法(见本章第6节)。

11/30/202235Chi-squareTest四格表资料n≥40且Tmin≥5n≥40且5>Tmin≥1确切概率法基本公式校正公式YesNoNoYes图1四格表资料的条件和公式11/30/202236Chi-squareTest当n≥40且Tmin≥5时,2检验基本公式或四格表专用公式;当n≥40,1≤Tmin<5时,需对2值进行校正;当n<40或Tmin<1时,改用四格表确切概率计算法。(2检验所得概率P≈α时)11/30/202237Chi-squareTest完全随机化设计两样本率比较两样本率比较时,z检验和四格表2检验是等价的,即v=1的2=z2;两个样本率的比较四格表(两行两列)多个样本率的比较?group+-totalAaba+bBcdc+dtotala+c

b+dn11/30/202238Chi-squareTest独立样本的R×C列联表资料

的2检验11/30/2022page39马金凤bluerui123456@完全随机化设计多样本率比较多(R)个率的比较,其基本数据有R行2列,构成R×2表,用以表述R个率的基本数据。R×2表的2检验用于推断R个样本率各自所代表的总体率是否相等。

11/30/202240Chi-squareTest完全随机化设计多样本率比较例4用三种不同治疗方法治疗慢性支气管炎的疗效见下表,是比较三种治疗方法治疗慢性支气管炎的疗效。表三种不同治疗方法治疗慢性支气管炎的疗效组别有效无效合计有效率(%)A药3554087.50B药20103066.67C药7253221.88合计624010260.7811/30/202241Chi-squareTest完全随机设计多样本率比较建立检验假设H0:三种治疗方法的疗效相同H1:不全相等检验水准

=0.05计算检验统计量=(3-1)(2-1)=2确定P值:20.005,2=10.60,P<0.005在=0.05水平上拒绝H0,接受H1,可以认为三种药物的治疗效果不全相同。11/30/202242Chi-squareTest完全随机化设计多样本率的比较例5某地调查了1995~1998四个年度中小学女生的贫血状况,见下表,问各年度间学生贫血率有无差别?

表某地某年度学生贫血检出率比较(%)年份贫血人数正常人数合计检出率(%)1995279470249815.6019962712089236011.4819973672161252814.5219987844199498315.73合计1701131511485211.4511/30/202243Chi-squareTest完全随机化设计多样本率的比较H0:四个年度学生的贫血检出率相等;H1:四个年度学生的贫血检出率不等或不全相等。

=0.05。ν=(4-1)×(2-1)=3。查附表3,2界值表,得P<0.005。按

=0.05水准,拒绝H0,接受H1,差异有统计学意义。故可认为该地四个年份中小学女生贫血检出率不相等11/30/202244Chi-squareTest完全随机化设计多样本率的比较例为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的53名产妇随机分成三组,分别按三种不同剂量服用该药,镇痛效果见下表。剂量镇痛效果合计有效率(%)有效无效1.0mg3(7.36)12(7.64)1520.002.5mg11(9.81)9(10.19)2055.005.0mg12(8.83)6(9.17)1866.67合计26275349.0611/30/202245Chi-squareTest完全随机化设计多样本率的比较H0:三种剂量镇痛有效的概率相同;H1:不同剂量镇痛有效的概率不全相同

=0.05。ν=(3-1)×(2-1)=2。查附表3,2界值表,得P<0.05。按

=0.05水准,拒绝H0,接受H1,差异有统计学意义。故可认为三种剂量镇痛有效的总体概率不全相同11/30/202246Chi-squareTest多个样本率的多重比较当多个样本率比较的2检验,结论为拒绝H0时,只能认为各总体率之间总的说来有差别,但不能说明它们彼此间都有差别,或某两者间有差别。若要进一步比较哪些率之间有差别,应进行多重比较卡方分割11/30/202247Chi-squareTest两组或多组构成比的比较构成比表示某一事物内部各组成部分所占的比重或分布,常用百分数表示计算特点:各部分构成比的合计为1或100%事物内部某一部分的构成比发生变化时,其他部分也会相应发生变化11/30/202248Chi-squareTest两组或多组构成比的比较R×C列联表两个样本率的比较——2×2列联表多个样本率的比较——R×2列联表多组构成比的比较——R×C列联表两组构成比的比较——2×C列联表11/30/202249Chi-squareTest两组或多组构成比的比较R×C列联表两个样本率的比较——2×2列联表多个样本率的比较——R×2列联表多组构成比的比较——R×C列联表两组构成比的比较——2×C列联表11/30/202250Chi-squareTest完全随机化设计两组构成比的比较例试分析儿童急性白血病患者与成年人急性白血病患者的血型分布(如下表)有无差别?表儿童急性白血病患者与成年人急性白血病患者的血型分布分组A型B型O型AB型合计儿童30383212112成年193019977合计4968512118911/30/202251Chi-squareTest完全随机化设计两组构成比的比较H0:两组的总体构成比相同H1:两组的总体构成比不同

=0.05ν=(2-1)×(4-1)=3确定P值:查附表3,2界值表,20.75,3=1.21,P>0.75按

=0.05水准,不拒绝H0,尚不能认为儿童急性白血病患者与成年急性白血病患者血型分布不同11/30/202252Chi-squareTest完全随机化设计两组构成比的比较例北京市1986年城市和农村20至40岁已婚妇女避孕方法情况如表7-5所示(据王绍贤等调查资料),试分析北京城市和农村采用不同避孕方法的总体分布是否有差别。北京市1986年城市和农村20至40岁已婚妇女避孕方法的情况地区节育器服避孕药避孕套其他合计城市1533316540431农村320754318518合计4731082085894911/30/202253Chi-squareTest完全随机化设计两组构成比的比较H0:两组的总体构成比相同H1:两组的总体构成比不同

=0.05ν=(2-1)×(4-1)=3确定P值:查附表3,2界值表,20.005,3=12.84,P<0.005按

=0.05水准,拒绝H0,接受H1,差异有统计学意义。故可认为城市和农村已婚妇女避孕方法的总体概率分布不同11/30/202254Chi-squareTest配对设计资料的2检验11/30/2022page55马金凤bluerui123456@配对设计两样本率的比较配对四格表资料2检验的目的是通过对单一样本数据的分析,推断两种处理的结果有无差别配对设计是医学研究中常用的设计方法之一。二分类结果资料的配对研究常用于比较两种检验方法、两种培养方法、两种提取方法等的差别。11/30/202256Chi-squareTest配对设计两样本率的比较例现有132份食品标本,把每份标本一分为二,分别用两种检验方法作沙门氏菌检验,检验结果如下表所示,试比较两种检验方法的阳性结果是否有差别?表两种检验方法检验结果的比较甲法乙法合计+-+80(a)10(b)90-31(c)11(d)42合计1112113211/30/202257Chi-squareTest配对设计两样本率的比较原始数据编号甲法乙法1++2+-3-+4--5++6+-7--….….….132--编号甲法乙法分类1++a2+-b3-+c4--d5++a6+-b7--d….….….132--d11/30/202258Chi-squareTest配对设计两样本率的比较a、b、c、d含义?甲法的阳性率、乙法的阳性率、两法一致阳性率、两法一致率配对设计两种结果的比较甲法乙法合计+-+aba+b-cdc+d合计a+cb+dn=a+b+c+d11/30/202259Chi-squareTest配对设计两样本率的比较配对四格表2检验条件b+c≥40时b+c<40时(20<b+c≤40时:计算2C;当b+c≤20时,计算确切概率)11/30/202260Chi-squareTest配对设计两样本率的比较H0:两种检验方法的结果相同,即总体B=C;H1:两种检验方法的结果不同,即总体BC。=0.05。

v=1确定P值:按

=1查2界值表,20.005,1=7.88,P<0.005在=0.05水准上拒绝H0,接受H1,差异有统计学意义。可认为两种检验方法的阳性结果有差别,鉴于甲法阳性率为68.20%,乙法阳性率为84.09%,可以认为乙法的阳性率高于甲法。11/30/202261Chi-squareTest配对设计两组频数分布的比较例对150名冠心病患者用两种方法检查室壁收缩运动的情况,检测结果见下表。试比较两种方法测定结果的概率分布是否相同?表两种方法检查室壁收缩运动情况甲法测定结果乙法测定结果合计正常减弱异常正常603265减弱042951异常891734合计68542815011/30/202262Chi-squareTest配对设计两组频数分布的比较H0:两种测定方法的概率分布相同H1:两种测定方法的概率分布不相同=0.05=1.60v=k-1=2确定P值:按

=2查2界值表,20.05,2=5.99,P>0.05在=0.05水准上不拒绝H0,差异无统计学意义。故尚不能认为甲法测定结果的概率分布与乙法测定结果的概率分布不同。

11/30/202263Chi-squareTest2检验要注意的问题2检验的条件使用2检验在任何情况下都要注意理论频数T不能太小。一般要求各格的理论频数均应大于1,且T<5的格子数不宜多于格子总数R×C的1/5出现某些格子中理论频数过小时怎么办?增大样本含量(最好!)删去该格所在的行或列(丢失信息!)根据专业知识将该格所在行或列与别的行或列合并。(丢失信息!甚至出假象)11/30/202264Chi-squareTest2检验要注意的问题关于似然比2统计量作2检验,既可以计算Pearson2统计量,也可以计算似然比2(Likelihoodratiochi-square)统计量11/30/202265Chi-squareTest2检验要注意的问题多组比较时,若效应有强弱的等级,如+,++,+++,最好采用后面的非参数检验方法。2检验只能反映其构成比有无差异,不能比较效应的平均水平某药对两种不同病情的支气管炎疗效比较疗效单纯型单纯型合并肺气肿控制6542显效186有效3023近控1311合计1268211/30/202266Chi-squareTest四格表资料的确切概率法11/30/2022page67马金凤bluerui123456@普通四格表的确切概率法该法是由R.A.Fisher(1934年)提出的,其理论依据是超几何分布,简称F

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论