(第四次课)假设检验和t检验_第1页
(第四次课)假设检验和t检验_第2页
(第四次课)假设检验和t检验_第3页
(第四次课)假设检验和t检验_第4页
(第四次课)假设检验和t检验_第5页
已阅读5页,还剩91页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

假设检验

&t检验1流行病与卫生统计学张韬讲师Reviews

统计分析-统计描述统计推断:参数估计

假设检验2学习内容假设检验

t检验和z检验3一、假设检验4牛奶加茶的故事是将茶倒入牛奶中?还是将牛奶倒入茶中?作10次试验,结果都对!如何让别人相信她真的

有这个本事?5小概率反证法H0:她没有这个本事,是碰巧猜对的!(偶然的)

做一次试验,猜对1次的可能性P是多少?

P=0.5

连续猜对10个杯子的可能性P是多少?

P=(0.5)10=0.000976562

你认为原假设H0成立吗?推断结论

她真的有这个本事!

(不是碰巧猜对的)依据:小概率原理+反证法6例1.样本:某医生随机抽查25名某病女性患者的血红蛋白,求得其均数为150g/L,标准差为16.5g/L。(正常女性的平均Hb含量为132g/L,这是总体参数)问题:该病女性患者的平均Hb含量是否与正常女性的平均Hb含量不同?7问题:

0=132

1=?

正常女性女性某病患者?样本均数:150g/L标准差:16.5g/L8统计量与参数不同的两种可能其一:抽样误差

(偶然的、随机的、较小的)其二:本质上的差别+抽样误差

(必然的、大于随机误差的)9由两种可能进一步产生两种假设一种假设是“该病女性患者的平均Hb含量与正常女性的平均Hb含量相同”,表示目前的差异是由随机误差引起的,称为零假设(nullhypothesis)或无效假设,记为H0.另一种假设是“该病女性患者的平均Hb含量与正常女性平均Hb含量不同”,表示两组人群的Hb差异存在本质不同,称为备择假设(alternativehypothesis)或对立假设,记为H1或HA.10问题的解决思路假定女性某病患者和正常女性的Hb相等,那么由于偶然性导致两组Hb含量相差18g/L以及更极端情况(大于18g/L)的可能性有多大?如果能够算出这个可能性(即概率P值)的大小,就可以下结论了。根据小概率原理,如果某事件发生的可能性小于等于5%,就认为是小概率事件,在一次试验中几乎不会发生。11Anyquestions?请结合上述“解决思路”,谈谈你对“假设检验是在零假设H0成立的前提下利用小概率反证法的逻辑思维方式”这句话(见教材P98的“小结”部分)中提到的“小概率反证法”的理解。12反证法的意义何在?“正难则反”的思想“保护”原假设——严谨性假设检验的基本思想提出H0,即假设差异仅由随机误差导致。在H0成立的前提下计算样本检验统计值以及更极端情况发生的可能性(P值)两种可能的情况:P值小于等于事先规定的界值(小概率)

拒绝H0

P值大于事先规定的界值(不是小概率)

没有理由拒绝H0

13检验水准Anyquestions?什么叫做“更极端情况”?14基于已经观测到的数据,样本统计量取值更加偏离零假设、趋于备择假设的情况。“更极端情况”与H0和H1同时有关即使同一个H0,针对不同的H1而言,“更极端情况”也可能不同。15例1中H0为“两组人群的平均Hb含量相同”,

H1为“两组人群的平均Hb含量不同”,此时的“更极端情况”是什么?假如例1中的H0不变,而将H1改为“该病女性患者的的平均Hb含量比正常女性高”,此时的“更极端情况”又是什么?假设检验三部曲

建立检验假设,确定检验水准选定检验方法,计算检验统计量确定P值,作出统计推断16建立假设无效假设或零假设(nullhypothesis)H0:

1=

0

=132

女性患者的平均Hb含量与正常女性相等备择假设(alternativehypothesis)H1:

1

0

女性患者的平均Hb含量与正常女性不等17确定检验水准

检验水准(significancelevel)

=0.05

应在设计时根据专业知识和研究目的确定单侧检验或双侧检验以及检验水准,不能在假设检验结果得出后再加以选择。18选定检验方法,计算检验统计量根据分析目的、设计类型和资料类型特征,选用适当的检验方法,计算相应的统计量。19目的:衡量两组人群的Hb均数是否有差别设计类型:单样本设计资料类型:连续型,总体标准差未知且样本含量较小,呈单峰对称分布计算检验统计量

t:20选定检验方法,计算检验统计量理论基础:t分布-2.06402.064v=2421计算P

H0成立,现有差别是随机误差

H0不成立(H1成立),现有差别是本质上的差别+随机误差就本例而言,如果H0

成立,得到现有结果及更极端情况的可能性为多少?(注意本例中的H1是什么)22v=24作结论若P≤

,拒绝H0,接受H1,可以认为……的差异有统计学意义。若P>

时,不拒绝H0,尚不能认为……的差异有统计学意义。23注意:结论中强调“认为”二字,即假设检验是针对基于某种假设的主观看法做出推断,而不是判断假设本身的正确性。例1.1.建立假设,确定检验水准

H0:

1=132;H1:

1132

=0.052.计算检验统计量

3.确定P值,作出统计推断

P<0.05,按

=0.05水准,拒绝H0,接受H1,差别有统计学意义。可以认为女性患者的平均Hb含量与正常女性不同。24P值检验,你用对了吗?25ProblemsarisewhenPvaluesarefrequentlymisinterpretedaboutwhattheymean,whentheyareselectivelyreported,andwhentheyarenotaccompaniedbyestimatesofeffectsizeanduncertainty.EvolutionofReportingPValuesintheBiomedicalLiterature,1990-2015,(2016年3月15日发表,可免费下载)JAMA.2016;315(11):1141-1148.doi:10.1001/jama.2016.1952.正确理解P值的含义http:///i6259499872571884033/26正确理解P值的含义1.P值可以表示数据与一个特定的统计模型是否相容;2.P值不能代表假说为真的概率,也不代表数据完全是由随机因素造成的概率;3.科研结论、商业决定和政策制定不能完全凭P是否小于一个特定的值来决定;4.正确的推理需要全面的报告和透明度;5.一个P值,或者是否具有统计学意义,不能表示一个效应的大小,或者一个结果的重要性;6.

P值本身不能作为判断一个模型或假说的良好量度。27辨析1.P值代表零假设错误的可能性;以上说法均不正确。P值并不是告诉你某些事情是否是真实的。如果你得到的P值为0.01,意思并不是说某些东西不真实的可能性有1%,P值为0.01可以代表结果20%的真实性、80%的真实性或者0.1%的真实性——所有这些都可以有相同的P值。2.P值代表结果是真实的可能性;28Significant的意义有意义的;意味深长的;重要的,重大的,值得注意的非偶然的(notbychance)“Significant”

不是指两组均数差异较大

29将拒绝H0说成“差异有统计学意义”,但不提倡“差异有显著性”或“有显著性”差异的提法,因其容易被误解为差别很大。相应地,将不拒绝H0说成“差异无统计学意义”。Anyquestions?如何正确表达差异的大小?(除P值外还应报告哪些指标?)301.效应值大小(effectsize)例如,均数之差、率差、率比和回归系数等。2.置信区间假设检验与区间估计的联系

假设检验用于推断总体参数是否不相等。两者既有区别,又有联系。

就同一份资料,如例1,若假设检验的结果是,拒绝H0

,接受H1

,则其(1-

)的置信区间必定不包括所规定的总体参数,反之亦然。置信区间能够给出总体参数的可能范围,而假设检验能够给出一个确切的概率P值。31置信区间提供的信息32

置信区间与假设检验的作用是相辅的,若两者结合起来,可以提供更为全面的统计推断信息。因此学术期刊建议论文在报告假设检验结论的同时,应该报告相应的区间估计的结果。33双侧检验与单侧检验双侧检验(twosidetest) H0:

1=

2 H1:

1≠

2单侧检验(onesidetest) H0:

1=

2 H0:

1=

2 H1:

1>

2 H1:

1<

234双侧检验与单侧检验(续)选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。在没有专业知识说明的情况下,一般采用双侧检验。选用双侧检验还是单侧检验,应该在假设检验的第一步建立检验假设时确定,不应该在算得检验统计量后主观确定,否则可能会得到相反结论。

35单侧检验的例子36已知服用某种营养素一个疗程后,受试者某项生化指标平均增加52个单位。一家研究所对该营养素进行改进后,随机抽取服用新产品一个疗程的受试者36名,测得该生化指标平均增加了52.75个单位,标准差为2.0个单位。问该营养素新产品是否比旧产品的效果好?这里研究者关心的是该营养素新产品是否比旧产品的效果好,并且具一定的专业依据,因此属于单侧检验问题。37分析38统计三部曲I型错误与II型错误拒绝了实际上成立的H0,这类“弃真”的错误为I型错误(typeIerror);不拒绝实际上不成立的H0,这类“存伪”的错误为II型错误(typeIIerror)。

39再次强调:假设检验不是判断真伪,而是在“弃”(拒绝)和“存”(不拒绝)之间做出抉择。I型错误和II型错误实际情况假设检验结果拒绝H0

不拒绝H0H0

成立I型错误(

)可信度(1-

)H0

不成立把握度(1-

)II型错误(

)40I型错误和II型错误图示为了简化说明,考虑单侧检验(双侧检验可作类似思考)。回想前面单侧检验的例子,通过查表得到临界值以后,假设检验实际上就已经变成了基于t统计量取值从而对是否拒绝H0的判断,即当t>1.690时,拒绝H0;当t≤1.690时,不拒绝H0.41I型错误和II型错误图示界值

(犯I型错误概率)

(犯II型错误概率)1-

0

拒绝H0(统计值大于界值)不拒绝H0(统计值不大于界值)1-

H0成立H1成立42

的逆向关系

&

HaveanInverseRelationship

不能同时降低两类错误!43

的关系通常当n固定时,

愈小,

愈大;反之,

愈大,

愈小。增大n,可在一定程度上同时减小

。44AnyQuestions?45自由度为45的t界值在附表3中无法查询,有的同学采用自由度为40的t界值近似,有的则采用自由度为50的t界值近似。请问:两种方法对于假设检验的两种错误有何影响?提示:此例中自由度的改变具体影响“统计三部曲”中的哪一步?对t界值有何影响?检验效能1-

称为检验效能或把握度(powerofatest),其统计学意义是若两总体确有差别,按

水准能检出其差别的能力。

值的大小很难确切估计,只有在已知样本含量n、两总体参数差值

以及所规定的检验水准

的条件下,才能估算出

大小(参见第十八章内容)。46

区别

P

:根据研究目的和设计要求预先确定的概率,是事先规定的检验水准。它确定了小概率事件的标准,并反映了犯I型错误的概率大小。P:根据样本统计量所求得的事后概率,反映从H0总体中随机抽得现有样本以及更极端情况的概率。47结论的概率性无论做出何种推断结论,总是有风险的!拒绝H0时可能犯I型错误;不拒绝H0时可能犯II型错误;结论不能绝对化。统计学已证明……(错误)由此可以肯定……(错误)48数据应来自科学严密设计的实验或调查要根据研究目的、设计类型和资料类型选用适当的检验方法单、双侧检验应事先确定正确理解差别有无显著性的统计学意义结论不能绝对化统计学意义与实际意义假设检验应注意的问题49

二、t检验和z检验

——定量资料的两均数比较的假设检验方法中最为简单和常用者50学习要点:t检验和z检验的应用条件均数比较的设计类型51

t检验的应用条件:

未知且n较小时,要求样本来自正态分布总体两样本均数比较时,还要求两样本所属总体的方差相等

z检验(u检验)的应用条件:

未知但n足够大(如n>100)

已知52例2.据大量调查知,健康成年男子脉搏的均数为72次/分,某医生在山区随机调查了25名健康成年男子,其脉搏均数为74.2次/分,标准差为6.5次/分,能否认为该山区成年男子的脉搏高于一般人群?

53分析目的:推断样本所代表的未知总体均数

与已知总体均数

0有无差别。

——设计类型属于“样本均数与总体均数比较”该山区成年男子的脉搏是否高于一般人群?

——单侧检验Analysis54(1)建立检验假设,确定检验水准

H0:

=

0,山区成年男子平均脉搏数与一般人群相等

H1:

>

0,山区成年男子平均脉搏数高于一般人群

单侧

=0.0555(2)计算检验统计量56(3)确定P值,作出统计推断查附表3,t界值表:t0.05,24=1.711,t0.10,24=1.318,得0.10>P>0.05,按

=0.05水准不拒绝H0,尚不能认为该山区健康成年男子的脉搏均数高于一般健康成年男子的脉搏均数。57

配对设计的均数比较

配对设计(paireddesign)是为了使某个或某些关键的非处理因素(称为配对因素)在组间达到均衡,首先将受试对象按配对因素相同或相近配成对子,再将每对中的两个受试对象随机分配到两个不同的处理组中。58

配对设计的均数比较

医学科学研究中的配对设计主要有:配对的两个受试对象分别接受两种处理之后的数据同一样品用两种方法(或仪器等)检验的结果同一受试对象两个部位的数据同一受试对象试验前后的数据

其目的是推断两种处理(或方法)的结果有无差别。

59例3.分别用两种测量肺活量的仪器测得12名妇女的最大呼气率(L/min),资料如下表,问两种方法的检测结果有无差别?60表1.两种方法检测12名妇女最大呼气率(L/min)结果

61表1.两种方法检测12名妇女最大呼气率(L/min)结果

62(1)建立假设检验,确定检验水准H0:两仪器检验结果相同,即

d=0H1:两仪器检验结果不同,即

d

0

=0.0563(2)计算统计量

=n-1=12-1=1164(3)确定P值,作出统计推断

查t界值表,得0.20>P>0.10,按

=0.05水准不拒绝H0,尚不能认为两种仪器检查的结果不同。65例4.某医生测得18例慢性支气管炎患者及16例健康人的尿17酮类固醇排出量(mg/dl)分别为X1和X2,试问两组的均数有无不同。

X1:3.145.837.354.624.055.084.984.22

4.352.352.892.165.555.944.405.35

3.804.12

X2:4.127.893.246.363.486.744.677.38

4.954.085.344.276.544.625.925.18

66(1)建立假设检验,确定检验水准H0:

1=

2,即两总体均数相等H1:

1

2,即两总体均数不相等

=0.05

成组设计两均数的比较67(2)计算检验统计量68(3)确定P值,作出统计推断查附表3,t界值表,得0.10>P>0.05,按

=0.05水准不拒绝H0,尚不能认为慢性支气管患者尿17酮类固醇的排出量与健康人不同。69大样本时均数比较的

z检验单样本z检验两样本z检验70例5.某地抽样调查了部分健康成人的红细胞数,其中男性360人,均数为4.660

1012/L,标准差为0.575

1012/L;女性255人,均数为4.178

1012/L,标准差为0.291

1012/L,试问该地男、女平均红细胞数有无差别?

71(1)建立假设检验,确定检验水准

H0:

1=

2,即该地男、女平均红细胞数相等

H1:

1

2,即该地男、女平均红细胞数不等

=0.0572(2)计算统计量

73(3)确定P值,作出统计推断查附表3,z界值表(→

时),得P<0.001,按

=0.05水准拒绝H0,接受H1,可认为该地男女红细胞数的均数不同,男性高于女性。74成组设计两样本几何均数比较对数变换后呈(近似)正态分布的资料,如:抗体滴度、细菌计数等要点:先将原始数据对数转换为正态分布资料后,再做计算75例6.为比较两种狂犬疫苗的效果,将120名患者随机分为两组,分别注射精制苗和PVRV,测定45天两组的狂犬病毒抗体滴度,结果见下表,问两种狂犬疫苗的效果有无差别?

7677

上机实习时请注意练习正态性检验方差齐性检验78正态性检验正态性检验(testofnormality)

即判定资料是否服从正态分布检验方法图示法

P-P图法和Q-Q图法统计检验法W检验和矩法

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论