1.2独立性检验的基本思想及其初步应用_第1页
1.2独立性检验的基本思想及其初步应用_第2页
1.2独立性检验的基本思想及其初步应用_第3页
1.2独立性检验的基本思想及其初步应用_第4页
1.2独立性检验的基本思想及其初步应用_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.2独立性检验的基本思想及其初步应用,对于性别变量,其取值为男和女两种.,这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量.,生活中的分类变量,是否吸烟,宗教信仰,国籍,我们常常关心两个分类变量之间是否有关系。例如吸烟与患肺癌是否有关系?性别是否与喜欢学习数学有关系?,某肿瘤研究所为了了解患肺癌与吸烟是否有关,进行了一次抽样调查,共调查了9965人,其中吸烟者2148人,不吸烟者7817人,调查结果是:吸烟的2148人中49人患肺癌, 2099人不患肺癌;不吸烟的7817人中42人患肺癌, 7775人不患肺癌。,根据这些数据能否断定:患肺癌与 吸烟有关吗?,问题:,-5-,

2、知识梳理,为了研究这个问题,我们将上述问题用下表表示:,列22联表,在不吸烟者中患病的比重是,在吸烟者中患病的比重是,0.54%,2.28%,-6-,知识梳理,通过图形直观判断,不患病 比例,患病 比例,上述结论能判断吸烟与患病有关吗?,等高 条形图,从上面数据和图形可以看出吸烟和患肺癌有关,从上面数据和图形可以看出吸烟和患肺癌有关,事实是否如此?,这种判断是否可靠,我们能够有多大的把握认为“吸烟与患肺癌有关呢”?,知识梳理,假设H0:吸烟和患病之间没有关系, 列出22列联表,如果:吸烟与患肺癌没有关系,则在吸烟者中不患肺癌的比例应该与不吸烟者中相应的比例差不多,即,|ad-bc|越小,说明吸

3、烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。,知识梳理,为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量,(1),独立性检验,作为检验在多大程度上可以认为“两个变量有关系”的标准 。,通过公式计算,解:H0:吸烟和患病之间没有关系,独立性检验,通过查阅下表确定临界值:,已知在 成立的情况下,,故有99%的把握认为H0不成立,即有99%的把握认为“患病与吸烟有关系”。但这种判断会犯错误,犯错误的概率不超过0.010,即在 成立的情况下, 大于6.635概率非常小,近似为0.010,现在的 =56.632的观测值远大于6.635,出现这样

4、的观测值的概率不超过0.010。,这个值到底能告诉我们什么?,0.1%把握认 为A与B无关,1%把握认为A与B无关,99.9%把握认 为A与B有关,99%把握认 为A与B有关,90%把握认 为A与B有关,10%把握认为 A与B无关,没有充分的依据显示A与B有关,但也不能显示A与B无关,独立性检验的步骤,第一步:H0: 吸烟和患肺癌没有关系 第二步:列出22列联表,第三步:计算:,第四步:查对临界值表,作出判断。,独立性检验的定义,上面这种利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。,例1.在500人身上试验某种血清预防感冒作用,把他们一

5、年中的感冒记录与另外500名未用血清的人的感冒记录作比较,结果如表所示。问:该种血清能否起到预防感冒的作用?,解:设H0:感冒与是否使用该血清没有关系。,因当H0成立时,26.635的概率约为0.01,故有99%的把握认为该血清能起到预防感冒的作用。,独立性检验的基本思想:,类似于数学上的反证法,对“两个分类变量有关系” 这一结论成立的可信程度的判断:,(1)假设该结论不成立,即假设结论“两个分类变量 没有关系”成立.,(2)在假设条件下,计算构造的随机变量K2,如果由观测数据计算得到的K2很大,则在一定程度上说明假设不合理.,(3)根据随机变量K2的含义,可以通过(2)式评价假设不合理的程度

6、,由实际计算出的k6.635,说明假设不合理的程度约为99%,即“两个分类有关系”这一结论成立的可信程度约为99%.,反证法原理与独立性检验原理,在假设H0下,如果推出一个矛盾,就证明了H0不成立.,在假设H0 下,如果出现一个与H0相矛盾的小概率事件,就推断H0 不成立,且该推断犯错误的概率不超过这个小概率.,PK,-19-,知识梳理,双击自测,2,3,4,1,1.下列结论正确的画“”,错误的画“”. (1)事件X,Y关系越密切,则由观测数据计算得到的K2的观测值越大. () (2)由独立性检验可知,在犯错误的概率不超过1%的前提下认为物理成绩优秀与数学成绩有关,某人数学成绩优秀,则他有99

7、%的可能物理成绩优秀. (),-20-,知识梳理,双击自测,2,3,4,1,答案,2、下面是一个22列联表,则表中a,b处的值分别为( ) A、94,96 B、52,50 C、52,54 C、54,52,-21-,知识梳理,双击自测,2,3,4,1,答案,3、随机抽取105个行人,了解他们的性别与是否遵守交通规则之间有没有关系, 经过计算得K2=10.59 ,根据这一数据分析。我们有 _ 把握认为性别与是否 遵守交通规则有关系,-22-,知识梳理,双击自测,2,3,4,1,4.在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认

8、为打鼾与患心脏病是的(填“有关”或“无关”).,答案,解析,解:设H0:药的效果与给药方式没有关系。,因当H0成立时,21.3896的概率大于10%,故不能否定假设H0,即不能作出药的效果与给药方式有关的结论。,2.706,例2:为研究不同的给药方式(口服与注射)和药的效果(有效与无效)是否有关,进行了相应的抽样调查,调查的结果列在表中,根据所选择的193个病人的数据,能否作出药的效果和给药方式有关的结论?,例5:气管炎是一种常见的呼吸道疾病,医药研究人员对两种中草药治疗慢性气管炎的疗效进行对比,所得数据如表所示,问:它们的疗效有无差异?,解:设H0:两种中草药的治疗效果没有差异。,因当H0成

9、立时,210.828的概率为0.001,故有99.9%的把握认为,两种药物的疗效有差异。,例4某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表: 根据表中的数据,判定主修统计专业与性别有关系,则这种判断出错的可能性为多少? 解:根据表中的数据,得到,因为k 3.841 ,所以判定主修统计专业与性别有关系,则这种判断出错的可能性为5%,-26-,方法总结有关独立性检验的问题要注意: (1)两个明确: 明确两类主体; 明确研究的两个问题. (2)两个关键: 准确画出22列联表; 准确理解K2.,-27-,对点练习为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下: (1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例. (2)能否在犯错误的概率不超过1%的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.,-28-,解:(1)调查的500位老年人中有70位需要志愿者提供帮助, 因此该地区老年人中

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论