2018_2019学年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用学案新人教A版.docx_第1页
2018_2019学年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用学案新人教A版.docx_第2页
2018_2019学年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用学案新人教A版.docx_第3页
2018_2019学年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用学案新人教A版.docx_第4页
2018_2019学年高中数学第三章统计案例3.2独立性检验的基本思想及其初步应用学案新人教A版.docx_第5页
已阅读5页,还剩12页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

32独立性检验的基本思想及其初步应用1.了解分类变量的意义2.了解22列联表的意义3.了解随机变量K2的意义4通过对典型案例分析,了解独立性检验的基本思想和方法,1分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量(2)列联表定义:列出的两个分类变量的频数表称为列联表22列联表一般地,假设有两个分类变量X和Y,它们的取值分别为x1,x2和y1,y2,其样本频数列联表(也称为22列联表)为下表y1y2总计x1ababx2cdcd总计acbdabcd(1)列联表是两个或两个以上分类变量的汇总统计表,现阶段我们仅限于研究两个分类变量的列联表,并且每个分类变量只取两个值,这样的列联表称为22列联表(2)列联表有助于直观地观测数据之间的关系 2等高条形图(1)等高条形图与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征(2)观察等高条形图发现和相差很大,就判断两个分类变量之间有关系3独立性检验(1)定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验(2)K2,其中nabcd为样本容量(3)独立性检验的具体做法根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界,然后查表确定临界值k0.利用公式计算随机变量K2的观测值k.如果kk0,就推断“X与Y有关系”,这种推断犯错误的概率不超过,否则,就认为在犯错误的概率不超过的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”独立性检验的基本思想与反证法的思想的相似之处反证法独立性检验要证明结论A要确认“两个分类变量有关系”在A不成立的前提下进行推理假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下计算K2 判断正误(正确的打“”,错误的打“”)(1)列联表中的数据是两个分类变量的频数()(2)对事件A与B的独立性检验无关,即两个事件互不影响()(3)K2的大小是判断事件A与B是否相关的统计量()答案:(1)(2)(3) 某校为了检验高中数学新课程改革的成果,在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如22列联表所示(单位:人),则其中m_,n_80分及80分以上80分以下总计试验班321850对照班24m50总计5644n答案:26100 若两个分类变量X和Y的22列联表为:y1y2x1515x24010则X与Y之间有关系的可信度为_解析:K2的观测值k18.810.828.故有99.9%的把握认为X与Y有关系答案:99.9%探究点1等高条形图的应用为了解铅中毒病人与尿棕色素为阳性是否有关系,分别对病人组和对照组的尿液作尿棕色素定性检查,结果如下:组别阳性数阴性数总计铅中毒病人29736对照组92837总计383573试画出列联表的等高条形图,分析铅中毒病人和对照组的尿棕色素阳性数有无差别,铅中毒病人与尿棕色素为阳性是否有关系?【解】等高条形图如图所示:其中两个浅色条的高分别代表铅中毒病人和对照组样本中尿棕色素为阳性的频率由图可以直观地看出铅中毒病人与对照组相比,尿棕色素为阳性的频率差异明显,因此铅中毒病人与尿棕色素为阳性有关系(1)判断两个分类变量是否有关系的两种常用方法利用数形结合思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法一般地,在等高条形图中,与相差越大,两个分类变量有关系的可能性就越大(2)利用等高条形图判断两个分类变量是否相关的步骤 研究人员选取170名青年男女大学生,对他们进行一种心理测验发现60名女生对该心理测验中的最后一个题目的反应是:作肯定的有18名,否定的有42名.110名男生在相同的题目上作肯定的有22名,否定的有88名试判断性别与态度之间是否有关系解:根据题目所给数据建立如下列联表:肯定否定总计女生184260男生2288110总计40130170相应的等高条形图如图所示比较来看,女生中肯定的人数比要高于男生中肯定的人数比,因此可以在某种程度上认为性别与态度之间有关探究点2独立性检验某新闻媒体为了了解观众对央视开门大吉节目的喜爱与性别是否有关系,随机调查了观看该节目的观众110名,得到如下的列联表:女男总计喜爱402060不喜爱203050总计6050110试根据样本估计总体的思想,估计约有多大的把握认为“喜爱该节目与否和性别有关”,并说明理由参考附表:P(K2k)0.0500.0100.001k3.8416.63510.828(参考公式:K2,其中nabcd)【解】假设喜爱开门大吉节目与否和性别无关K2的观测值k7.86.635,P(K26.635)0.01,所以有99%以上的把握认为“喜爱开门大吉节目与否和性别有关”解决独立性检验问题的基本步骤(1)根据已知的数据作出列联表(2)作出相应的等高条形图,可以利用图形做出相应判断(3)求K2的观测值(4)判断可能性:与临界值比较,得出事件有关的可能性大小 为了研究学生选报文、理科是否与对外语的兴趣有关,某同学调查了361名高一在校生,调查结果如下:理科对外语有兴趣的有138人,无兴趣的有98人,文科对外语有兴趣的有73人,无兴趣的有52人试分析学生选报文、理科与对外语的兴趣是否有关?解:问题是判断学生选报文、理科是否与对外语的兴趣有关列出22列联表如下:理文总计有兴趣13873211无兴趣9852150总计236125361由公式得K2的观测值k1.871104.因为1.8711042.706,故可以认为学生选报文、理科与对外语的兴趣无关探究点3独立性检验的综合应用(2017高考全国卷节选)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随机抽取了100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下:(1)设两种养殖方法的箱产量相互独立,记A表示事件“旧养殖法的箱产量低于50 kg, 新养殖法的箱产量不低于50 kg”,估计A的概率;(2)填写下面列联表,并根据列联表判断是否有99%的把握认为箱产量与养殖方法有关:箱产量50 kg箱产量50 kg旧养殖法新养殖法附:P(K2k)0.0500.0100.001k3.8416.63510.828K2.【解】(1)记B表示事件“旧养殖法的箱产量低于50 kg”,C表示事件“新养殖法的箱产量不低于50 kg”由题意知P(A)P(BC)P(B)P(C)旧养殖法的箱产量低于50 kg的频率为(0.0120.0140.0240.0340.040)50.62,故P(B)的估计值为0.62.新养殖法的箱产量不低于50 kg的频率为(0.0680.0460.0100.008)50.66,故P(C)的估计值为0.66.因此,事件A的概率估计值为0.620.660.409 2.(2)根据箱产量的频率分布直方图得列联表箱产量6.635,故有99%的把握认为箱产量与养殖方法有关两个分类变量相关关系的判断(1)等高条形图法:在等高条形图中,可以估计满足条件Xx1的个体中具有Yy1的个体所占的比例,也可以估计满足条件Xx2的个体中具有Yy1的个体所占的比例.两个比例的值相差越大,X与Y有关系成立的可能性就越大(2)观测值法:通过22列联表,先计算K2的观测值k,然后借助k的含义判断“两个分类变量有关系”这一结论成立的可信程度 某市教育局邀请教育专家深入该市多所中小学,开展听课、访谈及随堂检测等活动,他们把收集到的180节课分为三类课堂教学模式,教师主讲的为A模式,少数学生参与的为B模式,多数学生参与的为C模式,A,B,C三类课的节数比例为321.(1)为便于研究分析,教育专家将A模式称为传统课堂模式,B,C统称为新课堂模式,根据随堂检测结果,把课堂教学效率分为高效和非高效,根据检测结果统计得到如下22列联表(单位:节)高效非高效总计新课堂模式603090传统课堂模式405090总计10080180请根据统计数据回答:能否在犯错误的概率不超过0.01的前提下认为课堂教学效率与教学模式有关?并说明理由(2)教育专家采用分层抽样的方法从收集到的180节课中选出12节课作为样本进行研究,并从样本中的B模式和C模式课堂中随机抽取2节课,求至少有一节课为C模式课堂的概率参考临界值有:P(K2k0)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828参考公式:K2,其中nabcd.解:(1)由列联表中的统计数据计算随机变量K2的观测值k96.635,由临界值表P(K26.635)0.010,所以在犯错误的概率不超过0.01的前提下可以认为课堂效率与教学模式有关(2)样本中的B模式课堂和C模式课堂分别是4节和2节从中任取两节有C15种取法,其中至少有一节课为C模式课堂取法有CC9种,所以至少有一节课为C模式课堂的概率为.1对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()Ak越大,“X与Y有关系”的可信程度越小Bk越小,“X与Y有关系”的可信程度越小Ck越接近于0,“X与Y没有关系”的可信程度越小Dk越大,“X与Y没有关系”的可信程度越大解析:选B.k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大;k越小,“X与Y有关系”的可信程度越小2下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A性别与喜欢理科无关B女生中喜欢理科的比为80%C男生比女生喜欢理科的可能性大些D男生不喜欢理科的比为60%解析:选C.由图知女生中喜欢理科的比为20%,男生不喜欢理科的比为40%,故B、D不正确由图知,男生比女生喜欢理科的可能性大些3高中流行这样一句话“文科就怕数学不好,理科就怕英语不好”下表是一次针对高三文科学生的调查所得的数据总成绩好总成绩不好总计数学成绩好478a490数学成绩不好39924423总计bc913(1)计算a,b,c的值;(2)文科学生总成绩不好与数学成绩不好有关系吗?解:(1)由478a490,得a12.由a24c,得c122436.由bc913,得b91336877.(2)计算随机变量K2的观测值k6.2335.024,因为P(K25.024)0.025,所以在犯错误的概率不超过0.025的前提下,认为文科学生总成绩不好与数学成绩不好有关系 知识结构深化拓展1.独立性检验基本思想的理解(1)“P(K26.635)0.01”成立的前提是H0成立(2)P(K26.635)近似为0.01,当样本容量n越大时,其近似程度越大(3)K2与k的关系并不是k,K2是一个随机变量,在a,b,c,d取不同的值时,K2可能不同,而k是取定一组数a,b,c,d后的一个值2假设检验与反证法的关系反证法独立性检验要证明结论A提出假设H0在A不成立的前提下进行在H0成立的条件下进行推理推出矛盾,意味着结论A成立推出有利于H0成立的小概率事件发生,意味着H0成立的可能性小没有找到矛盾,不能对A下任何结论,即反证法不成立推出有利于H0成立的小概率事件不发生,接受原假设,A基础达标1观察下列各图,其中两个分类变量x,y之间关系最强的是()解析:选D.在四幅图中,D图中两个深色条高相差最明显,说明两个分类变量之间关系最强2经过对K2的统计量的研究,得到了若干个临界值,当K22.706时,我们认为事件A与B()A有95%的把握认为A与B有关系B有99%的把握认为A与B有关系C没有充分理由说明事件A与B有关系D不能确定解析:选C.当K22.706时,有90%以上的把握说明A与B有关系,但当K22.706时,只能说明A与B是否有关系的理由不够充分,故选C.3为了解高中生作文成绩与课外阅读量之间的关系,某研究机构随机抽取了60名高中生,通过问卷调查,得到以下数据:作文成绩优秀作文成绩一般总计课外阅读量较大221032课外阅读量一般82028总计303060由以上数据,计算得到K2的观测值k9.643,根据临界值表,以下说法正确的是()A没有充足的理由认为课外阅读量大与作文成绩优秀有关B有0.5%的把握认为课外阅读量大与作文成绩优秀有关C在犯错误的概率不超过0.001的前提下认为课外阅读量大与作文成绩优秀有关D在犯错误的概率不超过0.005的前提下认为课外阅读量大与作文成绩优秀有关解析:选D.根据临界值表,9.6437.879,在犯错误的概率不超过0.005的前提下,认为课外阅读量大与作文成绩优秀有关4某班主任对全班50名学生进行了作业量的评价调查,所得数据如下表所示:认为作业量大认为作业量不大总计男生18927女生81523总计262450则认为作业量的大小与学生的性别有关的犯错误的概率不超过()A0.01 B0.025C0.10 D无充分证据解析:选B.因为K2的观测值为k5.0595.024,所以认为作业量的大小与学生的性别有关的犯错误的概率不超过0.025.5独立性检验所采用的思路是:要研究X,Y两个分类变量彼此相关,首先假设这两个分类变量彼此_,在此假设下构造随机变量K2.如果K2的观测值较大,那么在一定程度上说明假设_解析:独立性检验的前提是假设两个分类变量无关系,然后通过随机变量K2的观测值来判断假设是否成立答案:无关系不成立6在吸烟与患肺病是否相关的判断中,有下面的说法:若K2的观测值k6.635,则在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;从独立性检验可知在犯错误的概率不超过0.01的前提下,认为吸烟与患肺病有关系时,若某人吸烟,则他有99%的可能患有肺病;从独立性检验可知在犯错误的概率不超过0.05的前提下,认为吸烟与患肺病有关系时,是指有5%的可能性使得推断错误其中说法正确的是_解析:K2是检验吸烟与患肺病相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法不正确;说法中对“确定容许推断犯错误概率的上界”理解错误;说法正确答案:7为研究某新药的疗效,给100名患者服用此药,跟踪调查后得下表中的数据:无效有效总计男性患者153550女性患者64450总计2179100设H0:服用此药的效果与患者的性别无关,则K2的观测值k_,从而得出结论:服用此药的效果与患者的性别有关,这种判断出错的可能性为_解析:由公式计算得K2的观测值k4.882.因为k3.841,所以我们有95%的把握认为服用此药的效果与患者的性别有关,从而出错的可能性为5%.答案:4.8825%8在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,请列出22列联表,并估计色盲与性别是否有关系解:性别与色盲列联表色盲不色盲合计男38442480女6514520合计449561 000因为在调查的480名男性中,色盲占 ,在调查的520名女性中,色盲占,且两个比例的值相差较大,故估计色盲与性别有关系9某校数学课外兴趣小组为研究数学成绩是否与性别有关,先统计本校高三年级每个学生一学期数学成绩的平均分(采用百分制),剔除平均分在30分以下的学生后,共有男生300名,女生200名现采用分层抽样的方法,从中抽取了100名学生,按性别分为两组,并将两组学生成绩分为6组,得到如下所示频数分布表分数段40,50)50,60)60,70)70,80)80,90)90,100男39181569女64510132(1)估计男、女生各自的平均分(同一组数据用该组区间中点值作代表),从计算结果看,数学成绩与性别是否有关;(2)规定80分以上为优秀(含80分),请你根据已知条件作出22列联表,并判断是否在犯错误的概率不超过0.1的前提下认为数学成绩与性别有关优秀非优秀总计男生女生总计100解:(1)x男450.05550.15650.3750.25850.1950.1571.5,x女450.15550.1650.125750.25850.325950.0571.5,因为x男x女,所以从男、女生各自的平均分来看,并不能判断数学成绩与性别是否有关(2)由频数分布表可知,在抽取的100名学生中,“男生组”中数学成绩优秀的有15人,“女生组”中数学成绩优秀的有15人,据此可得22列联表如下:优秀非优秀总计男生154560女生152540总计3070100可得K2的观测值为k1.79,因为1.792.706,所以在犯错误的概率不超0.1的前提下不能认为数学成绩与性别有关B能力提升10某校高三年级在一次全年级的大型考试中,数学成绩优秀和非优秀的学生中,物理、化学、总成绩优秀的人数如下表所示,能否在犯错误的概率不超过0.001的前提下认为数学成绩优秀与物理、化学、总成绩优秀有关系?物理优秀化学优秀总成绩优秀数学优秀228225267数学非优秀14315699注:该年级在此次考试中数学成绩优秀的有360人,非优秀的有880人解:列出数学成绩与物理成绩的22列联表如下:物理优秀物理非优秀总计数学优秀228132360数学非优秀143737880总计3718691 240将表中数据代入公式,得K的观测值为k1270.110.828.列出数学成

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论