【志鸿优化设计】高考数学一轮复习 第十一章 概率与统计11.9回归分析与独立性检验教学案 理 新人教A版 .doc_第1页
【志鸿优化设计】高考数学一轮复习 第十一章 概率与统计11.9回归分析与独立性检验教学案 理 新人教A版 .doc_第2页
【志鸿优化设计】高考数学一轮复习 第十一章 概率与统计11.9回归分析与独立性检验教学案 理 新人教A版 .doc_第3页
【志鸿优化设计】高考数学一轮复习 第十一章 概率与统计11.9回归分析与独立性检验教学案 理 新人教A版 .doc_第4页
【志鸿优化设计】高考数学一轮复习 第十一章 概率与统计11.9回归分析与独立性检验教学案 理 新人教A版 .doc_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

11.9回归分析与独立性检验1会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系2了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程3了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用4了解回归分析的基本思想、方法及其简单应用1相关关系:当自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系与函数关系不同,相关关系是一种_2散点图:表示具有相关关系的两个变量的一组数据的图形叫做散点图,它可直观地判断两变量的关系是否可以用线性关系表示若这些散点分布在从左下角到右上角的区域,则称两个变量_;若这些散点分布在从左上角到右下角的区域,则称两个变量_3回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析在线性回归模型ybxae中,因变量y的值由自变量x和随机误差e共同确定,即自变量x只能解释部分y的变化,在统计中,我们把自变量x称为_,因变量y称为_4回归方程: x ,其中 , ,它主要用来估计和预测取值,从而获得对这两个变量之间整体关系的了解5相关系数:r它主要用于相关量的显著性检验,以衡量它们之间的线性相关程度当r0时表示两个变量正相关,当r0时表示两个变量负相关|r|越接近1,表明两个变量的线性相关性_;当|r|接近0时,表明两个变量间几乎不存在_6列联表有两个或两个以上的分类变量的_称为列联表一般我们只研究每个分类变量只取两个值的情况,有两个分类变量的样本频数列联表称为22列联表7独立性检验利用随机变量k2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验k2_(nabcd)1某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()a.10x200 b.10x200c.10x200 d.10x2002两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数r2如下,其中拟合效果最好的模型是()模型模型1模型2模型3模型4相关指数r20.980.800.500.25a模型1 b模型2c模型3 d模型43关于独立性检验的说法中,错误的是()a独立性检验依据小概率原理b独立性检验原理得到的结论一定正确c样本不同,独立性检验的结论可能有差异d独立性检验不是判定两类事物是否相关的唯一方法4在一项打鼾与患心脏病的调查中,共调查了1 671人,经过计算k2的观测值k27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是_的(填“有关”或“无关”)5已知一个线性回归方程为 1.5x45(xi1,7,5,13,19,i1,2,3,4,5),则_.一、利用散点图判断两个相关联变量的相关性【例1】 下面是水稻产量与施化肥量的一组观测数据:施化肥量15202530354045水稻产量320330360410460470480(1)将上述数据制成散点图;(2)你能从散点图中发现施化肥量与水稻产量近似成什么关系吗?水稻产量会一直随施化肥量的增加而增长吗?方法提炼散点图是由一系列数据点构成的,对于性质不明确的两组数据可先作散点图,直观地分析它们有无关系及关系的密切程度请做演练巩固提升1二、回归方程的求法及回归分析【例2】某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量/万吨236246257276286(1)利用所给数据求年需求量与年份之间的回归直线方程x;(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量方法提炼1最小二乘法估计的一般步骤:(1)作出散点图,判断是否线性相关;(2)如果线性相关,利用公式求,写出回归直线方程;(3)根据方程进行估计2回归直线方程恒过点(,)请做演练巩固提升2三、独立性检验【例3】 某企业有两个分厂生产某种零件,按规定内径尺寸(单位:mm)的值落在29.94,30.06)内的零件为优质品从两个分厂生产的零件中各抽出了500件,量其内径尺寸,得结果如下表:甲厂:分组29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3010)30.10,3014)频数12638618292614乙厂:分组29.86,2990)29.90,2994)29.94,2998)29.98,3002)30.02,3006)30.06,3010)30.10,3014)频数297185159766218(1)试分别估计两个分厂生产的零件的优质品率;(2)由以上统计数据填写下面22列联表,并问能否在犯错误的概率不超过0.010的前提下认为“两个分厂生产的零件的质量有差异”甲厂乙厂合计优质品非优质品合计附:k2,p(k2k)0.050.010k3.8416.635方法提炼独立性检验的基本思想类似于反证法要确认“两个分类变量有关系”这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量k2应该很小如果由观测数据计算得到的k2的观测值k很大,则在一定程度上说明假设不合理根据随机变量k2的含义,我们把k2k0解释为有(1p(k2k0)100%的把握认为“两个分类变量有关系”;把k2k0解释为不能以(1p(k2k0)100%的把握认为“两个分类变量有关系”,或者由样本观测数据不能充分说明“两个分类变量有关系”请做演练巩固提升3要重视对线性回归方程意义的理解【典例】 (2012湖南高考)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系根据一组样本数据(xi,yi)(i1,2,n),用最小二乘法建立的回归方程为0.85x85.71,则下列结论中不正确的是()ay与x具有正的线性相关关系b回归直线过样本点的中心(,)c若该大学某女生身高增加1 cm,则其体重约增加0.85 kgd若该大学某女生身高为170 cm,则可断定其体重必为58.79 kg答案:d解析:d选项中,若该大学某女生身高为170 cm,则可断定其体重约为:0.8517085.7158.79 kg.故d不正确答题指导:1.求回归方程,关键在于正确求出系数,由于,的计算量大,计算时应仔细谨慎,分层进行,避免因计算而产生错误(注意线性回归方程中一次项系数为,常数项为,这与一次函数的习惯表示不同)2回归分析是对具有相关关系的两个变量进行统计分析的方法,只有在散点图大致呈线性时,求出的线性回归方程才有实际意义,否则,求出的线性回归方程毫无意义3根据回归方程进行预报,仅是一个预报值,而不是真实发生的值1(2012课标全国高考)在一组样本数据(x1,y1),(x2,y2),(xn,yn)(n2,x1,x2,xn不全相等)的散点图中,若所有样本点(xi,yi)(i1,2,n)都在直线yx1上,则这组样本数据的样本相关系数为()a1 b0 c. d12为了解儿子身高与其父亲身高的关系,随机抽取5对父子的身高数据如下:父亲身高x/cm174176176176178儿子身高y/cm175175176177177则y对x的线性回归方程为()a.x1 b.x1c.88x d.1763通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的22列联表:男女总计爱好402060不爱好203050总计6050110由k2算得,k2的观测值k7.8.附表:p(k2k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()a在犯错误的概率不超过0.010的前提下,认为“爱好该项运动与性别有关”b在犯错误的概率不超过0.010的前提下,认为“爱好该项运动与性别无关”c在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”d在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”4如图所示,有5组(x,y)数据,去掉_组数据后,剩下的4组数据具有较强的线性相关关系参考答案基础梳理自测知识梳理1非确定性关系2正相关负相关3解释变量预报变量5越强线性相关性6频数表7基础自测1a解析:由y与x负相关,排除b,d,而c中10x200在x0时,2000不符合题意2a解析:相关指数r2越大,拟合效果越好3b解析:因为利用独立性原理检验时与样本的选取有关,所以得到的结论可能有误,不是一定正确的4有关解析:k27.6310.828,在犯错误的概率不超过0.001的前提下认为打鼾与患心脏病有关558.5解析:线性回归方程为 1.5x45经过点(,),由9,知58.5.考点探究突破【例1】 解:(1)散点图如下:(2)从图中可以发现施化肥量与水稻产量具有线性相关关系,当施化肥量由小到大变化时,水稻产量由小变大,图中的数据点大致分布在一条直线的附近,因此施化肥量和水稻产量近似成线性相关关系,但水稻产量只是在一定范围内随着化肥施用量的增加而增长【例2】 解:(1)由所给数据看出,年需求量与年份之间是近似直线上升,下面来配回归直线方程为此对数据预处理如下:年份200642024需求量257211101929对预处理后的数据,容易算得0,3.2,6.5,3.2.由上述计算结果,知所求回归直线方程为257b(x2 006)a6.5(x2 006)3.2.即6.5(x2 006)260.2.(2)利用直线方程,可预测2012年的粮食需求量为65(2 0122 006)260.26.56260.2299.2(万吨)300(万吨)【例3】 解:(1)甲厂抽查的产品中有360件优质品,从而甲厂生产的零件的优质品率估计为100%72%;乙厂抽查的产品中有320件优质品,从而乙厂生产的零件的优质品率估计为100%64%.(2)甲厂乙厂合计优质品360320680非优质品140180320合计5005001 000k7.356.635,所以在犯错误的概率不超过0.010的前提下,认为“两个分厂生产的零件的质量有差异”演练巩固提升1d解析:样本相关系数越接近1,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论