数值变量资料的统计分析-统计推断.ppt_第1页
数值变量资料的统计分析-统计推断.ppt_第2页
数值变量资料的统计分析-统计推断.ppt_第3页
数值变量资料的统计分析-统计推断.ppt_第4页
数值变量资料的统计分析-统计推断.ppt_第5页
已阅读5页,还剩39页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,第二节 数值变量资料的统计分析 统计推断 Statistical inference,信阳职业技术学院 赵玉霞,主要内容,一 均数的抽样误差与标准误 二 t分布 三 总体均数的估计 四 均数的假设检验,学习目标,1.说出抽样误差的概念 2.记住标准误计算公式并能说出公式的含义 3.描述t分布的特征及应用 4.说出参数估计的含义及方法 5.描述均数检验t检验和u检验的方法,统计推断,如:总体均数 总体标准差 总体率,如:样本均数 样本标准差S 样本率 P,内容: 参数估计(estimation of parameters) 包括:点估计与区间估计 2. 假设检验(test of hypothesis),统计推断 statistical inference,一 均数的抽样误差,抽样误差 (sampling error) :由于个体差异导致的样本统计量之间或与总体参数间的差别。,从某正态分布总体中,随机抽取样本含量n100的样本,每次抽样获得其均数分别为 , , , ,他们之间及与 总体均数总是不相等。这种差异就是抽样误差。,1.抽样试验,从正态分布总体N(5.00,0.502)中,每次随机抽取样本含量n5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。 按上述方法再做样本含量n10、样本含量n30的抽样实验;比较计算结果。,抽样试验(n=5),抽样试验(n=10),抽样试验(n=30),1000份样本抽样计算结果,3个抽样实验结果图示,抽样实验小结,均数的均数围绕总体均数上下波动。 均数的标准差即标准误 与总体标准差 相差一个常数的倍数,即 样本均数的标准误(Standard Error) =样本标准差/ 从正态总体N(, 2)中抽取样本,获得均数的分布仍近似呈正态分布N(,2/n) 。,2.中心极限定理( central limit theorem),即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 随着样本量的增大, 样本均数的变异范围也逐渐变窄。,随机变量X N(m,s2),标准正态分布 N(0,12),u变换,均数,标准正态分布 N(0,12),Student t分布 自由度:n-1,二 t分布,t分布曲线,t 分布有如下特征: 是以0为中心随自由度而变化的一簇左右对称的曲线 单峰分布,曲线在t0 处最高,并以t0为中心左右对称 与正态分布相比,曲线最高处较矮,自由度越小,两尾部翘得越高(见绿线) 随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。,t分布曲线,t 分布有如下特征: 自由度相同时,t越大, p值越小 p值相同时,自由度越大, t值越小 t值相同时,自由度越大 p值越小,(t1t2,p1p2),(n1n2, t1t2),(n1n2,p1p2),t分布曲线下面积,单侧t0.05,91.833 双侧t0.05/2,92.262 单侧t0.025,9 单侧t0.01,92.821 双侧t0.01/2,93.250 单侧t0.005,9 双侧t0.05/2,1.96 单侧t0.025, 单侧t0.05, 1.64,3.250,2.821,三 总体均数的估计,1.总体均数的估计 (1). 总体均数的点估计(point estimation)与区间估计 (2). 总体均数的可信区间(confidence interval,CI) (3). 大样本总体均数的可信区间 2.可信区间的解释,1.总体均数的估计,(1). 总体均数的点估计与区间估计,参数的估计,点估计:由样本统计量 直接估计 总体参数,区间估计:在一定可信度(1-) 下,同时考虑抽样误差,区间的可信度(如95或99)是重复抽样(如1000次)时,样本(如n=5)区间包含总体参数()的百分数。常用 (1-)表示, 值一般取0.05或0.01。,(2). 总体均数的可信区间(CI),(2). 总体均数的可信区间,(3). 大样本总体均数的可信区间,2.可信区间的解释,95可信区间:从总体中作随机抽样,作100次抽样,每个样本可算得一个可信区间,得100个可信区间,平均有95个可信区间包括(估计正确),只有5个可信区间不包括(估计错误)。,可信区间与参考值范围的比较,四 均数的假设检验,1.样本均数与总体均数的比较 2.配对资料的比较 3.两样本均数的比较 4.大样本均数比较的u检验 5.假设检验的步骤及有关概念,1.样本均数与总体均数的比较,推断样本所代表的未知总体均数与已知总体均数0有无差别。 已知总体均数0一般为理论值、标准值或经大量观察所得的稳定值。 统计量t的计算公式:,实 例,根据专业知识确定单、双侧检验,2.配对资料的比较,两种情况:1.随机配对设计(randomized paired design)是将受试对象按某些混杂因素(如性别、年龄、窝别等)配成对子,每对中的两个个体随机分配给两种处理(如处理组与对照组);2.或者同一受试对象作两次不同的处理(自身对照)。 优点:配对设计减少了个体差异。 特点:资料成对,每对数据不可拆分。,2.配对资料的比较方法,例: 两法测定12份尿铅含量的结果,两法测定结果的比较,3.两样本均数的比较,完全随机设计(completely random design) :把受试对象完全随机分为两组,分别给予不同处理,然后比较独立的两组样本均数。各组对象数不必严格相同。 目的:比较两总体均数是否相同。,条件:假定资料来自正态总体,12=22,实 例,4.大样本均数比较的u检验,两样本均数比较时当每组样本量大于30(或50)时,可采用u检验;但只是近似方法。 优点:简单,u界值与自由度无关, u0.051.96, u0.012.58,5.假设检验的步骤及有关概念,总体间差异: 1. 个体差异,抽样误差所致; 2. 总体间固有差异 判断差别属于哪一种情况的统计学检验,就是假设检验(test of hypothesis)。 t检验是最常用的一种假设检验之一。 小概率思想: P(0.05) 样本差别无统计学意义,1、建立假设与确定检验水准() H0: 12 无效假设(null hypothesis) H1: 12 备择假设(alternative hypothesis) 检验水准(level of a test):=0.05(双侧) 2、选定方法和计算统计量: 根据统计推断目的、设计、资料组数、样本含量、等选择方法。如两组小样本比较用t检验、大样本比较u检验、方差齐性检验用F检验。 3、确定P值,作出判断 P(0.05) 样本差别有统计学意义; P (0.05) 样本差别无统计学意义,假设检验的步骤,型错误和型错误,(1b)即把握度(power of a test):两总体确有差别,被检出有差别的能力 (1a)即可信度(confidence level):重复抽样时,样本区间包含总体参数(m)的百分数,对于一般的假设检验, a定为0.05(或0.01),b的大小取决于H1。通常情况下,比较总体间有无差异并不知道,即H1不明确, b值的大小无法确定,也就是说,对于一般的假设检验,我们并不知道犯型错误的概率b有多大。,通常情况下型错误未知,a,b,减少(增加)I型错误,将会增加(减少)II型错

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论