统计数的分布与统计推断(ppt 80页).ppt_第1页
统计数的分布与统计推断(ppt 80页).ppt_第2页
统计数的分布与统计推断(ppt 80页).ppt_第3页
统计数的分布与统计推断(ppt 80页).ppt_第4页
统计数的分布与统计推断(ppt 80页).ppt_第5页
已阅读5页,还剩74页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、本资料来源,正态分布,记作,决定了图形的中心位置, 决定了图形中峰的陡峭程度.,正态分布 的图形特点,标准正态分布,(1) P( U u) 或 P(U -u) (u 0),直接查表,设u服从正态分布N(0,1),试求: (1)P(u2.12) ( 2 ) P (u2.12),(2) P( U -u) 或 P(U u),查表,正态分布,(3) P( a U b),或,设x服从正态分布N(4,16),试求: (1)P(x2.44) ( 2 ) P (-3x 4),正态分布,P( -1 U 1) = 68.26% P( -2 U 2) = 95.45% P( -3 U 3) = 99.73% P(

2、-1.96 U 1.96) = 95% P( -2.58 U 2.58) = 99%,几个特殊的标准正态分布概率,正态分布,68.3%,95.5%,99.7%,正态分布,P( - X + ) = 68.26% P( - 2 X + 2 ) = 95.45% P( - 3 X + 3 ) = 99.73% P( - 1.96 X + 1.96 ) = 95% P( - 2.58 X + 2.58 ) = 99%,几个特殊的一般正态分布概率,正态分布,-3 -2 - + +2 +3,x,68.3%,95.5%,99.7%,对于给定的两尾概率求标准正态分布在x轴上的分位点,/2,/2,用2 查附表2

3、,可得一尾概率为 时的分位点u,对于给定的一尾概率求标准正态分布在x轴上的分位点,总体,样本,样本,样本,样本,统计推断:从样本到总体方向,抽样分布:从总体到样本方向,第三节 统计数的分布,抽样分布的概念,原总体,样本1,样本2,样本n,新总体,n ,统计量,随机抽样 对于大总体,可以随机性的抽取一部分样本进行研究 对于小的有限总体,进行放回式抽样(因总体不会耗尽而视作无限容量),例:设有一个 N=4 的有限总体,变数为2、3、3、4。现分别以n=2,n=4作独立的有放回的抽样。求总体的、2和样本平均数抽样总体的平均数、方差之间的关系。,N=4, n=2和n=4时的次数分布,解:该总体的、2、

4、为=3, 2=12, = =0.707 从有限总体作返置随机抽样,所有可能的样本数为Nn。其中n为样本含量。以上述总体而论,如果从中抽取n=2的样本,共可得 42=16 个样本;如果样本含量n为4,则 一 共 可 抽 得44=256个样本。分别求这些样本的平均数,其次数分布如上表所示。 根据表数据,在n=2的试验中,样本平均数抽样总体的平均数、方差与标准差分别为:,同理可得,在n=4的试验中,样本平均数抽样总体的平均数、方差与标准差分别为:,样本来自均数为,方差为 2的总体,正态总体样本平均数的分布 设样本来自正态总体 N( , 2),则样本平均数也服从正态分布,其总体均数为 ,方差为 2/n

5、。,不同样本容量的平均数的抽样分布形状为:,中心极限定理,无论样本所来自的总体是否服从正态分布, 只要样本足够大,样本平均数就近似服从正态分布,样本越大,近似程度越好。 所需的样本含量随原总体的分布而异,但只要样本含量 30,无论原总体是何分布,都足以满足近似的要求。 设原总体的平均数为,方差为 2,则样本平均数的平均数为,方差为 2 /n。,标准差 (Standard deviation) 标准误 ( Standard error),样本标准差与标准误之间的区别,样本标准差S是反映样本中各观测值 , , 变 异 程 度大小的一个指标,它的大小说明了 对 该 样本代表性的强弱。 样本标准误是样

6、本平均数 的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性的高低。,二、样本平均数差数的分布,(1) 样本平均数差数的平均数等于总体平均数的差数,即 (2) 样本平均数差数的方差等于两样本平均数(总体方差除以各样本容量之和) (3) 从两个正态总体中抽出的样本平均数差数的分布是正态分布, 记作,三、t分布,当总体标准差未知时,且样本数小于30时, 以样本标准差S代替所得到的统计量 记为t。在计算时,由于采用S来代替,使得t 变量不再服从标准正态分布,而是服从t分布,服从自由度为n-1的t分布,例如:当df=15时,查t分布表得两尾概率等于0.05的临界t值为 =2.13

7、1,其意义是: P(-t-2.131)= P(2.131t+)=,F t (df),1-F t (df),t分布的特征 1、t分布受自由度的制约,每一个自由度都有一条t分布密度曲线 2、t分布密度曲线以纵轴为对称轴,左右对称,且在t0时,分布密度函数取得最大值 3、与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平.df越小这种趋势越明显.df越大,t分布越趋近于标准正态分布.当n 30时,t分布与标准正态分布的区别很小;n 100时,t分布基本与标准正态分布相同;n时,t分布与标准正态分布完全一致,正态分布曲线与t分布曲线的比较,四、分布,设从一正态总体 中随机抽取样本容量为n,m的

8、两个独立样本,其样本的方差为 ,则定义 两者的比值为F,-服从自由度为n-1,m-1的F分布,F分布特征 1)F分布的平均数1,F的取值区间为0,+) 2)F分布曲线的形状仅决定于df1和df2.在df1l或2时,F分布曲线呈严重倾斜的反向J型,当df1=3时转为左偏曲线(在平均值的左边),不同自由度下的F分布曲线,第四章 统计推断,统计推断:根据抽样分布律和概率理论,由样本结果(统计数)来推论总体特征(参数)。 假设检验 参数估计,假设检验(显著性检验):根据于某种实际需要,对未知的或不完全知道的统计总体提出一些假设;然后由样本的实际结果,经过一定的计算,作出在概率意义上应当接受那种假设的检

9、验。 参数估计:由样本结果对总体参数作出点估计或者区间估计。,假设检验的基本原理,问题的提出 例 :某农场江南桤木4龄植株的平均胸径可达9cm。 问题:此说法是否正确?有4种可能性(假设) 1)正确: 9 2)不正确: 9(| 9| 0) 3)不正确: 9 三对假设: 9 vs 9, 9 vs 9,如何回答 随机抽取一个样本 计算该样本的平均数 比较样本平均数与9cm 难题 存在抽样误差 当样本平均数与9cm之差达到多大时可否定 9,解决的思路 针对要回答的问题提出一对对立的假设,并对其中的一个进行检验 找到一个样本统计量,它与提出的假设有关,其抽样分布已知 根据这个统计量观察值出现的概率,利

10、用小概率事件原理对假设是否成立做出推断,这个过程称为假设检验 (hypothesis testing),这里用到人们在实践中普遍采用的一个原则:,小概率事件在一次试验中基本上不会发生 .,小概率原理,下面我们用一例说明这个原则.,这里有两个盒子,各装有100个球.,现从两盒中随机取出一个盒子,问这个盒子里是白球99个还是红球99个?,我们不妨先假设:这个盒子里有99个白球.,现在我们从中随机摸出一个球,发现是,此时你如何判断这个假设是否成立呢?,假设其中真有99个白球,摸出红球的概率只有1/100,这是小概率事件.,小概率事件在一次试验中竟然发生了,不能不使人怀疑所作的假设.,小概率事件在一次

11、试验中基本上不会发生.,小概率事件原理 小概率事件在一次试验中几乎不会发生 如果某事件在一次试验中发生了,我们可认为它不是一个小概率事件 如果在某个假设下应当是小概率的事件在一次试验中发生了,可认为该假设不能成立,在假设检验中,我们称这个小概率为 显著性水平用 表示.,常取,的选择要根据实际情况而定。,假设检验的基本步骤 1)提出一对对立的假设 2)确定显著水平 3)构造并计算检验统计量 4)对所作的假设进行推断,例 设由该农场随机抽取了10株江南桤木,测得它们在4龄时的平均胸径为8.7cm。已知江南桤木的胸径服从正态分布,总体方差为 2 2.5cm2 1)提出假设 零假设(null hypo

12、thesis): H0: = 9cm 备择假设(alternative hypothesis): HA: 9cm,2)确定(显著水平)否定域 在检验统计量抽样分布的尾部(1侧或2侧)中划定一小概率区域,一旦计算的检验统计量的实际值落入此区域,就否定原假设,接受备择假设。 这个小概率也称为显著性水平,用 表示 通常取 5或 1,若取 5,则,接受域 95%,否定域 2.5%,1.96,-1.96,否定域:U 1.96 或 U 1.96,否定域 2.5%,3) 构造并计算检验统计量 检验统计量:用于检验原假设能否成立的统计量,满足以下条件 必须利用原假设提供的信息 抽样分布已知,4)对所作的假设进

13、行推断 差异不显著:在 5水平下,检验统计量的观察值落在接受域中 差异显著:在 5水平下,检验统计量的观察值落在否定域中 差异极显著:在 1水平下,检验统计量的观察值落在否定域中,U = -3.162 -1.96 (落入否定域) 否定原假设,结论:该场4龄南桤木的平均胸径与9cm差异 显著。,若取小概率为1%,可得否定域为 U 2.58 或 U -2.58 仍有 U = -3.162 -2.58,结论:该场4龄南桤木的平均胸径与9cm差异 极显著。,几个相关概念 1)双尾检验和单尾检验 双尾检验:否定域在检验统计量分布的两尾 单尾检验:否定域在检验统计量分布的一侧 左尾检验:否定域在检验统计量

14、分布的左侧 右尾检验:否定域在检验统计量分布的右侧,例(续) 左尾检验 1)假设: H0: = 9, HA: 9 2)检验统计量:同双侧检验, U = -3.162 3)否定域: 取 = 0.05 4)推断:,5%,-1.64, U = -3.162 -1.64 否定原假设,例(续) 右尾检验 1)假设: H0: = 9, HA: 9 2)检验统计量:同双侧检验, U = -3.162 3)否定域: 取 = 0.05 4)推断:,5%,1.64, U = -3.162 1.64 接受原假设,拒绝域 的概率是小概率. 如果统计量的实测值落入拒绝域 ,也就是说, H0 成立下的小概率事件发生了,那

15、么就认为H0不可信而否定它. 否则我们就不能否定H0 (只好接受它).,这里所依据的逻辑是:,不否定H0并不是肯定H0一定对,而只是说差异还不够显著,还没有达到足以否定H0的程度 .,所以假设检验又叫,“显著性检验”,Overwhelming Evidence (Highly Significant),Strong Evidence (Significant),Weak Evidence (Not Significant),No Evidence (Not Significant),0 .01 .05 .10,p=.0069,F 检验 用 F分布,一般说来,按照检验所用的统计量的分布,U 检验

16、 用正态分布,t 检验 用 t 分布,分为,u检验,适用条件 (1)总体方差已知时样本平均数的检验 (2)总体方差未知但样本为大样本(n=30)时样本平均数的检验,分 类 (1)一个样本平均数与总体平均数的比较,通常检验这个样本是否来自于该指定总体 a.总体方差2已知时的检验 b.总体方差2未知时的检验 (n=30) (2)两个样本平均数的比较,比较这两个样本是否来自于同一总体,1. 大样本单总体均值的检验总体方差已知,来自总体的样本为(x1,x2, ,xn),对于假设:H0: ,在H0成立的前提下,有检验统计量,例 成年男子的标准脉搏为72次分变异幅度 = 8.8次分,今调查了某山区健康成年

17、男子96人的脉搏,得均数为73.7次/分,问此均数是否符合正常标准?,解:由题意已知总体的0=72;=8.8; ; n=96,由于总体已知,故采用u检验,1. 无效假设: 即某山区健康成年男子与一般健 康成年男子脉搏的平均次数相等 备择假设: 2. 选取显著水平=0.05 3. 选择合适的统计量进行计算 4. 推断u0.05=1.96.|u|0.05,接受H0。也即某山区健康成年男子与一般健康成年男子脉搏的平均次数相等。,已知豌豆籽粒质量符合正态分布N(377.2,3.32),在改善栽培条件后,随机抽取9粒,其籽粒的平均质量为379.2mg,问改善栽培条件是否能够增加豌豆籽粒的质量?,2. 大

18、样本单总体均值的检验总体方差未知,来自总体的样本为(x1,x2, ,xn),对于假设:H0: ,在H0成立的前提下,有检验统计量,例 生产某种纺织品,要求棉花纤维长度平均为30mm以上,现有一棉花品种,以n=400进行抽查,测得其纤维平均长度为30.2mm,标准差为2.5mm。问该棉花品种的纤维长度是否符合纺织品生产?,解:由题意已知 mm, mm, mm,总体方差未知,,但由于 属于大样本,故采用u检验。又由于棉花纤维只有大于30mm才符合纺织品生产的要求,故用单尾检验。,1. 无效假设: 即该棉花品种达不到纺织品生产要求。 备择假设: 2. 选取显著水平=0.05 3. 选择合适的统计量进行

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论