卫生统计学专题六:总体均数与总体率的估计.doc_第1页
卫生统计学专题六:总体均数与总体率的估计.doc_第2页
卫生统计学专题六:总体均数与总体率的估计.doc_第3页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

专题六 总体均数与总体率的估计样本均数(或样本率)不能直接作为总体均数(或总体率)的估计,而应该考虑抽样误差的存在,借助抽样分布对总体均数(或总体率)做出估计。一、均数的抽样误差由个体变异产生的,随机抽样引起的样本统计量与总体参数之间的差异称为抽样误差。在抽样研究中,抽样误差是不可避免的。二、样本均数的分布及标准误样本均数的分布:服从正态分布,样本均数大部分分布在总体均数的左右,中间多,两边少,左右基本对称。标准误样本均数的变异程度用样本均数的标准差来描述,样本均数的标准差称为均数的标准误,简称为标准误,符号。说明个样本均数围绕总体均数的离散程度,可用来反映样本均数的抽样误差的大小。在抽样研究中,总体标准差常常未知,一般用样本标准差作为总体标准差的估计值。理论公式: 实际公式:注:越大,样本均数分布越分散,样本均数与总体均数的差别越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。越小,样本均数分布越集中,样本均数与总体均数的差别越小,抽样误差越小,由样本均数估计总体均数的可靠性越大。 标准差与标准误的区别:标准差表示个体差异的大小;标准误描述样本均数的变异程度,说明抽样误差的大小。标准差描述资料的频数分布状况,可用于制定医学参考值范围;而标准误用于总体均数的区间估计和假设检验。以样本含量n从正态总体n(,)或偏态总体随机抽样,样本均数仍服从或者近似正态分布n(,)。标准误的大小与标准差成正比,与样本含量n的平方根成反比。在实际工作中,可通过适当增加样本含量来减小抽样误差。三、t分布 根据数理统计和中心极限定理:从均数为,标准差为的正态总体中,随机抽取例数为n的样本,样本均数均服从均数为,标准差为的正态分布;即使从均数为,标准差为的偏态总体中随机抽样,当样本含量足够大时,样本均数的分布逐渐逼近于均数为,标准差为的正态分布。已知样本均数服从正态分布,对正态变量实施z变换,使得正态分布n(,)变换为标准正态分布n(0,1)。实际工作中,总体标准差常常未知,一般用样本标准差作为总体标准差的估计值,此时对样本均数进行的不再是z变换而是t变换。理论证明该统计量服从自由度为n-1的t分布。t= =n-1t分布曲线与分布的特征如右图,t分布的特征有:单峰分布,在t=0处最高,且以0为中心左右对称。不同自由度对应不同的t分布,t分布曲线是一簇曲线。越小,t值越分散,曲线越平阔,尾部越高;随着增大, t值越集中,曲线越尖峭,尾部越低。趋于时,t分布逼近标准正态分布(z分布)。【说明】t分布的极限分布为z分布。t分布不是一条曲线,是一簇曲线,不同曲线下面积的分布是不同的,相同面积可对应不同t界值,相同t界值可对应不同面积。 t分布中,无论自由度为多少时,t分布曲线下的面积都为1。t界值表统计学家将t分布曲线下的尾部面积(即概率p)与横轴t值间的关系编制了不同自由度下的t界值表(参见教材附表4)。 t界值表:横标目为自由度,纵标目为概率p。 t界值:表中数字表示当和p 确定时,单侧或双侧尾部面积p对应的t界值。 若p等于某预指定的,则: 单侧尾端概率 (one-tailed probability)的t界值,即单侧尾部面积p对应的t界值用t,表示。 双侧尾端概率 (two-tailed probability)的t界值,即两侧尾部面积p对应的t界值用t/2,表示。t分布规律 单侧:p(t-t,)=或p(tt,)=。 双侧:p(t-t/2,)p(tt/2,)=,则图中非阴影部分面积的概率为p(-t/2,tt/2,)=1-从t界值表可以看出:自由度相同时,t界值越大其对应的p值越小,反之亦然。概率p(或尾部面积)相等时,越大,t界值越小。t界值相等时,双侧概率为单侧概率的两倍。=时,t界值即为z界值。例如,t0.05/2,=z0.05/2=1.96四、总体均数的估计统计推断的内容:参数估计(包括点估计与区间估计)和假设检验。参数估计:指用样本指标(统计量)估计总体指标(参数)。点估计方法:将样本统计量直接作为总体参数的估计值。缺点:未考虑抽样误差的影响,估计的正确程度很难评价。区间估计方法:按事先给定的概率(1-),估计包含未知总体参数的一个可能范围,该范围称为参数的可信区间或置信区间(ci)。 (1-):可信度或置信度,也可表示为100(1-)%,常取95% 可信区间通常由两个可信限或置信限表示,较小者称为下限(l),较大者称为上限(u)。总体均数可信区间的计算z分布法已知时,则z=服从标准正态分布n(0,1),此时p(-z/2zz/2)=1-,代入z通过推导可得:总体均数双侧可信区间为:(,)或简写为 单侧可信区间为: 或未知时,但n足够大(n50)时,接近,t分布逼近z分布,则总体均数双侧可信区间为:(,)或简写为 单侧可信区间为: 或t分布法未知时,t=服从自由度为n-1的t分布,此时p(-t/2,tt/2,)=1-,代入t通过推导可得:总体均数双侧可信区间为:(,)或简写为 单侧可信区间为: 或【说明】当未知时,无论n是否足够大,可信区间均可采用t分布法计算,采用t界值计算的可信区间更加确切。总体均数的95%可信区间的含义 在实际研究中,一次抽样可得一个可信区间,有95%可能包括总体均数。总体均数的95%可信区间既可信又精密。五、二项分布对于n次独立的试验,如果每次试验结果出现且只出现对立事件a与之一,在每次试验中出现a的概率是常数(01),因而出现对立事件的概率是1-,则称这一串重复的独立试验为n重贝努力试验,简称bernolli试验。bernolli试验条件:每次试验只有两种互斥的结果;在相同条件下独立重复n次试验,所谓“独立”即各次实验结果互不影响;每次试验中a发生的概率都相同,各次试验条件相同。二项分布的概念一般地,在一个n重贝努力试验中,令x表示时间a发生的次数,则随机变量x所有可能的取值为0,1,2, ,n,且其概率函数为p(x=k)= k=0,1,2, ,n 称随机变量x服从参数为n和的二项分布,记为xb(n,)。二项分布的概率 二项分布是一种离散型概率分布。二项分布的概率之和等于1,即=+(1-)n=1单侧累积概率: 至多m例阳性:p(xm) 至少m例阳性:p(xm)=1-p(xm-1)二项分布的均数与标准差设xb(n,),则有阳性结果发生数x的总体均数=n;总体方差 总体标准差根据中心极限定理,在n较大,n与n(1-)较接近时,二项分布接近于正态分布;当n时,二项分布b(n,)的极限分布是总体均数位n,总体方差为n(1-)的正态分布nn,n(1-)。六、poisson分布poisson分布的概念若随机变量x的可能取值为0,1,2,其概率分布为p(x=k)= ,k=0,1,2,;则称x服从参数为的poisson分布,记为x()。k为观察单位中某稀有时间发生的次数;0,为某一常数;e=2.7182是自然对数的底数。poisson分布的应用泊松分布是一种重要的离散型概率分布,用于描述在单位时间或空间内随机事件发生的次数。特点:罕见事件(发生概率很小)而观察例数n很大的二项分布,可将较难计算的二项分布转换为泊松分布去处理。为泊松分布所依赖的唯一参数,表示单位时间(或单位面积、单位空间)内某随机事件平均发生数,即总体均数。poisson分布的图形=n值越小,分布越不对称,随的增大,poisson分布趋于对称。注:当=20时,泊松分布接近于正态分布,在实际工作中,当20时,就可以用正态分布来近似地处理泊松分布的问题。poisson分布的特征总体均数与总体方差相等。可加性:m个互相独立的随机变量x1,x2,xm分别服从1,2,m的泊松分布,则其和x1+x2+xm也服从均数为1+2+m的泊松分布。 可加性的应用:将若干个相互独立的小观察单位合并成一个大的观察单位,从而使均数20,以便将服从泊松分布的资料按正态分布近似处理。七、总体率的估计抽样资料计算样本率不能直接代替总体率,而应该对总体率进行估计。率的抽样误差与标准误由于抽样引起的样本率与总体率的差异称为率的抽样误差。率的抽样误差亦可以用率的标准误p来度量。当总体率未知时,以样本率p作为的估计值。p=(n为样本含量) sp=总体率的估计根据样本率也可以对总体率做出点估计和区间估计。利用样本资料估计二项分布总体率的1-的可信区间,一般取0.05或0.01。对于n50,且p接近于0或1时,可直接查表法得到总体率的1-的可信区间。(附表5)注:附表5中仅列出xn/2的部分,当xn/2时,可以用n-x查表,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论