z-CH9多阶段抽样-第1、2节.ppt_第1页
z-CH9多阶段抽样-第1、2节.ppt_第2页
z-CH9多阶段抽样-第1、2节.ppt_第3页
z-CH9多阶段抽样-第1、2节.ppt_第4页
z-CH9多阶段抽样-第1、2节.ppt_第5页
已阅读5页,还剩42页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2019/7/14,统计学专业必修课3学分,1,CH9 多阶段抽样,MS:Multi-stage Sampling (4-5课时),2019/7/14,统计学专业必修课3学分,2,MS,MS在抽选样本单元时不是一次直接从总体中抽取总体基本单元BU,而是分两个或两个以上的阶段来抽样 比如,城市住户调查中 全国范围内调查市县住户(2S) 全国范围内调查市县街道办事处居委会住户(MS),一阶/初级单元 Primary unit,基本单元 Base unit,二阶单元 三阶单元等 Secondary unit,2019/7/14,统计学专业必修课3学分,3,MS方法的意义,实践中,大规模的抽样调查项目往往都采用MS MS由CL发展而来(CL是单阶段抽样向多阶段抽样的过渡) MS可以看作对样本群内的单元实施再抽样的一种方法 与CL类似: 当某阶单元大小(群规模)相等时,则该阶的抽样采用等概抽样 但是,实践中,大多数情况单元大小不等,此时,可以: 等概抽样,加权估计 不等概抽样,HH估计 构造自加权样本,达到简化估计量及其方差形式的目的,此时估计精度也很不错,2019/7/14,统计学专业必修课3学分,4,MS中自加权样本的构造模式,第1阶,第2阶,第n阶,各阶单元大小相等,等概抽样,各阶单元大小不等,PPS抽样,等概抽样,自加权样本,各阶样本量相等,前几阶采用PPS抽样,最后一阶(针对BU)采用等概率抽样,并且,从第二阶开始,各阶单元的下层样本量都相同,2019/7/14,统计学专业必修课3学分,5,CH9内容体系,9.1 抽样方式 介绍MS的基本概念、优点及抽样推断原理 9.2 PU大小相等的2S抽样 均值和比例估计量及其性质 两个阶段都实施等概抽样srs 9.3 PU大小不等的2S抽样 均值估计量及其性质 等概抽样,加权估计 不等概抽样,HH估计 自加权样本的构造 9.4 进一步讨论的问题 2S条件下样本容量的确定和最优配置 三阶段抽样估计,尤其是如何构造自加权样本,2019/7/14,统计学专业必修课3学分,6,9.1 抽样方式,MS抽样的基本概念 MS抽样的优点 MS抽样估计推断原理,2019/7/14,统计学专业必修课3学分,7,一、MS的基本概念,MS在抽选样本单元时并不是一次直接从总体中抽取BU,而是分两个或两个以上的阶段来进行 比如,城市住户调查中 全国范围内调查市县住户(2S) 全国范围内调查市县街道办事处居委会住户(MS),一阶单元 Primary unit,基本单元 Base unit,二阶单元 三阶单元等 Secondary unit,阶段的多少视具体情况确定,2019/7/14,统计学专业必修课3学分,8,二、MS的优点,MS来自于对CL的校正,所以MS具备CL的优点,同时也避免了CL的缺点(?) CL的优点:样本比较集中,便于组织抽样和调查、节约费用等;对于特殊结构的总体,CL往往效果好 CL的缺陷:由于群内单元的相似性,CL的误差通常较大;另外,若群规模较大,群内实施全面调查难以体现抽样调查的优势 MS的优点: 保持了CL样本比较集中,便于调查、节约费用等优点,同时又避免了对小单元过多调查造成的浪费,从而充分发挥抽样调查的优点 MS不需要编制所有BU的抽样框,从而可以简化抽样框的编制工作,2019/7/14,统计学专业必修课3学分,9,MS的优点 (P189),1、简化抽样框的编制工作,便于组织抽样 对范围较大、分布较广、单元数多的目标总体,实施MS,按现有的行政区划(或地理区域)划分各阶段抽样单元,从而简化抽样框的编制工作,便于样本单元的抽取 2、可以使抽样方式更加灵活和多样 MS中,各阶段可根据具体情况分别设计和采用不同的抽样组织方式(MS经常与st、cl、sy、PPS等相结合),从而充分发挥各种抽样方式的优势 同时,各阶段也可以自行采用不同的估计方法,2019/7/14,统计学专业必修课3学分,10,MS的优点(续),3、能够提高估计精度 与CL相比,相同的n,MS的样本在总体中的分布更广,因而也更具代表性 同时,MS可以通过对方差较大的阶段设定高一点的抽样比,来进一步提高样本的代表性,从而提高抽样估计精度 4、可以提高抽样的经济效益 与CL相比,MS虽然看起来抽样过程更为复杂,但实际上操作起来非常简便(可操作性强),组织管理和实测调查的工作量也不大,因此MS的费用将更节省,经济效益更高 5、可以为各级机构提供相应的信息 MS可以满足各阶段(不同层次)的需要,这与st有些类似 比如,中国城镇居民住户调查,2019/7/14,统计学专业必修课3学分,11,三、MS抽样推断原理(延展性内容),从理论上分析MS条件下估计量的期望和方差的基本公式 本章各种形式的估计量的无偏性的证明和方差形式的推导都是依据的这个原理 1、2S (P191-194),其中 E2、V2固定PU时对第二阶抽样求均值和方差 E1、V1对第一阶抽样求均值和方差,2019/7/14,统计学专业必修课3学分,12,两个阶段抽取的所有可能样本估计量的期望,对某一固定的第一阶段样本中,所有可能抽出的二阶样本的估计量的期望,所有可能抽出的第一阶样本的估计量的期望,2019/7/14,统计学专业必修课3学分,13,举例说明,总体包含3个PU,每个PU包含2个BU 现:第一阶段srs抽取2个PU,第二阶段从每个抽中的PU中srs抽取1个BU 比如,总体分3个学习小组,每个学习小组包括2名同学。现在先srs抽2个学习小组,再从抽中的学习小组中抽1名同学,进行某项成绩测试 所有可能的样本共 C32C21C21=12个 求这12个样本的估计量的数学期望,可能的抽样结果,PU A B C,BU (a,b) (c,d) (e,f),2个,1个,PU (A,B) (B,C) (A,C),(a,c) (a,d) (b,c) (b,d),BU,(c,e) (c,f) (d,e) (d,f),(a,e) (a,f) (b,e) (b,f),总体,2019/7/14,统计学专业必修课3学分,15,定性理解:两个阶段的随机抽样均可能带来抽样误差 2S的方差由两部分构成:一部分是第一阶段的方差V1;另一部分是第二阶段方差的均值,2019/7/14,统计学专业必修课3学分,16,说明,这不仅是2S抽样的估计推断原理,而是所有两步抽样的估计推断原理,比如,二重抽样、再抽样等方法都遵循这一原理,2019/7/14,统计学专业必修课3学分,17,2、MS,以上关于2S的估计推断原理可以推广至MS 比如,3S,2019/7/14,统计学专业必修课3学分,18,9.1的重点,掌握: MS的基本概念 MS的优点 理解: 2S与st和CL的关系 2S的估计推断原理的理解,2019/7/14,统计学专业必修课3学分,19,2S与CL和st的关系(开拓思路),共同特点:都是首先将总体分为若干的群(或初级单位) 区别 抽样方式不同 抽样误差的来源不同,2019/7/14,统计学专业必修课3学分,20,2S与CL和st的关系(续),2S来源于对CL的校正 在CL中,如果抽中群所含的次级单元数很多,此时对群内所有单元一一进行调查难度较大;尤其当群内单元标志值差别不大时,没必要这样做。这时,从中选群包含的BU中抽部分进行调查,就形成了2S CL是一种特殊的2S,第一阶段抽部分PU,第二阶段是100%抽样,其误差来源于第一阶段:群间方差 st是一种特殊的2S,第一阶段100%抽PU(层),第二阶段抽层内的部分单元,其误差来源于第二阶段:层内方差 MS是st和CL的结合物,两个阶段都是抽取部分单元,都会产生误差,2019/7/14,统计学专业必修课3学分,21,三种抽样方法的比较,9.1结束,2019/7/14,统计学专业必修课3学分,22,9.2 PU大小相等的二阶段抽样,一、符号说明 二、均值估计量及其性质 三、比例估计量及其性质,2019/7/14,统计学专业必修课3学分,23,意义,PU大小相等指的是:总体中所有的PU中包含的二级单元数(BU数)都相等 PU大小严格相等的情况实践中很少见,但是对它的讨论是MS的基础,同时也具有现实意义,主要体现在: 1、有时,PU规模差异不明显,可近似为PU大小相等 2、有时,对于PU大小不等的情况,可通过分层,将大小近似的PU分到一层,则层内的2S就可以按PU大小相等的情况讨论 所以,本节的讨论很有理论和实践意义,2019/7/14,统计学专业必修课3学分,24,讨论的前提,A个PU,srs,a个PU,M个BU,M个BU,M个BU,srs,m个BU,m个BU,m个BU,每个PU相互独立地抽取等容量的BU数,总体单元数=AM,样本单元数=am,2019/7/14,统计学专业必修课3学分,25,一、符号说明,两个抽样比 两个层次的均值 两个方差,基本符号 (Yij,i=1,2,A; j=1,2,M) (yij ,i=1,2,a; j=1,2,m),2019/7/14,统计学专业必修课3学分,27,二、均值估计量及其性质,2019/7/14,统计学专业必修课3学分,28,均值估计量及其性质的基本结论,是无偏估计,第一阶抽样误差,是误差的主要组成部分,am一定时,提高a而减少m会有效提高估计的精度,2019/7/14,统计学专业必修课3学分,29,无偏性的证明,对称性论证法,2019/7/14,统计学专业必修课3学分,30,方差形式的证明(P192 9.4-9.10),看作一个变量,2019/7/14,统计学专业必修课3学分,31,方差形式的证明,对称性论证法,各PU独立抽取,2019/7/14,统计学专业必修课3学分,32,方差的无偏估计的证明 (P193 9.11-9.18),两个关键的结论:,2019/7/14,统计学专业必修课3学分,33,例9.1说明 (P194,典型例题),根据题意判断其抽样方法PU大小相等的2S 解题的基本思路:区间估计的三要素 总体总值的估计,2019/7/14,统计学专业必修课3学分,34,注意,1、方差估计式中,第一项是主要的,第二项要小很多,这是因为第二项的分母是第一项的m倍,而且分子上还要乘以小于1的f1。 所以,在am一定时,提高a而减少m会有效地提高估计的精度 2、如果第一阶的抽样比f1可以忽略,则可以简化方差的估计式,2019/7/14,统计学专业必修课3学分,35,这个结果在实践中可作为参考,因为第二阶抽样采用Sy或其他复杂抽样方法时,很难得到S22的无偏估计,如果f1可以忽略,只需要PU的样本均值就可得到方差的近似估计 但从另一方面说,f1可忽略,意味着总体中PU数A很大,而抽选出的a却很小(am一定的情况下相当于m比较大),结果是样本分布相对集中,势必增大抽样误差(类似于CL) 这是一对矛盾,应权衡处理,2019/7/14,统计学专业必修课3学分,36,补例,研究目的:某省有100个县,每县有200个村,现欲通过两阶段抽样估计粮食平均亩产 抽样方法及样本结果:第一阶段抽取4个县(A,B,C,D)。第二阶段从每县中抽取5个村(1,2,3,4,5),一共是20个样本村,通过调查取得粮食平均亩产资料如下表,2019/7/14,统计学专业必修课3学分,37,表 20个村平均粮食亩产资料 单位:斤,要求:用样本资料推断全省粮食平均亩产及其置信区间 (置信度为95%)。,2019/7/14,统计学专业必修课3学分,38,三、总体比例的2S估计量及其性质,掌握的关键: 比例P与均值的对应关系,尤其是字母符号的对应关系,2019/7/14,统计学专业必修课3学分,39,比例估计和均值估计之间字母符号的对应关系,设,Ti总体第i个PU中具有某特征的BU数,ti样本第i个PU中具有某特征的BU数,Pi总体第i个PU的比例,pi样本第i个PU的比例,2019/7/14,统计学专业必修课3学分,40,很重要的一个关系,2019/7/14,统计学专业必修课3学分,41,比例估计量及其无偏性 (P196 9.21),是无偏估计,也是无偏估计,2019/7/14,统计学专业必修课3学分,42,比例估计量的方差(P196 9.22-9.24),2019/7/14,统计学专业必修课3学分,43,方差的无偏估计 (P196 9.25),Aa,Mm,P p,Qq,第二项再乘以f1,2019/7/14,统计学专业必修课3学分,44,P196例9.2说明 (典型例题),2019/7/14,统计学专业必修课3学分,45,补例,研究目的: 某林场有160块地,每块地有9棵树,现发现了某

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论