区间估计与假设检验.ppt_第1页
区间估计与假设检验.ppt_第2页
区间估计与假设检验.ppt_第3页
区间估计与假设检验.ppt_第4页
区间估计与假设检验.ppt_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

一、使用INSIGHT模块 二、使用“分析家” 三、使用TTEST过程,3.2总体均值的区间估计与假设检验的SAS实现,二、使用“分析家” 1. 总体均值的置信区间 【例3-4】在“分析家”中求【例3-1】中每箱药材平均重量在95%置信水平下的置信区间。,步骤如下: 1) 在“分析家”模块中打开数据集Mylib.yczl; 2) 选择菜单“Statistics”“Hypothesis Tests” “One Sample t test for a Mean(单样本均值t - 检验)”;,3) 在打开的“One Sample t test for a Mean”对话框中设置均值的置信区间。 结果表明,药材的平均重量以95%的概率位于50.08千克至52.92千克之间。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,2. 单样本总体均值的假设检验 【例3-5】使用“分析家”检验【例3-2】中食品重量是否符合要求。 检验变量WEIGHT: H0: = 100, H1: 100 由于方差未知,所以使用 t 检验法。 步骤如下: 1) 在“分析家”中打开数据集Mylib.spzl; 2) 选择菜单“Statistics”“Hypothesis Tests” “One Sample t test for a Mean”, 打开“One Sample t test for a Mean”对话框;,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,4)按图所示设置均值检验,单击“OK”按钮.,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,显示结果表明 t 统计量的 p 值为 0.0105 0.05, 所以拒绝原假设,即认为总体的均值不等于100。,3. 两样本总体均值的比较:成对匹配样本 【例3-6】使用“分析家”对例3-3中两套试卷检验有无显著差异。 1和2分别表示两套试卷的平均成绩, 检验: H0:1 2 = 0, H1:1 2 0; 分析步骤如下: 1) 在“分析家”中打开数据集Mylib.sjdf; 2) 选择菜单“Statistics”“Hypothesis Tests” “Two Sample Paired t - Test for a Mean(均值的成对双样本t - 检验)”;,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,3) 在打开的对话框中,按图左所示设置双样本均值检验,单击“OK” , t 统计量的 p 值 = 0.0005 0.05, 所以拒绝原假设,两总体的均值有显著差异。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,4. 两样本总体均值的比较:独立样本 【例3-7】为估计两种方法组装产品所需时间的差异,分别对两种不同的组装方法各随机安排一些个工人进行操作试验,每个工人组装一件产品所需的时间如下表所示。试以95%的置信水平推断两种方法组装产品所需平均时间有无差异。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,两种方法组装产品所需的时间(单位:分钟),这是一个(独立)两样本均值检验问题, 1,2分别为两种方法组装一件产品所需平均时间, 则检验:H0:1 2 = 0,H1:1 2 0;,两种方法组装产品所需的时间(单位:分钟),试以95%的置信水平推断两种方法组装产品所需 平均时间有无差异。,将数据存放在数据集Mylib.zzcpsj中,将两个样本观测值记在同一分析变量F下, 不同的样本用一个分类变量 g 加以区分。 分析步骤如下: 1) 在“分析家”中打开数据集Mylib.zzcpsj; 2) 选择菜单“Statistics” “Hypothesis Tests” “Two Sample t - Test for Mean(两样本均值的t - 检验)”;,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,3) 在打开的对话框中,按图所示设置双样本均值检验,单击“OK” 由于 t 统计量的 p 值 0.05, 所以在95%的置信水平下,拒绝原假设, 即两种方法所需时间有差异。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,三、使用TTEST过程 单样本均值的t检验、配对数据的 t 检验、 双样本均值比较的t检验。 1. 语法格式 PROC TTEST ; CLASS ; VAR ; PAIED ; BY ; RUN; 其中,PROC TTEST和RUN语句是必须的, 其余语句都是可选的,而且可调换顺序。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,CLASS语句指定的分组变量用来进行组间比较; BY语句指定的分组变量将数据分为若干更小样本,以便分别在各小样本内进行各自独立的处理。 VAR语句引导要检验的所有变量列表, 对引导的所有变量分别进行组间均值比较的 t 检验。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,PAIED语句指定配对 t 检验中进行比较的变量对,所带变量名列表一般形式及产生的效果见下表。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,PROC TTEST后选项及其表示的含义如表所示。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,2. 总体均值的置信区间 【例3-8】考虑【例3-3】中的样本数据。假定其中数据使用如下数据步存放在数据集sjcj中,两套试卷得分的变量名分别为A和B。 data sjcj; input A B; cards; 78 71 63 44 72 61 89 84 91 74 49 51 68 55 76 60 85 77 55 39 ; run;,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,使用最简代码求均值、标准差的置信区间: proc ttest data = sjcj; run; 结果给出两个变量在95%置信水平下的均值、标准差的置信区间,以及对原假设0 = 0的 t 检验的p值。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,3. 单样本总体均值的假设检验 在例3-8中增加原假设选项以及置信水平,如下: proc ttest h0=70 alpha = 0.01 data=sjcj; var A; run;,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,结果显示t统计量的p值 = 0.5734,不能拒绝(57.34%的把握)原假设:均值 = 70。,4. 配对两样本均值的假设检验 在例3-8中检验两套试卷有无显著差异, proc ttest data=sjcj; paired A*B; run; 结果显示t统计量的p值 = 0.0005 0.05,因此拒绝原假设。说明两套试卷有显著差异。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,5. 独立两样本均值的假设检验 格式为: PROC TTEST DATA = ; CLASS ; VAR ; RUN; 注意:要求将两个样本中被比较均值的变量的观测值记在同一分析变量下, 不同的样本用另一个分类变量的不同值加以区分,而且分类变量只能取两个值,否则将报错。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,【例3-9】考虑例3-7中的样本数据。假定其中数据使用如下数据步存放在数据集zzcpsj中: data zzcpsj; input f g$; cards; 28.3 1 27.6 2 30.1 1 22.2 2 29 1 31 2 37.6 1 33.8 2 32.1 1 20 2 28.8 1 30.2 2 36 1 31.7 2 37.2 1 26 2 38.5 1 32 2 34.4 1 31.2 2 28 1 30 1 ; run;,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,将两批工人的测量结果看作两个样本,其数据都放在一个数据集之中同一分析变量 f 之下, 而两种方法的差别是由分类变量g 的值加以区分。 检验代码如下: proc ttest data=zzcpsj; class g; var f; run;,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,在检验中,先看其最后关于方差等式的检验结果,检验方差相等用F 统计量,其数值为1.29, 相应的p值 = 0.67790.05 = , 所以不能拒绝方差相等的假设。 在方差相等的前提下,检验均值差异用Pooled方法,统计量的 t 值为2.16,p值为0.04330.05 = , 所以两种方法所需的时间是有显著差异的。 在异方差的情况下,使用Satterthwaite法检验均值的差异。,第三章 3.2 总体均值的区间估计与假设检验的SAS实现,一、总体比例的置信区间 二、单样本总体比例的假设检验 三、两总体比例的比较,3.3 总体比例的区间估计与假设检验的SAS实现,一、总体比例的置信区间 【例3-10】 2004年底北京市私家车拥有量已达到129.8万辆,位居全国之首,据业内人士分析其中国产中低档汽车的比例较大,为了估计目前北京市场个人购车的平均价格,调查人员于某日在北京最大的车市随机抽取36位私人消费购车者,得到他们所购汽车的价格。 年底购车价格(单位:万元) 根据以上调查数据,试以95的置信水平推断该地区购买私家车在15万元以上的消费者占有的比例。,第三章 3.3 总体比例的区间估计与假设检验的SAS实现,设购车价格数据存放在数据集Mylib.gcjg中,价格变量名为price。 这是一个单样本比例的区间估计问题。 由于在SAS中只能对两水平的分类变量作比例的区间估计与检验,所以首先要按变量price生成一个新的分类变量price _f 步骤如下: 1) 在“分析家”中打开数据集Mylib.gcjg; 2) 选择主菜单“Edit”“Mode”“Edit”,使数据集可以被编辑(修改);,第三章 3.3 总体比例的区间估计与假设检验的SAS实现,3) 选择主菜单“Data”“Transform”“Recode Ranges(重编码范围)”, 打开对话框,设置有关内容; 4) 单击“OK”按钮,打开“Recode Ranges”对话框,按图所示生成新变量price_f;,第三章 3.3 总体比例的区间估计与假设检验的SAS实现,6) 选择菜单“Statistics”“Hypothesis Tests” “One Sample Test for a Proportion(单样本比例检验)”; 7) 在打开的“One Sample Test for a Proportion”对话框中,按图设置比例的置信区间。,第三章 3.3 总体比例的区间估计与假设检验的SAS实现,置信区间: ( 0.109,0.391 ) 即可以95%的概率估计该地区所购买车辆在15万元以上所占比例在10.9%39.1%之间。,第三章 3.3 总体比例的区间估计与假设检验的SAS实现,二、单样本总体比例的假设检验 【例3-11】考虑例3-10中的数据,试检验总体中购买车辆在15万元以上者所占比例是否超过30%。 这是一个单样本比例检验问题, 若表示总体中购买车辆在15万元以上者所占比例, 则检验: H0: 0.3, H1: 0.3;,第三章 3.3 总体比例的区间估计与假设检验的SAS实现,步骤如下: 1) 选择菜单“Statistics”“Hypothesis Tests” “One Sample Test for a Proportion”,,第三章 3.3 总体比例的区间估计与假设检验的SAS实现,样本中购买车辆在15万元以上者比例=9/36=25%,Z统计量的p值=0.2563 0.05,不能拒绝原假设。 结果表明:在95%的置信水平下,购买车辆在15万元以上者所占比例超过30%。,第三章 3.3 总体比例的区间估计与假设检验的SAS实现,三、两总体比例的比较 【例3-12】2004年底很多类型的国产轿车价格都比年中有所下降,为了对比2004年底与年中私家购车族购车价格的差异,在年中新购车者中随机抽取32人。 年中购车价格(单位:万元): 综合【例3-10】与上表的调查数据,试以95的置信水平推断该地区年底与年中购买私家车在15万元以上的消费者占有比例有无差异。,第三章 3.3 总体比例的区间估计与假设检验的SAS实现,这是一个双样本比例检验问题, 1 年底购买私家车在15万元以上所占的比例, 2 年中购买私家车在15万元以上所占的比例, 检验假设: H0:1 2 = 0,H1:1 2 0;,建立数据集Mylib.gcjgQ, 价格变量名为price, 变量period区别年中数据(2)与年底数据(1)。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论