概率统计王松桂.ppt_第1页
概率统计王松桂.ppt_第2页
概率统计王松桂.ppt_第3页
概率统计王松桂.ppt_第4页
概率统计王松桂.ppt_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

概率论与数理统计 第二十讲 主讲教师:程维虎教授 北京工业大学应用数理学院 第八章 假设检验 8.1 基本概念 下面,我们讨论不同于参数估计问题的 另一类统计推断问题根据样本提供的信 息,检验总体的某个假设是否成立的问题。 这类问题称为假设检验。 假设检验 参数检验 非参数检验 总体分布已知情 形下,检验未知 参数的某个假设 总体分布未知情形 下的假设检验问题 先看一个例子。 例1:某工厂生产 10 欧姆的电阻,根据以往生 产的电阻实际情况,可以认为: 电阻值 X服从 正态分布 N(, 0.12)。现在随机抽取10个电阻, 测得它们的电阻值为: 9.9, 10.1, 10.2, 9.7, 9.9, 9.9, 10.0, 10.5, 10.1, 10.2. 问: 从样本看,能否认为该厂生产的电阻的平 均值 = 10 欧姆? 确定总体:记 X 为该厂生产电阻的测值,则 X N(, 0.12); 明确任务:通过样本推断 “X 的均值 是否 等于10欧姆”; 假设:上面的任务是要通过样本检验“X 的 均值 =10”这一假设是否成立。 I. 如何建立检验模型 原假设的对立面是 “ X 的均值 10” ,称为 “对立假设” 或 “备择假设”,记成 “ H1: 10”。把原假设和对立假设合写在一起 ,就是: H0: =10; H1: 10. 在数理统计中,把 “ X 的均值 =10” 这样 一个待检验的假设记为 “原假设” 或 “零假设”, 记成 “ H0: =10”。 II. 解决问题的思路 因样本均值是 的一个很好的估计。所 以,当 =10,即原假设 H0 成立时, 应比较小; 如果该值过大, 想必 H0 不成立 。 于是,我们就用 的大小检验 H0 是否 成立。 合理的做法应该是:找出一个界限 c, 这里的问题是:如何确定常数 c 呢? 细致地分析: 根据定理 6.4.1,有 于是,当原假设 H0:=10 成立时,有 为确定常数 c,我们考虑一个很小的正数, 如 = 0.05。当原假设 H0: =10 成立时,有 于是,我们就得到如下检验准则: 为原假设 H0 的拒绝域。 用以上检验准则处理我们的问题, 所以,接受原假设 H0:=10。 因为,当原假设是 H0: =10 成立时, 所以,当 很小时,若 H0 为真(正确), 则检 验统计量落入拒绝域是一小概率事件 (概率很 小,为 )。前面我们曾提到:“通常认为小 概率事件在一次试验中基本上不会发生”。 III. 方法原理 那么,如果小概率事件发生了,即: 发生, 就拒绝接受 H0 成立,即认为 H0不成立 。 IV. 两类错误与显著性水平 当我们检验一个假设 H0 时,有可能犯以 下两类错误之一:H0 是正确的,但被我们拒 绝了,这就犯了“弃真”的错误,即抛弃了正 确假设;H0 是不正确的,但被我们接受了, 这就犯了“取伪”的错误,即采用了伪假设。 因为检验统计量总是随机的,所以,我 们总是以一定的概率犯以上两类错误。 通常用 和 记犯第一、第二类错误的概 率,即 在检验问题中,犯“弃真”和“取伪”两类 错误都总是不可避免的,并且减少犯第一类 错误的概率,就会增大犯第二类错误的概率 ;反之亦然。 所以,犯两类错误的概率不能同 时得到控制。 在统计学中,通常控制犯第一类错误的 概概率。一般事先选定一个数 (00 而现在要处理的对立假设为 H1: 0, 称为 右边对立假设。 类似地,H0: =0; H1: 0 在2未知情况下,当原假设 成立时, 例 2:某厂生产一种工业用绳,其质量指标是 绳子所承受的最大拉力,假定该指标服从正 态分布,且该厂原来生产的绳子指标均值 0 =15公斤,采用一种新原材料后,厂方称这种 原材料提高了绳子的质量,也就是说绳子所 承受的最大拉力 比15公斤增大了。 为检验该厂的结论是否真实,从其新产 品中随机抽取50件,测得它们所承受的最大 拉力的平均值为15.8公斤,样本标准差S=0.5 公斤。取显著性水平 =0.01。问从这些样本 看:能否接受厂方的结论。 解:问题归结为检验如下假设 H0: =15; H1: 15 (2未知) 于是, 从而,拒绝原假设,即认为新的原材料确实 提高了绳子所能承受的最大拉力。 8.2.2 两个正态总体 N(1, 12) 和 N(2, 22) 均值的比较 在应用上,经常会遇到两个正态总体均 值的比较问题。 例如:比较甲、乙两厂生产的某种产品 的质量。将两厂生产的产品的质量指标分别 看成正态总体 N(1, 12) 和 N(2, 22)。比较它 们的产品质量指标的问题,就变为比较这两 个正态总体的均值 1和 2的的问题。 又如:考察一项新技术对提高产品质量是 否有效。将新技术实施前后生产的产品质量指 标分别看成正态总体 N(1, 12)和 N(2, 22)。这 时,所考察的问题就归结为检验这两个正态总 体的均值 1和 2是否相等的问题。 设X1, X2, , Xm与Y1, Y2, , Yn 分别为抽 自正态总体 N(1, 12)和 N(2, 22)的样本,记 考查如下检验假设: 1. H0: 1= 2 ; H1: 12 当 12 和 22 已知时,根据定理7.5.1,有 当 H0: 1 = 2为真时, 故,拒绝域为 在12=22 =2,2未知情况下,根据定 理7.5.1,有 当 H0: 1=2 为真时,有 拒绝域为 从而 上面,我们假定 12=22。当然,这是个 不得已而强加上去的条件,因为如果不加此 条件,就无法使用简单易行的 t 检验。 在实用中,只要我们有理由认为12和22 相差不是太大,往往就可使用上述方法。通 常是:如果方差比检验未被拒绝(见下节), 就 认为12和22相差不是太大。 J 说明 例3:假设有A和B两种药,欲比较它们在服用 2小时后在血液中的含量是否一样。对药品A, 随机抽取8个病人服药,服药2小时后,测得8 个病人血液中药物浓度(用适当的单位)分别为: 1.23, 1.42, 1.41, 1.62, 1.55, 1.51, 1.60, 1.76. 对药品B,随机抽取6个病人服药,服药2小时 后,测得血液中药的浓度分别为: 1.76, 1.41, 1.87, 1.49, 1.67, 1.81. 假定这两组观测值抽自具有共同方差的两个正 态总体,在显著性水=0.10下,检验病人血液 中这两种药的浓度是否有显著不同? 故,接受原假设。即, 认为病人血液中这两 种药浓度无显著差异。 解:问题就是从总体 N(1, 2)和N(2, 2)中分 别抽取样本X1, X2, X8 和Y1, Y2, Y6,样本 均值和样本方差分别为: 与1.的分析完全类似,可以得到: 2. 单边检验 H0: 12; H1: 1 0 方差2未知情况下的检验。 上述三种检验的拒绝域分别为: 例4:为了检验A, B两种测定铁矿石含铁量的 方法是否有明显差异, 现用这两种方法测定了 取自12个不同铁矿的矿石标本的含铁量(%), 结果列于表 8.2.1中。取=0.05, 问这两种测定 方法是否有显著差异? 解: 将方法A和方法B的测定值分别记为 X1, X2, X12 和 Y1, Y2, Y12 . 因这12个标本来自不同铁矿,所以, X1, X2, X12 不能看成来自同一个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论