EXCEL教程绝对实用.ppt_第1页
EXCEL教程绝对实用.ppt_第2页
EXCEL教程绝对实用.ppt_第3页
EXCEL教程绝对实用.ppt_第4页
EXCEL教程绝对实用.ppt_第5页
已阅读5页,还剩71页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

EXCEL教程绝对实用,二项分布 泊松分布 超几何分布,第5章 离散型分布概率,1、区分离散型随机变量和连续型随机变量,2、确定可以用二项分布描述的统计实验并能计算,3、确定可以用泊松分布描述的统计实验并能计算,4、确定可以用超几何分布描述的统计实验并能计算,学习目标:,5.1 离散型概率分布和连续性概率分布,离散型分布变量(discrete random variable),随机变量( random variable ),连续型分布变量(continuos random variable),描述实验结果的变量,某变量所有可能值的集合含有有穷个数或可数无穷个数。(大多为非负整数),某变量是可取区间中的任何值的变量,无间隔 (时间、高度、重量、体积、含量),一旦对连续型随机变量进行了测量和记录,它就因为四舍五入变成了离散型随机变量,因此商务中所有的数据都是离散型的,研究原本是连续型随机变量的数据采用连续型分布,能“大大方方”的计算,5.2 二项分布,离散型分布中最常见的就是二项分布,它已有几百年的历史了,二项分布的假设条件是:,实验由一个包括n个相同的实验序列组成,每次实验有两种可能结果:成功和失败,每次实验之间相互独立,每次实验概率相同,成功概率p,失败概率1-p,扔硬币实验中得到反面的概率是二项分布,掷骰子实验中得到6点的概率不是二项分布,通常把研究者感兴趣的结果定义为成功,质量管理中经常定义次品为成功,合格品为失败,在放回抽样实验中(实验相互独立),每次成功的概率(如次品率0.05)相同为p保持不变:每次实验失败的概率(如合格品率0.95)为1-p保持不变,该实验数据(所有抽样得到的次品数)服从二项分布。,如果是不放回抽样实验中,若样本数量比总体数量的5%还小,则不考虑相互独立的假设,认为该实验数据服从二项分布。,5.2.1 解二项分布问题,二项分布公式:,P(X) = Cxn px q n-x,二项分布使用Excel函数 BINOMDIST (X,N,P,T/F),例题:,最近几年美国公司的海外采购越来越频繁,但海外采购也存在问题,采购杂志的调查表明,有20%的进行海外采购的公司需要咨询。假设随机抽取15家海外采购的公司。恰好有5家、 9家以上和不需要咨询的公司的概率分别是多少?,解 答 :,5.2.2 二项概率表的使用,5.2.3 用Excel进行分析,继续使用海外采购咨询的例题,5.2.4 二项分布的均值和标准差,二项分布的均值和标准差,假设研究者通常认为10%的人是左撇子,而某研究者认为35岁以上产妇生育的新生儿是左撇子的几率更高一些。为了验证自己的理论,他随机抽取了100名由35岁以上产妇生育的婴儿,其中20名是左撇子,100个婴儿可能的左撇子婴儿应该是多少呢?n=100,p=0.1 =np=10。,这个研究者的实验结果可能是一种偶然,也可能是因为他从另一个总体中抽取了样本。可以用二项分布概率对这一结果深入研究。总之,二项分布的均值给出了被研究对象发生的可能性。,5.2.5 绘制二项分布图,P0.5,向左偏斜,,P=0.5,图形对称无偏斜,P0.5,向左偏斜,,5.3 泊松分布,泊松分布(poisson distribution),在某一时间或空间段出现的次数,用于描述不经常发生的事情,因此,又被称为“不经常事件概率”,常应用于管理科学中,(排队论)使用模型描述某一时间段内到达数目的最佳分布,泊松分布的特征:,离散分布,描述小概率事件,描述事件相互独立,描述在某一时间(空间)段发生的次数,每一个时间(空间)段发生的次数从0到无穷大,每一个时间(空间)段发生的次数保持不便,泊松分布公式:,X表示(要计算的概率的)时间段内发生的次数,是长期平均值(常数),e是2.718282,在泊松试验中,必须保持不变,如果将用于一个值已经发生变动的区间,将会导致错误结论,5.3.1 用公式计算泊松分布问题,休斯顿船舶公司很少发生船只相撞事件。假如船只相撞事件服从泊松分布,平均每4周发生1.2次,4周内没有发生船只相撞事件的概率?2周内发生2次船只相撞事件的概率?6周内发生一次或没有发生撞船事件的概率?若此结果发生,可以对船舶公司、船舶安全警戒、天气情况以及做什么结论?,解 答 :,5.3.2 泊松分布表的使用,每个不同的值决定一个不同的泊松分布,,例 题 :,如果某房地产公司每个工作日约售1.6套房,假设房屋的销售服从泊松分布。则一天恰好售4套房的概率?没售出房屋的概率?每天售出10套或10套以上房屋的概率?两天恰好售出4套房屋的概率?,解 答 :,=1.6 p( x = 4=1.6) =0.0551 p( x = 0=1.6) =0.2019 p( x10=1.6) =1- p( x9=1.6) =1-1.000 = 0 p( x = 4=3.2) =0.1781,5.3.3 用Excel进行分析,使用Excel函数POISSON(X,0/1),0是FALSE指分布概率,1是TRUE指累计分布概率,5.3.4 泊松分布的均值和标准方差,泊松分布的均值是,方差也是,泊松分布的标准差是1/2,5.3.5 绘制泊松分布图,5.4 超几何分布,超几何分布(hypergeometric distribution),用于无放回实验中成功的概率,超几何分布的特征:,离散分布,每个结果只有成功或失败,样本为无放回抽样,总体N是有限的并已知,总体中成功的数目A已知,超几何分布公式:,N总体大小,n 样本大小,A总体中的成功次数,X样本中的成功次数(无放回抽取样本法),超几何分布假设样本空间中剩余的元素被选为样本的几率是一样的。,出现以下情况,可以用二项分布代替超几何分布:,无放回抽取样本,并且n5%N,5.4.1 用Excel进行分析,使用Excel函数HYPGEOMDIST ( X, n, A, N ),例 题 :,假设美国主要的18家计算机公司中12家位于硅谷,从18家中随机抽取3家,其中至少有一家位于硅谷的概率是多少?,解答:,N=18, n=3,A=12,X1,本题包括3种情况:X=1,X=2,X=3。,无放回抽样,n/N=16.6%5%,用超几何分布解答,第6章 连续型概率分布,1、理解均匀分布的概念,2、领会正态分布的重要性,3、找出正态分布的问题并知道如何解决这样的问题,4、确定何时使用正态分布函数来近似解决二项分布问题,同时懂得如何解决这样的问题,学习目标:,5、确定何时使用指数分布函数以解决商务中的问题,并知道怎样解决,6.1 均匀概率分布,均匀概率分布(uniform distribution),又称矩形分布(rectangular distribution ),对于范围内所有的值都有相同的高度f(X),均匀分布的概率密度函数:,均匀分布:,6.1.1 计算均匀分布函数的概率,均匀分布的概率(对于连续型分布即区间面积),例 题 :,假定组装一塑料组件需要花费的时间为2739秒,组装时间服从均匀分布,描述这一分布,某一组组装花费的时间为3.35秒,它的概率是多少?少于30秒的组装概率又是多少,解 答 :,f(X)= 1/(b-a) = 1/(39-27) = 1/12,= (39+27)/2 =33,=3.464,此分布函数高1/12,均值时间33秒,标准差3.464秒,P(30X 35)=(35-30)/(39-27)=0.4167,P(X 30)=(30-27)/(39-27)=0.2500,因为小于27秒的概率为0,6.2 正态分布,正态分布(normal distribution),人类许多特点的计量符合正态分布,如:,身高、体重、长度、速度、IQ、学习成绩等等,自然界的生物也有许多性质服从正态分布,如:,树木、动物及其它,商业和工业也有许多变量服从正态分布,如:,家居保险年花费、每平方米仓库租金、公司售后服务满意度等,6.2.1 正态分布函数的历史,误差正态曲线的发现,归功于数学家及天文学家卡尔高斯(17771855)。他发现对物体的重复测量产生的误差通常服从正态分布,因此,正态概率分布有时也被称为高斯分布或误差正态曲线。到今天,机器产出品的计量的分布类似高斯分布,它通常会产生一条围绕均值的误差正态曲线。,也有许多人认为法国数学家Abraham de Moivre (16671754)是第一个理解正态分布的人,他认为,在有条件的情况下,二项分布近似正态分布,他以相当高的准确度得出这一结论。他出版的正态曲线表值与目前出版的正态曲线表值相差不到1%。,正态分布的性质 :,连续型分布,对称分布,以轴为渐进线的分布,单峰分布,完整的家族(曲线族),分布曲线下的面积是1,6.2.2 正态分布的概率密度函数,正态概率分布函数公式:,此公式过于复杂,一般使用正态分布表(查表值),而不是使用公式直接计算,6.2.3 标准正态分布,每一组特定的和值就定义一个正态分布函数,下图为3组变量决定的3组曲线:,正态分布曲线的这种性质使得分析工作变得冗长而乏味,我们需要一条曲线,包含不同的和值,这就是标准正态分布函数(曲线),对于任意一个给定的,服从正态分布的X值,公式:,Z公式:,集中位置,集中程度,查Z值表所得概率值加上0.5000为概率值P(X),使用Excel函数NORMSDIST(Z)得概率值P(X),6.2.4 正态曲线问题的解决,某工厂生产的产品重量在最近一年中的平均值为494克,已知标准差为10克,随机抽取一批产品,此批产品平均重量为494510克的概率是多少?,解答:,=(510-494)/10=1.6,查表值Z=1.60,概率值P(494X 510)=0.4452,小于510克的概率为,P(X 510)=0.4452+0.5000=0.9452,大于484克小于510克的概率为:,分别计算X=484,X=510的Z值,Z=(484-494)/10=-1.00 查表概率为0.3413,Z=(510-494)/10=1.60 查表概率为0.4452,P(480X 510)=0.3413+0.4452=0.7865,大于484克小于490克的概率为:,分别计算X=484,X=490的Z值,Z=(484-494)/10=-1.00 查表概率为0.3413,Z=(490-494)/10=-0.40 查表概率为0.1554,P(484X 490)=0.3413-0.1554=0.1859,小于484克的概率为:,计算X=484的Z值,Z=(484-494)/10=-1.00 查表概率为0.3413,P(X 484)=0.5000-0.3413=0.1587,6.3 运用正态分布曲线解二项分布问题,连续性修正(correction for continuity),确保连续型分布向离散型分布转化过程中绝大多数信息的正确。,二项分布中所有的概率值只能在整数变量值上取得 ,是而正态分布是连续的,变量可以取遍轴上的所有值,对于这个差异必须进行修正,以确保这一近似尽可能地准确。,这个过程就象把钢筋条熔化,再压成钢板,但它的总体质量不变,其/、 / 、 / 的重量也未发生变化。,修正规则:,公式:,条件是:np5且nq5,记为:(,),利用正态分布解决二项分布问题见下例: (27n=100,p=0.37)?,解答:,因为样本值和P值都不在本教材所给出的二项分布表中,所以查表不合适,它适合用正态分布表来解决,1、计算和:,1000.37=37.0,(npq)1/2=4.83,、验证近似程度:,3=37 3(4.83)=37 14.49,区间22.5151.49在0100之间,满足验证条件,3、连续性修正:,二项分布问题X27转换为X26.5的正态分布的问题,=(26.5-37)/24.83=-2.17,查Z值表或使用Excel函数NORMSDIST(Z),得出概率为P(X26.5)=0.5-0.4850=0.0150,用二项分布公式来解题,得出的结果是0.0131,差异仅为0.0019。,6.4 指数分布,指数分布(exponential distribution),描述的是随机事件之间发生的时间间隔,连续型分布,一个曲线族,向右拖尾,X值由0到无穷,顶点总在X=0处,X值增大,曲线递减,指数概率分布公式:,f(X)=e-x,均 值:=1/,标准差:=1/,泊松分布分析到达次数的问题,指数分布分析间隔时间的问题,6.4.1 指数分布的概率,指数分布曲线下两点间的面积就是它的概率,指数分布的右尾概率公式:,P(XX0)=e- X0,一家公司进行了多年的统计质量控制。作为生产过程的一部分,组件会进行随机抽取并测试。从这些测试的记录来看,一件样品残次部分的发生服从泊松分布,在生产线上平均每20分钟就生产1.38个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论