用SPSS作统计量描述.ppt_第1页
用SPSS作统计量描述.ppt_第2页
用SPSS作统计量描述.ppt_第3页
用SPSS作统计量描述.ppt_第4页
用SPSS作统计量描述.ppt_第5页
已阅读5页,还剩51页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用SPSS作统计量描述,统计量 描 述,引例3 食品加工厂新上一条可以自动装填袋装食品的生产线。每袋食品的规格重量是50克,过于偏离这个标准,会产生不合格品。为检验生产线的运转状况,质检人员随机从生产线上抽取了100袋食品,测得重量数据如下表所示:,60.0,57.5,55.0,52.5,50.0,47.5,45.0,42.5,40.0,30,10,0,20,食品重量,100袋食品重量频数分布,频数,1.离散状态,2.集中趋势,3.偏斜状态,4.陡峭状态,集中趋势描述性统计量,离散程度描述性统计量,分布形态描述性统计量,均值,中位数,众数,均值、中位数、众数的比较,将数据中全体观测值求和再除以观测值的个数即可得到该数据的均值,记作 。,二百只灯泡使用寿命,均值的性质,1.所有观测值与其均值的离差之和等于0。,2.所有观测值与其均值的离差平方和最小。,+,-,性质1,性质2,将全体观测值按照从小到大的顺序排成一列,处于中间位置上的观测值即是该数据的中位数,记作 。,中位数位 置,观测值个数为偶数时中位数的确定,由单项式频数分布表确定中位数,二百只灯泡使用寿命,80,60,40,20,0,会计,金融,管理,营销,其它,频 数,10,20,30,0,频 率 %,众数是出现次数最多的观测值,记作 。,重度,中度,轻度,良,优,300,200,100,0,二百只灯泡使用寿命,众数是观测值的重点,中位数是观测值的中心,均值是观测值的重心,左偏,右偏,对称,三者的近似关系,30,10,0,20,食品重量,频数,左偏,100袋食品重量的均值、中位数与众数,二百只灯泡使用寿命的均值、中位数与众数,右偏,使用寿命,不同类型变量适用的集中趋势描述性统计量,为该类变量最适用的集中趋势描述性统计量,统计描述的收益与损失,直方图,原始数据,均值=19.2,数据被图示或计算出统计量时,其总体水平和结构状况显示出来了。但数据中的某些细节却丢失了。,10,20,30,40,50,60,5,0,10,15,Mo=可口可乐,甲商店,乙商店,Mo=可口可乐,两商店软饮料购买频数的众数都是可口可乐,但数据的离散程度不同。,0,10,20,可口可乐,雪碧,杏 仁露,新 骑士,醒目,0,10,20,可口可乐,雪碧,杏仁露,新 骑士,醒目,Me=一般,甲城市,乙城市,非常不满意,一般,满意,非常 满意,Me=一般,非常不满意,一般,满意,非常满意,两城市对住房条件评价的中位数都是一般,但数据的离散程度不同。,不满意,不满意,两组数据趋于集中的位置完全相同,但离散程度不同。,极差,四分位差,平均差,方差与标准差,离散系数,数据中最大观测值与最小观测值之差称为极差,记作 。,极差给出了全体观测值的变动范围。一般情况下,极差越大,离散程度越大。但其值易受极端值影响。,100袋食品重量的最小观测值为40克,最大观测值为61克。,25%分位数,50%分位数,75%分位数,最大观测值,最小观测值,中位数,上四分位数,下四分位数,50%的观测值小于中位数,50%的观测值位于上下四分位数之间,50%的观测值大于中位数,数据中的上四分位数与下四分位数之差称为四分位差,记作 。,100袋食品重量的下四分位数为47克,上四分位数为54克,因此该数据的四分位差=54克- 47克=7克。,四分位差给出了全体观测值中处于中间位置的50%观测值的变动范围,一般情况下,四分差越大表明中间50%观测值的离散程度越大,从而间接地反映出数据整体的离散程度也就越大。,二百只灯泡使用寿命,Me=75.5,QU=85,QL=67,中间50% 灯泡的寿命在67-85小时之间,18,四分位差与盒形图,中间50% 的观测值集中于盒子之内。盒子越窄,表明集中程度越高,即离散程度越低。,QU=85,QL=67,二百只灯泡使用寿命,极差及四分位差均相等,但离散程度不同。,平均差,50名工人日产零件数平均差计算表,所有观测值与其均值离差的绝对值的均值。,方差公式,自由度是指样本数据中可以自由取值的个数。譬如:,样本容量为n,均值确定后,观测数据中只有n-1个可以自由取值,其中必有一个不能自由取值,因此自由度为样本容量减1。,均方差公式,方差的含义不易理解,它的计量单位是观测值计量单位的平方。标准差的计量单位与观测值计量单位是一致的。,50名工人日产零件数方差计算表,计算样本方差或样本标准差,有时是出于估计总体方差或总体标准差的目的,总体方差是用以描述总体数据离散程度的参数。其计算公式为:,总体标准差是总体方差的平方根。其计算公式为:,S=3.00,S=2.71,S=0.82,S=0.00,理解标准差,在均值上加减标准差,34.4-2s=20.6,34.4,34.4-=27.5,34.4+2s=48.2,27名学生每30秒心跳次数,均值=34.4 标准差=6.9,观测值的大小大致不超过均值加减4个标准差的范围。 本例中均值加减2个标准差就几乎包含了所有的观测值。,34.4+s=41.3,学生数,8,6,4,2,21,24,27,30,33,36,39,42,45,48,51,心跳数,标准得分(standard score),100对新娘和新郎,新娘的平均年龄为30.0岁,标准差为9.0岁;新郎的平均年龄为32.4岁,标准差为10.0岁。其中年龄最小的新娘为19岁,年龄最小的新郎为19岁。问:作为新娘和新郎,俩人哪个更年轻?,标准得分含义的图示,xi (年龄),12,21,30,39,48,Zi (标准得分),-2.00,-1.00,0,1.00,2.00,切贝谢夫( Tchebysheff)定理,在任意一个数据集中,至少有(1-1/z2 )的数据项与平均数的距离在 z 个标准差之内,其中z是任意大于1 的值。,(0.75)75% z=2,(0.89)89% z=3,(0.94)94% z=4,68%,95%,约100%,如果数据近于钟形分布,则有:约68%的数据项与均值的距离在1个标准差之内;95%的数据项与均值的距离在2个标准差之内;几乎所有的数据项与均值的距离在3个标准差之内。,8个企业产品销售数据,离散系数,偏度,峰度,频数分布的偏态,对称,左偏,右偏,偏度计算公式,30正偏(右偏); 30 负偏(左偏); 3=0对称 ; 3 越大,偏态程度越大。,100袋食品重量样本数据中,均值为50.67

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论