《数据与统计学》PPT课件.ppt_第1页
《数据与统计学》PPT课件.ppt_第2页
《数据与统计学》PPT课件.ppt_第3页
《数据与统计学》PPT课件.ppt_第4页
《数据与统计学》PPT课件.ppt_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第 1 章 数据与统计学,举出一个统计没有用途的领域名称 比举出一个统计作为其组成部分的 领域名称要困难得多。 Robert Johnson,乘飞机的风险与航空意外险,保险费率的厘定,主要根据风险的大小,同时考虑管理费用和保险公司的利润。 现在普通过的单程保费是20元,保额40万,粗略估算,风险相当于1/20000。 根据国际民用航空风险的计算原则,一般是以10年作为一个周期,计算百万起降架次和百万飞行小时的事故率。,中国民航总局局长李家祥2011年2月24日 十一五”期间,民航运输飞行累计达2036万小时,976万架次,分别比“十五”增加了95%、81%。 “十一五”期间,中国民航百万架次重大事故率为0.1%,约占同期世界平均水平(0.5%)的五分之一,民航安全水平显著提升。 “十一五”期间,中国亿客公里死亡人数为0.003,而同期世界平均水平约为0.009。上述两项安全指标均高于世界平均水平。 2010年,民航业实现利润总额437亿元,创下了历史最好的水平,航空公司实现利润总额351亿元,占全球航空公司利润总额的60%。,质量管理中的6 ,6是质量管理中使用的一个术语,它的含义是指偏离正态分布的中心6个标准差。就产品生产或服务而言,它表示在生产或服务过程中缺陷率不超过百万分之3.4,通俗地说,如果生产100万个产品或进行100万次服务,产品的不合格率或服务达不到要求的比率平均来说不超过3.4个或3.4次。 6质量管理已成为最新的质量管理理念,近年来,它已成为一些著名国际大企业的质量管理方法,并在这样的管理理念下使企业受益匪浅。例如,实行了6质量标准,使摩托罗拉公司在3年中节省的资金超过9.4亿美元。在推广6质量管理策略不到10年的时间内,通用电器公司总市值从世界排名第十位跃升到第二位,目录,1.1 统计数据与统计学 1.2 统计学的产生和发展 1.3 统计学的分科 1.4 统计数据 1.5 统计学的几个基本概念,1.1 统计数据与统计学,1.1 统计数据与统计学,在我们的日常工作和生活中,到处都有统计数据。 出勤人数 考试成绩 企业利润 GDP 经济增长率,Statistics,统计学 统计数据或统计资料,案例1 男女人口比例,婴儿出生男女性别比:105:100 全国男女出生性别比为116.9:100 中国乡村出生人口性别比为122.85 :100 2005年人口普查统计公报,男女人口性别比106.74 :100。 2020年,预计我国20岁至45岁的男性将比女性多出3000万人,案例2 掷骰子,抛硬币 掷骰子,案例3 农作物实验,施肥量与产量,案例4 广告费用与销售额,广告费用增加,商品销售额也会相应增加 不同商品,相同投入会带来不同的销售额 相同商品,不同阶段投入也会带来不同销售额,案例5 油耗,丰田威驰油耗,手动挡汽车百公里不超过5L。 如何检测?,案例6 化妆品营销,免费试用 试用对象选择?,央视春晚满意度,央视市场研究公司发布的调查结果显示,2009年春节,中国全国收看电视的家庭中约有93.6%在看中央电视台的“春晚”,其中有83.6%的受调查观众对“春晚”表示满意。,央视春晚,统计学,统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。正因为统计学总是在和数据打交道,因而我们也可称统计学为“数据的科学”。,什么是统计学? (statistics),统计学是收集、分析、表述和解释数据的科学(不列颠百科全书) 统计学是一门收集、分析、解释和提供数据的科学(韦伯斯特国际辞典第3版) 统计指的是一组方法,用来设计实验、获得数据,然后在这些数据的基础上组织、概括、演示、分析、解释和得出结论(Mario F.Triola,初级统计学),什么是统计学? (statistics),1. 收集数据:取得数据 2. 处理数据:整理与图表展示 分析数据:利用统计方法分析数据 数据解释:结果的说明 得到结论:从数据分析中得出客观结论,收集、处理、分析、解释数据并从数据中得出结论的科学,统计研究的过程,实际问题,来自庞帝雅克用户的投诉,“这是我为了同一件事第二次写信给你,我不会怪你们为什么没有回信给我,因为我也觉得这样别人会认为我疯了,但这的确是一个事实。 我们家有一个传统的习惯,就是我们每天在吃完晚餐后,都会以冰淇淋来当我们的饭后甜点。 由于冰淇淋的口味很多,所以我们家每天在饭后,才投票决定要吃哪一种口味,等大家决定后我就会开车去买。 但自从最近我买了一部新的庞帝雅克后,在我去买冰淇淋的这段路程问题就发生了。你知道吗?每当我买的冰淇淋是香草口味时,我从店里出来车子就发不动。但如果我买的是其他的口味,车子发动就顺得很。 我要让你知道,我对这件事情是非常认真的。为什么?为什么?”,2019/5/14,SHANDONG UNIVERSITY DR. SHI SHAOBIN,24,工程师的观察,顾客描述了一个现象:买香草冰激凌之后汽车无法启动,而买其它冰激凌就没有问题。科学的认识方式会问:这是偶然还是必然,换句话说,这个现象是否重复发生? 汽车公司的经理虽然很怀疑事情的真实性,还是派了一个工程师去解决这个投诉 。 工程师在晚上到了顾客家里,一起去买冰激凌。那天是香草味的,买完之后,车的确无法启动;接连三个晚 上,工程师又去了,第二第三天是买别的冰激凌,车正常启动;第四天又是香草味的,还是无法启动。,真得有神秘存在吗?,在这几次和顾客一起买冰激凌的过程中,工程师详细地记录下了过程中的每一个细节,尽管他不知道这些细节有 没有有用。然后他比较这些细节,希望找出买香草冰激凌和其它口味冰激凌过程中的所有不同的地方。这种不同可能是导致汽车表现不同的原因。 最后,他发现,买香草冰激凌所用的时间远比其它口味的要短。因为香草冰激凌最好卖,商店把它放在离门口很近的地方,也不用找,直接拿起来就去付账。而其它口味的冰激凌放在 商店后面,多种口味放在一起,要走过去还要先找,所花的时间明显比买香草味的要长。所以,停车时间的长短,而不是冰激凌的口味,是产生这一“神迹”最可能的原因 。,这种猜测对么?,为了确认这种猜测,可以进行正反两方面的对照实验。 一方面,买香草冰激凌,买完之后逗留到买其它冰激凌所需要的时间,再去启动汽车,如果购买时间的长短是“神迹”产生的原因,那么这样买完香草冰激凌汽车应该能够能够启动; 另一方面,由另一个人拿一盒其它口味的冰激凌放在香草冰激凌那里,顾客取了之后付款走人,车应该不能启动。 这两方面验证符合预测,就可以确定停车时间长短是“神迹”发生的原因。,问题结束了么?,对于顾客来说,故事似乎到此结束了。 为什么停车时间短车就不能再次启动? 停车时间短,发动机冷却不足,发生了汽车故障里的“蒸汽锁死”现象。只要等发动机充分冷却,故障自动排除。 为什么会产生“蒸汽锁死”现象? 因为发动机过热,汽油在达到喷油嘴之前就气化了,所以不能以发动机需要的状态到达喷油嘴,从而导致发动机无法启动。 改善发动机的设计,比如用高压避免气化,或者要求使用适当沸点的汽油等等。,1.2 统计的产生与发展,统计学的产生,统计学产生于17世纪中叶,从几个不同的领域开始。 英国,威廉配第1676政治算术 英国,约翰格朗特1662关于死亡表的自然现象与政治观察 法国,帕斯卡、费马,概率论,统计学的发展,19世纪末,古典统计学(描述统计学),大样本 1907,t分布小样本 费希尔,F统计量 奈曼、皮尔逊,区间估计、假设检验 沃尔德,序贯抽样、统计决策,1.3 统计学的分科,统计学的分科,描述统计 (descriptive statistics),用图形、表格和概括性的数字对数据进行描述 内容 收集数据 整理数据 展示数据 描述性分析 目的 描述数据特征 找出数据的基本规律,推断统计 (inferential statistics),根据样本信息对总体进行估计、检验、预测或推断 内容 参数估计 假设检验 目的 对总体特征作出推断,描述统计与推断统计的关系,反映客观现象的数据,描述统计 (数据的收集、整理、显示和分析等),理论统计与应用统计,理论统计 应用统计,统计学与其他学科的关系,与数学的关系。 密切联系但又有本质区别。 抽象与具体/演绎与归纳 与其他学科,统计的应用领域,经济学,管理学,医学,工程学,社会学,统计学,统计的应用领域,actuarial work (精算) agriculture (农业) animal science (动物学) anthropology (人类学) archaeology (考古学) auditing (审计学) crystallography (晶体学) demography (人口统计学) dentistry (牙医学) ecology (生态学) econometrics (经济计量学) education (教育学) election forecasting and projection (选举预测和策划) engineering (工程) epidemiology (流行病学) finance (金融) fisheries research (水产渔业研究) gambling (赌博) genetics (遗传学) geography (地理学) geology (地质学) historical research (历史研究) human genetics (人类遗传学),统计的应用领域,hydrology (水文学) industry (工业) linguistics (语言学) literature (文学) manpower planning (劳动力计划) management science (管理科学) marketing (市场营销学) medical diagnosis (医学诊断) meteorology (气象学) military science (军事科学) nuclear material safeguards (核材料安全管理) ophthalmology (眼科学) pharmaceutics (制药学) physics (物理学) political science (政治学) psychology (心理学) psychophysics (心理物理学) quality control (质量控制) religious studies (宗教研究) sociology (社会学) survey sampling (调查抽样) taxonomy (分类学) weather modification (气象改善),结论,统计学非常有用!,历史上著名的统计学家,Jacob Bernoulli (伯努利)(1654-1705) Edmond Halley (哈雷) (1656-1742) De Moivre (棣莫弗) (1667-1754) Thomas Bayes (贝叶斯) (1702-1761) Leonhard Euler (欧拉) (1707-1783) Pierre Simon Laplace (拉普拉斯) (1749-1827) Adrien Marie Legendre (勒让德) (1752-1833) Thomas Robert Malthus (马尔萨斯) (1766-1834),Pierre Simon Laplace,Francis Galton,James Bernoulli,Abraham de Moivre,William S.Gosset,历史上著名的统计学家,Friedrich Gauss (高斯) (1777-1855) Johann Gregor Mendel (孟德尔) (1822-1884) Karl Pearson (皮尔逊) (1857-1936) Ronald Aylmer Fisher (费希尔) (1890-1962), Jerzy Neyman(奈曼) (1894-1981) Egon Sharpe Pearson (皮尔逊) (1895-1980) William Feller (费勒)(1906-1970).,Friedrich Gauss,Egon S.Pearson,Ronald A.Fisher,Karl Pearson,Jerzy Neyman,1.4 统计数据,数据的计量尺度,美国社会学家、统计学家史蒂文斯(S.S.Stevens)1946年提出,所有的科学统计都可以分为四个层次或四种计量尺度。 On the Theory of Scales of Measurement S. S. Stevens Science, New Series, Vol. 103, No. 2684 (Jun. 7, 1946), pp. 677-680,定类尺度(列名尺度),最粗略、层次最低的计量尺度,是按照实物的某种属性对其进行平行的分类或分组。 主要数学特征是“”或 “” 定类尺度只是测量了事物之间的类别差,而对各类之间的其他差别却无法从中得知 各类别之间是平等的并列关系,无法区分优劣或大小,各类别之间的顺序是可以改变的。 为便于统计处理,可以对不同类型用不同的数字或编码来表示。但这些数字只是一个代码,没有任何数学意义 国民经济按其经济类型,可以分为国有经济、集体经济、私营经济、个体经济等类,并分别用01-04表示。,定序尺度(顺序尺度),对事物之间等级差别或顺序差别的一种测度 不仅可以将事物分成不同的类别,还可以确定这些类别的优劣或顺序 主要数学特征是“”或“” 定序尺度的计量结果虽然也表现为类别,但这些类别之间是可以比较顺序的。 定序尺度的计量要比定类尺度精确一些,但只是测度了类别之间的顺序,而未测量出类别之间的准确差值。 该尺度的计量结果只能比较大小,不能进行加减乘除等数学运算,定距尺度(间隔尺度),不仅能将事物区分为不同类型并进行排序,而且还可以准确地指出类别之间的差距是多少 主要数学特征是“”或“” 定距尺度是对事物类别或次序之间间距的测度,该尺度通常用自然或物理单位表示 定距尺度的计量结果表现为数值,可以计算差值,因此可以进行加减运算 没有确定的“零”点,但有确定的测量单位 例如,学生某门课程的考分,可以从高到低分类排序,形成90分、80分、70分,直到零分的序列。,定比尺度(比例尺度),与定距尺度同属一个层次,其计量结果表示为数值 主要数学特征是“”或“”。 可以计算两个测度值之间的比值,这就要求定比尺度中必须有一个绝对固定的零点,这也是与定距尺度的唯一差别。,数据的计量尺度,四类尺度中有一定的层次性,是一个由低级到高级不断提高的过程,后一种尺度具有以前各种较低尺度的功能,也具有其独特的功能。 从定类到定比是一个认识不断深化,计量渐趋精确,数学处理的可能性逐渐增大的过程 可以用较高层次尺度测量的现象,一定可以用较低层次尺度测量,但反之不行 使用何种测量尺度取决于认识客体的性质,统计研究目的以及分类方法,一般应尽量使用较高层次的测量尺度,统计数据的分类 (按计量尺度分),分类数据(categorical data) 只能归于某一类别的非数字型数据 对事物进行分类的结果,数据表现为类别,用文字来表述 例如,人口按性别分为男、女两类 顺序数据(rank data) 只能归于某一有序类别的非数字型数据 对事物类别顺序的测度,数据表现为类别,用文字来表述 例如,产品分为一等品、二等品、三等品、次品等 数值型数据(metric data) 按数字尺度测量的观察值 结果表现为具体的数值,对事物的精确测度 例如:身高为175cm、168cm、183cm,统计数据的分类 (按收集方法分),观测的数据(observational data) 通过调查或观测而收集到的数据 在没有对事物人为控制的条件下而得到的 有关社会经济现象的统计数据几乎都是观测数据 试验的数据(experimental data) 在试验中控制试验对象而收集到的数据 比如,对一种新药疗效的试验,对一种新的农作物品种的试验等 自然科学领域的数据大多数都为试验数据,统计数据的分类 (按时间状况分),截面数据(cross-sectional data) 在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况 比如,2005年我国各地区的国内生产总值数据 时间序列数据(time series data) 在不同时间上收集到的数据 描述现象随时间变化的情况 比如,2000年至2005年国内生产总值数据,1.5 统计学的几个基本概念,统计中的几个基本概念,总体与单位 标志与指标 总体与样本 参数与统计量,统计总体和总体单位,总体(population) 是客观存在的、在同一性质基础上结合起来的许多个别单位的整体。是所研究的全部单位的集合。 同质性是形成总体的一个必要条件。 分为有限总体和无限总体 有限总体的范围能够明确确定,包括的单位可以计数 无限总体所包括的单位数无限,不可数的,有限总体与无限总体,有限总体与无限总体的区分主要是为了判断在抽样中每次抽取是否独立。 对于无限总体,每次抽取一个单位,并不影响下一次的抽样结果,因此每次抽取可以看做是独立的。 对于有限总体,抽取一个单位后,总体元素就会减少一个,前一次的抽样结果往往会影响第二次的抽样结果,因此,每次抽取是不独立的。,总体和总体单位,总体单位 是构成总体的各个单位,是各项统计资料最原始的承担着。 根据研究目的的不同,总体单位可以是人、物,也可以是企业、机构、地域,甚至可以是状况、长度、时间等等。 总体和总体单位是相对而言的,随着研究目的的不同,他们是可以变化的。,标志与标志表现,标志 说明总体单位属性或特征的名称。通常每一个总体单位有许多属性和特征。 单位是标志的直接承担着,标志依附于单位。 按性质不同,可以分为品质标志和数量标志。 按变异情况可分为不变标志和可变标志。 不变的数量标志称为常量,可变的数量标志称为变量。 标志表现 标志在各个单位身上的具体表现 有品质标志表现和数量标志表现之分,指标,指标 是客观存在的,说明总体现象数量特征的科学概念和具体数值。 统计研究社会经济现象总体的数量方面主要是靠指标来反映的。 分类 按反映的数量特点不同,分为数量指标和质量指标。,数量指标,总量指标。反应社会经济现象的总规模水平或工作总量,用绝对数形式表现,具有实物的或货币的计量单位。 按反映的总体内容,分总体单位总量和总体标志总量 总体单位总量是指总体内所有单位的总数,表明总体本身规模的大小 总体标志总量指总体中各单位标志值总和,反映的是总体特征的总量 总体单位总量只有一个,总体标志总量可以有许多个,从而构成一个总量指标体系 按所反映的时间状况不同,分时期指标和时点指标 时期指标反映社会现象在一定时期内发展过程的总量 时点指标反映社会现象在某一时刻上状况的总量,质量指标,反映社会及经济现象的相对水平或工作质量的统计指标 一般是由两个数量指标对比得到的派生指标 通常用来反映总体内部结构、发展速度、联系程度和总体单位的一般水平 具体分为相对指标和平均指标 计划完成(程度)相对指标、结构相对指标、比例相对指标、比较相对指标、动态相对指标(发展速度)、强度相对指标,标志与指标,区别 统计指标是说明总体特征的,而标志是说明总体单位单位特征的 统计指标都是用数值表示的,没有不能用数值标志的统计指标,而标志有不能用数值表示的品质标志和能用数值表示的数量标志 联系 统计指标的数值是由总体单位标志值汇总而来 统计指标与数量标志存在着一定的转换关系,随着统计研究目的的不同,原来的统计总体若变成总体

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论