统计学课件_贾俊平01第1章__导论_第1页
统计学课件_贾俊平01第1章__导论_第2页
统计学课件_贾俊平01第1章__导论_第3页
统计学课件_贾俊平01第1章__导论_第4页
统计学课件_贾俊平01第1章__导论_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学STATISTICS(第五版)第 1 章导 论作者中国人民大学统计学院贾俊平1 - 1作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)Statistical thinking will one day be asnecessary for efficient citizenship as the ability to read and write (统计思维总有一天会像读与写一样成为一个有效率公民的必备能力). H.G. Wells识数教育(quantitative literacy)1 - 2作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)第

2、 1 章导 论统计及其应用领域统计数据的类型统计中的几个基本概念1 - 3作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)学习目标.5.理解统计学的含义理解描述统计和推断统计了解统计学的应用领域了解数据的类型理解统计中的几个基本概念1 - 4作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)1.1统计及其应用领域.2什么是统计学统计的应用领域1 - 5作者:贾俊平,中国人民大学统计学院什么是统计学?(statistics)统计学STATISTICS(第五版)1.统计学是收集、分析、表述和解释数据的科学(不

3、列颠百科全书)统计是一门收集、分析、解释和提供数据的科学(韦伯斯特国际辞典第3版)统计指的是一组方法,用来设计实验、获得数据,然后在这些数据的基础上组织、概括、演示、分析、解释和得出结论(Mario F.Triola,初级统计学)2.3.1 - 6作者:贾俊平,中国人民大学统计学院什么是统计学?(statistics)统计学STATISTICS(第五版)收集、处理、分析、解释数据并从数据中得出结论的科学1.2.3.收集数据:取得数据处理数据:整理与图表展示分析数据:利用统计方法分析数据4.5.数据解释:结果的说明得到结论:从数据分析中得出客观结论1 - 7作者:贾俊平,中国人民大学统计学院统计

4、学STATISTICS(第五版)数据 vs. 数字*统计学是从数据中获取信息的科学,或一句话,统计学是关于数据的科学数据(data)包含数字(number),但并不仅是单纯的数字n 数据是有背景的数字 (data are numbers with a context)1 - 8作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)数据 vs. 数字 (续)例如:6本身毫无含义,但假如我们得知某位亲朋的新生儿出生时重6斤,就会恭喜她生了个健康宝宝正是根据数字及其背景和常识,让我们做出如此判断。而不会去设想其体重是6两或是6公斤有上下文的数字方能提供有用的信息 数据数字 统计学数学

5、1 - 9作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)统计学 vs. 数学 statistics is not a branch of mathematics. Mathematics is to statistics as wood, hammer, and nails are to building a house: a partial set of materials and tools. Statistics also draws materials and tools from philosophy, graphics, computing, psychol

6、ogy, and language.Jessica M. Utts,Robert F. Heckard著, Mind onStatistics (统计思想.英文版.原书第2版),机械工业)1 - 10作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)Turnon your mind*Think about a decision you recently had to make. What “data” did you use to help you make the decision?1 - 11作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)统计方法

7、统计方法描述统计推断统计参数估计假设检验1 - 12作者:贾俊平,中国人民大学统计学院描述统计(descriptive statistics)统计学STATISTICS(第五版)1.研究数据收集、处理、汇总、图表描述、概括与分析等统计方法内容¥502.搜集数据整理数据展示数据描述性分析2503.目的Q1Q2Q3Q4描述数据特征找出数据的基本规律x = 30s2= 1051 - 13作者:贾俊平,中国人民大学统计学院推断统计(inferential statistics)统计学STATISTICS(第五版)1.研究如何利用样本数据来推断总体特征的统计方法内容总体2.参数估计假设检验3.目的样本对

8、总体特征作出推断1 - 14作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)为什么学习统计学?*1.2.我们被数据所包围 Data are everywhere运用统计技术做出的决策影响我们的生活Statistical techniques are used to make decisions that affect our lives保险公司、医药机构、环境保护3.不论你从事何种职业,统计知识能帮助你更有效决策 No matter what your career, youwill make professional decisions that involve dat

9、a1 - 15作者:贾俊平,中国人民大学统计学院1 - 16作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)统计的应用领域经济学医学统计学管理学工程学社会学统计学STATISTICS(第五版)统计的应用领域actuarial work ( 精 算 ) animal science (动物学) archaeology ( 考 古 学 ) crystallography (晶体学) dentistry (牙医学)agriculture ( 农 业 ) anthropology (人类学) auditing ( 审 计 学 ) demography (人口统计学) ecolog

10、y (生态学)econometrics (经济计量学)education (教育学)election forecasting and projection (选举预测和策划)engineering (工程)finance (金融)fisheries research (水产渔业研究)gambling (赌博)geography (地理学)historical research (历史研究)1 - 17epidemiology (流行病学)genetics (遗传学)geology (地质学)human genetics (人类遗传学)作者:贾俊平,中国人民大学统计学院统计学STATISTICS

11、(第五版)统计的应用领域hydrology (水文学)industry (工业)linguistics (语言学)literature (文学)manpower planning (劳动力计划)management science (管理科学)marketing (市场营销学)medical diagnosis (医学诊断)meteorology (气象学)military science (军事科学)nuclear material safeguards (核材料安全管理)ophthalmology (眼科学) physics ( 物 理 学 ) psychology ( 心 理 学 ) q

12、uality control (质量控制) sociology ( 社 会 学 ) taxonomy (分类学)1 - 18pharmaceutics (制药学)political science (政治学)psychophysics (心理物理学)religious studies (研究)survey sampling (调查抽样)weather modification (气象改善)作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)统计应用举例经济预测 forecasting人口统计 demographics会计 Accounting金融投资 Finance市场营销

13、Marketing1 - 19作者:贾俊平,中国人民大学统计学院How Companies Learn Your Secrets统计学STATISTICS(第五版)上的一篇长文,讲零售商如何分析顾客的购物习惯。文中提到, 连锁店Target通过顾客的购买记录,了解他们的习惯, 推测他们的购物倾向,然 后采取相应的营销策略。 一个高中生怀孕了,她父 母尚不知晓,Target便估计到了,已经开始给她寄婴 儿用品的折扣券了。 /zOLvFqh作者:贾俊平,中国人民大学统计学院1 - 20统计学STATISTICS(第五版)统计应用举例(续)生产制造 Productionn 产品质

14、量控制体育运动 Sportsn 个人与团队的表现其它 Othersn 医药n 政治:测验1 - 21作者:贾俊平,中国人民大学统计学院统计学02-07STATISTICS姚明赛季常规赛每场得分(第五版)资料来源:mingleonx, “一个操纵着NBA的统计学魔律精 ”,2006-01-12, /cgi-bin/viewone.cgi?gid=30&fid=574&itemid=6702011 - 22作者:贾俊平,中国人民大学统计学院赛季平均值标准差02-0313.56.703-0417.56.904-0518.36.805-061

15、9.9(22.2)6.3(?)06-0725.08.6统计学STATISTICS(第N五B版A)球星每个赛季常规赛场均得分1 - 23作者:贾俊平,中国人民大学统计学院球员平均值标准差迈克尔乔丹30.73.72哈基姆奥拉朱旺21.05.98蒂姆邓肯22.21.62科比布莱恩特23.47.62特雷西迈克格雷迪21.88.89沙克奥尼尔26.13.25史蒂夫弗朗西斯19.32.11文斯卡特23.14.09凯文加内特20.43.9阿伦艾弗森28.13.57统计学STATISTICS(第五版)1.2统计数据的类型.21.2.3分类数据、顺序数据、数值型数据观测数据和实验数据截面数据和时

16、间序列数据1 - 24作者:贾俊平,中国人民大学统计学院1 - 25作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)统计数据的分类统计数据的分类按计量层次按收集方法按时间状况时序的数据截面的数据实验的数据观察的数据数值型数据顺序的数据分类的数据统计数据的分类(按计量尺度分)统计学STATISTICS(第五版)1.分类数据(categorical data)只能归于某一类别的非数字型数据对事物进行分类的结果,数据表现为类别,用文字来表述例如,人口按性别分为男、女两类2.顺序数据(rank data)只能归于某一有序类别的非数字型数据对事物类别顺序的测度,数据表现为类别,用文

17、字来表述例如,产品分为一等品、二等品、三等品、次品等3.数值型数据(metric data)按数字尺度测量的观察值结果表现为具体的数值,对事物的精确测度例如:身高为175cm、168cm、183cm作者:贾俊平,中国人民大学统计学院1 - 26数据的类型(按计量尺度分)统计学STATISTICS(第五版)数据Data定量数据Quantitative/numerical Data定性数据Qualitative Data分类数据Nominal/ Categorical Data定序数据Ordinal/ Rank Data定距数据Interval Data定比数据Ratio Data1 - 27作者

18、:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)定性数据 Qualitative data又称品质数据,不能以自然生成的数值度量的数据n 定类/分类数据 nominal data:排序无意义 如性别、政治面目、企业的经济性质n 定序/顺序数据 ordinal data:排序有意义 如某测试者对产品的评价(很好、好、一般、差、很差)、某租车行对车型的划分(大、中、小、微)1 - 28作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)定性数据(续)为了方便数据的输入与分析,我们通常也会给定性数据人为指定数值n 如用“1”代表“男性”、“0”-“女性”n 评定等

19、级时用“1”表示“很好”、“2”-“好”、“3”-“一般”、但这些数字仅仅是符号而已,对其进行加减乘除毫无意义1 - 29作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)定类 or定序?1 - 30作者:贾俊平,中国人民大学统计学院统计学STATISTICS 定量数据 Quantitative data(第五版)又称数量数据,能以自然生成的数值度量的数据(刻度、比例)n 定距/间隔数据 Interval data:温度、考试分数n 定比/比例数据 ratio data:长度、收入、通胀率1 - 31作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)定距

20、 vs. 定比原点(origin)“0” 有否意义n 定比数据的原点有意义的绝对零点,代表“没有”,如 收入0元代表没有收入n 定距数据的“0”无意义无绝对零点,温度0不代表没有温度,分数0不代表没文化能否乘除定比数据可加减乘除失业率4%是失业率2%的两倍定距数据只能进行加减,而不能进行乘除运算考60分比30分高出30分,但不代表学问高出2倍。1 - 32作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)定距 or 定比?Example: Womens dress sizeslisted on the table.1 - 33作者:贾俊平,中国人民大学统计学院数据的计量层次

21、Data Measurement Levels统计学STATISTICS(第五版)Highest LevelComplete AnalysisMeasurementsRankingsOrdered CategoriesHigher LevelMid-level AnalysisCategorical Codes ID Numbers Category NamesLowest LevelBasic Analysis1 - 34作者:贾俊平,中国人民大学统计学院Nominal DataOrdinal DataRatio/Interval Data统计学STATISTICS(第五版)“中国至少比美国

22、好五倍”!“我公开讲过,中国今天的状况就比美国的状况要好,中国人口比美国多五倍,如果按照人口比例来讲,我们问题至少应该比美国多五倍,那才说明我们实是,我们目前状况和美国一样。但现状况比美国的好,说明中国至少比美国好五倍。我在大会上讲这话引起会场上哄堂大笑,大家都鼓掌,也可以看出美国不得人心,他们把问题高度政治化,为本国政治服务,把问题作为工具,做法很不得人心。”2004年4月17日,中国常驻日内瓦机构代表、中国代表团团长沙祖康在中国第十一次挫败美国所谓的“中国状况”提案后,在日内瓦接受1 - 35报专访时说道作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)定性 or 定量

23、?说明下列变量属于品质型还是数量型:a.b.c.d.e.f.g.h.1 - 36年龄社会等级汽车产量支持的人数年销售额软饮料规格(大、中、小) 每股盈利支付方式(现金、信用卡、支票)作者:贾俊平,中国人民大学统计学院统计数据的分类(按收集方法分)统计学STATISTICS(第五版)1. 观测的数据(observational data)n 通过调查或观测而收集到的数据n 在没有对事物人为控制的条件下而得到的n 有关社会经济现象的统计数据几乎都是观测数据2. 实验的数据(experimental data)在实验中控制实验对象而收集到的数据比如,对一种新药疗效的实验,对一种新的农作物品种的实验等

24、自然科学领域的数据大多数都为实验数据1 - 37作者:贾俊平,中国人民大学统计学院统计数据的分类(按时间状况分)统计学STATISTICS(第五版)1.截面数据(cross-sectional data)n 在相同或近似相同的时间点上收集的数据n 描述现象在某一时刻的变化情况n 比如,2005年我国各地区的国内生产总值数据时间序列数据(time series data)2.在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2005年国内生产总值数据1 - 38作者:贾俊平,中国人民大学统计学院统计数据的分类 Data Types(按时间状况分)统计学STATISTICS(第五版

25、)Sales (in $1000s)2003200420052006Time Series DataAtlanta435460475490Boston320345375395Clevelan d405390410395Denver260270285280Cross SectionData1 - 39作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)1.3统计中的几个基本概念.21.3.3总体和样本参数和统计量变量1 - 40作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)总体和样本1.总体(population)n 所研究的全部个体(数

26、据) 的集合,其中的每一个个体也称为元素n 分为有限总体和无限总体 有限总体的范围能够明确确定,且元素的数目是有限的 无限总体所包括的元素是无限的,不可数的JJJJJ2.样本 (sample)J从总体中抽取的一部分元素的集合J构成样本的元素的数目称为样本容量或样本量(sample size)作者:贾俊平,中国人民大学统计学院1 - 41统计学STATISTICS(第五版)参数和统计量1.参数(parameter)描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值所关心的参数主要有总体均值(m)、标准差(s)、总体比例(p)等总体参数通常用希腊字母表示2.统计量(statistic

27、)用来描述样本特征的概括性数字度量,它是根据样本数据计算出来的一些量,是样本的函数所关心的样本统计量有样本均值(x)、样本标准差(s)、样本比例(p)等样本统计量通常用小写英文字母来表示1 - 42作者:贾俊平,中国人民大学统计学院变量统计学STATISTICS(第五版)(variable)1.说明现象某种特征的概念n 如商品销售额、受教育程度、产品的质量等级等n 变量的具体表现称为变量值,即数据变量可以分为2.分类变量(categoricalvariable):说明事物类别的名称顺序变量(rank variable):说明事物有序类别的名称数值型变量(metric 名称variable):说

28、明事物数字特征的离散变量:取有限个值连续变量:可以取无穷多个值1 - 43作者:贾俊平,中国人民大学统计学院变量统计学STATISTICS(第五版)(其他分类)1.2.随量和非随量variables) 和理论变量经验变量(empirical(theoretical variables)经验变量所描述的是我们周围可以观察到的事物理论变量则是由统计学家用数学方法所构造出来的一些变量,比如,z 统计量、t 统计量、c2 统计量、F 统计量等1 - 44作者:贾俊平,中国人民大学统计学院1 - 45作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)变量及其类型变量基本分类其他分类随

29、量经验变量分类变量顺序变量数字变量非随量理论变量1 - 46作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五版)统计中的几个基本概念总体样本J J JJ JJJJJJJ统计量参数mspxs p平均数标准差比例统计学STATISTICS(第五版)例:Norris电子公司采用新型灯丝的灯泡寿命的推断统计Norris电子公司的产品设计小组开发了一种意在增加灯泡使用寿命的新型灯丝。为估计新型灯丝的寿命,公司生产了200个采用新型灯丝的灯泡并对其进行测试,收集了灯丝烧断之前每个灯泡工作时限的数据(如表1-4)1 - 47作者:贾俊平,中国人民大学统计学院统计学STATISTICS(第五

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论