第四章统计整理(统计学原理南开大学,陆宇建)_第1页
第四章统计整理(统计学原理南开大学,陆宇建)_第2页
第四章统计整理(统计学原理南开大学,陆宇建)_第3页
第四章统计整理(统计学原理南开大学,陆宇建)_第4页
第四章统计整理(统计学原理南开大学,陆宇建)_第5页
已阅读5页,还剩108页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第四章统计整理§1统计整理的一般问题§2统计分组§3次数分布§4数据显示1

§1统计整理的一般问题

统计整理的概念统计整理的内容2统计整理的含义

统计整理通常是指对调查所得到的原始资料进行分类、汇总,使之系统化、条理化的工作过程。但广义的统计整理也包括对原来已经加工的综合资料的再整理。如历史资料的整理、统计年鉴的编辑、次级资料(如各出版物公布的)的加工整理等。统计整理是统计工作的第三阶段。这个阶段是统计调查的继续,统计分析的前提。承上启下的作用3统计整理的意义统计调查所搜集的反映个体量的原始资料是分散的,不是集中的;是零碎的,不是系统的。根据这些资料。人们难以从总体上分析和认识社会经济现象的数量表现。至于某些已经加工的综合资料,则往往由于资料在分组方法、总体范围或指标涵义、口径、计算方法等方面不同,而不能满足统计分析的要求,也必须先通过统计整理,才能据以从总体上分析社会经济现象的数量表现,4统计资料整理的内容审核统计资料。包括:完整性、准确性、及时性进行统计分组。这是统计整理的关键问题。进行资料的汇总。这是统计整理的中心内容。编制统计表或统计图。统计整理的结果。汇总技术手工汇总、电子计算机汇总5第三章统计资料整理§1统计整理的一般问题§2统计分组§3次数分布§4数据显示6

§2统计分组

统计分组的概念和种类

统计分组的方法1、选择分组标志——统计分组的核心问题2、选择分组种类3、划分分组界限7统计分组概念

根据统计研究的目的和客观现象的内在特点,按某个标志(或几个标志)把被研究对象的总体划分为若干个不同性质的组。原则穷尽原则、互斥原则例1:从业人员按文化程度分组小学毕业中学毕业(含中专)大学毕业文盲或识字不多小学毕业中学毕业(含中专)大专毕业大学及大学以上

(√)(×)8种类例2:某商场把服装分为①男装、女装、童装。(×)②成年装(男女装)儿童装(男女装)统计分组(√)按分组标志的多少不同简单分组复合分组按分组标志的性质不同品质标志分组数量标志分组9例1为了了解某地区银行存款的构成,可以选用存款性质、期限两个标志分别进行分组:按存款性质分组企业存款储蓄存款财政性存款按存款期限分组活期存款定期存款简单分组复合分组存款同时按其性质及期限分组企业存款活期定期储蓄存款活期定期财政性存款活期定期例2企业职工按工龄分组:5年以下5~10年10~15年15~20年20年以上品质标志分组数量标志分组10统计分组作用1、统计分组的根本作用是将复杂的社会经济现象按照统计认识的要求区分为各个性质不同的组成部分。在区分事物性质的分组中,划分经济类型具有重要意义。经济类型是指直接反映社会生产关系的各种类型。我国根据不同时期经济发展情况来划分不同的经济类型。1112统计分组作用2.研究总体现象的内部结构。现象的内部结构是表明现象本质特点的一个重要方面,将同一总体不同时期的结构联系起来,还可以看到现象的发展趋势和规律。例如,1988年全国独立核算工业企业净产值如下:13统计分组作用3、将总体的分组资料按时间的移动联系起来进行分析,可以反映总体及各组在数量上的变动情况和变动规律,认识由于各组变动速度不同,而形成总体中性质不同的各组地位改变的状况,从而获得对总体由量变逐渐转化为质变的过程的认识。例如,我国农业总产值个农林牧副渔各业所占比重的变化情况如下表:14统计分组作用4、分析总体现象之间的依存关系。通过分组将有相互影响的现象联系起来进行研究,反映它们在数量上的变动规律。例如:商品销售额与流通费用率的关系;居民收入与储蓄额的关系。15统计分组的方法

统计分组的关键在于选择分组标志和划分各组界限。

1、选择分组标志——统计分组的核心问题分组标志是将总体区分为各个性质不同的组的标准或依据。选择分组标志的原则是:结合一定的历史条件或经济条件,根据统计研究的目的和任务,选用那些最能反映现象本质特征的标志作为分组标志。如:工业企业的分类——规模分类、部门分类16例:经调查,某地年末货币流通量为15.3亿元,比上年增加4.5亿元。为了宏观调控,有必要对本地区货币流通量分布状况进行调查。有两种资料整理结果:按地区分组上期本期增减%甲县乙县丙县丁县360002400028000200005200034000410002600044.441.746.730.0合计10800015300041.7(1)(2)按行业结构分组上期本期增减%集团单位库存现金农民手持现金城镇居民手持现金其他流动人口手持现金27000430003100070003500071000370001000029.665.019.042.6合计10800015300041.717统计分组的方法2、选择分组种类简单分组分组体系主要根据研究任务及对象特点来选择,前者简单。后者更全面、深入,但复杂。品质标志分组数量标志分组单项式分组组距式分组主要根据研究任务来选择。(根据数量变动的特征不同来选择)18

对总体只按一个标志进行分组,称为简单分组。如:以产值作为划分企业规模的标志;按文化程度对人口总体进行分组。统计对总体往往要从多方面进行研究,仅仅依赖一个分组标志进行分组是难以满足需要的,必须运用多个分组标志进行多种分组,形成一个分组体系,才能满足需要。

统计分组的方法2、选择分组种类19统计分组体系就是根据统计分析的要求,通过对同一总体进行多种不同分组而形成的一种相互联系、相互补充,能从总体在各种特殊性质意义上的量来加深对社会经济现象总体数量表现的认识的体系。例如,对于国民经济总体进行统计研究,必须通过按部门、按所有制、按地区、按主管系统等多种分组,才能得到比较深刻的认识。这就是国民经分组体系。统计分组体系可分为平行分组体系与复合分组体系。统计分组的方法2、选择分组种类20对同一总体选择两个或两个以上的标志分别进行简单分组然后并列在一起就形成平行分组体系。例如,为了认识人口总体的自然构成,可以分别选择性别、民族、文化程度、年龄等四个分组标志进行分组,得到如下分组体系。平行分组体系的特点是,每一分组只能固定一个因素对差异的影响,不能固定其他因素对差异的影响。例如,男子组.女子组中性别的差异已被固定;各民族组中民族的差异已被固定;但这些组中其他因素的差异都依然存在。

统计分组的方法平行分组体系

21

22对同一总体选择两个或两个以上的标志层叠进行分组,就形成复合分组体系。例如,为了认识我国高等院校在校学生的基本状况,可以同时选择学科、学制、性别等三个标志进行复合分组,得到如下分组体系。统计分组的方法复合分组体系

23

24建立复合分组体系,应根据统计分析的要求,在选择分组标志的同时,确定它们的主次顺序。首先按主要的标志对总体进行第一次分组;然后按次要的标志对第一次所分的组再进行第二次分组;依次按所有标志分至最后一层为止。复合分组体系的持点是,第一次分组只固定一个因素对差异的影响、第二次分组则同时固定两个因素对差异的影响,当最后一次分组时,则所有被选择标志对差异的影响已全部被固定。例如,理科、文科组中只固定了学科一个因素的差异,但仍存在着学制及性别的差异。在两组下再分的本科、专科组中,则已固定了学科、学制两个因素的差异,但仍存在着性别的差别。而最后分的男、女组中,则所有被选择标志各因素的差异部已被固定。即这些组中的学生,他们的学科、学制、性别全部是相同的。统计分组的方法复合分组体系

25分组标志确定之后,必须解决分组组数和各组界限的划分,即分组的具体方法问题。根据分组标志的特征不同,统计总体可以按品质标志分组,也可以按数量标志分组。

统计分组的方法2、选择分组种类26按品质标志分组,就是选择反映事物属性差异的品质标志作为分组标志,并在品质标志的变异范围内划定各组界限,将总体划分成为若干个性质不同的组成部分。例如,人口总体按性别,分为男、女两组;再如,企业总体按所有制,分为全民、集体、合营、个体等组。

统计分组的方法按品质标志分组27按数量标志分组,就是选择反映事物数量差异的数量标志为分组标志,并在数量标志的变异范围内划定各组界限,将总体划分为性质不同的若干组成部分。例如,居民家庭按子女数分组,可分为0人(无子女)、1人、2人、3人;等等。

统计分组的方法按数量标志分组28就具体的分组形式而言,如果变量的变异较小,我们可以将每个变量值单列一组,这种分组称为单项式分组。如果变量的变异较大,则可以把变量的整个的取值范围依次划分为若干个区间,一个区间内的所有变量值归为一组。区间的最大值称为上限,最小值称为下限,上限与下限之差为组距,即组距=区间的最大值(上限)-区间的最小值(下限)……(1)这样的分组称为组距式分组。统计分组的方法按数量标志分组29按总体内各组组距是否完全相等,数量标志分组又可以分为等距式分组与异距式分组。等距式分组适用于总体各单位的变量值由小到大呈现均匀变化的情况。异距式分组则适用于总体各单位的变量值由小到大呈现不均匀变化的情况。各种分组举例如表4-3。

统计分组的方法按数量标志分组30

31变量按其变量值能否无限分割可以分为离散型变量和连续型变量。例如表4-3中,例1、例2、例4中的变量均为离散型变量,例3和例5中的变量为连续型变量。一般来说,离散型变量既可以来用单项式分组,也能够采用组距式分组;而连续型变量只能采用组距式分组,不能采用单项式分组。因为连续型变量的取值能够无限分割,变量值有无穷多个。

统计分组的方法按数量标志分组32在采用组距式分组中,两种变量类型在组限的表示方法上也有不同。离散型变量下各相邻组的组限可以间断,如例2中第一组的上限为999人,第二组的下限为1000人,两者不相重叠。连续型变量的各相邻组的组限必须重叠,如例3中第—组的上限为80元,第二组的下限为80元,两者重叠。为保证重叠后不致发生“80元”究竟归属第几组的混乱,习惯上规定各组一般均只包括本组下限变量值而不包括本组上限变量值。上例80元应归入第二组。

统计分组的方法按数量标志分组33单项式分组:一个变量值列为一组。如:对居民家庭按家庭人口数进行分组:

1人2人3人4人5人及以上2、选择分组种类组距式分组:若干个变量值列为一组。如:A、企业的工人按日B、工人按工资水平分组(连)产零件数分组(离)50-60300-40060-70400-50070-80500-60080-90600-70090以上700-800适用于离散型变量,且变量值不多时。适用于连续型变量,且变量值变化范围大时。34①全距与组距②等距与异距③组限与组中值④开口组与闭口组⑤连续组距分组和不连续组距分组重叠组限“上限不在内”原则关于组距式分组的几个问题例:学生按成绩分组(分)

(1)50—6060—70

70—8080—9090—100(2)60以下60—6970—7980—89

90以上组距=80-70=10上限:80下限:70开口组闭口组组中值组中值组中值重叠组限值70归于70—80组不连续组距式分组连续组距式分组35统计分组的方法3、划分分组界限

按品质标志分组,只要根据事物的性质划分界限。目前我国实践中有制定和实施的几种最重要的、基础性国家分类标准。按数量标志分组,要根据事物的数量变动来判断事物性质上的差异。注意客观界限。例:1、人口按年龄分组(岁):0——6婴幼儿7——17少年儿童18——59中青年60以上老年362、学生按成绩分组(分):

60以下60——7070——8080——9090以上3、企业按产值计划完成程度分组(%):

100以下100——110110以上例:55-6060-6565-70……95-10055-6565-7575-8585-9595以上(×)(×)95-105105-115115以上(×)37第三章统计资料整理§1统计整理的一般问题§2统计分组§3次数分布§4数据显示38

§3次数分布

次数分布的概念和种类

变量数列的编制

次数分布类型39次数分布概念在统计分组的基础上,将总体中的所有单位按组归类整理,形成总体中各个单位数在各组间的分布,就叫做次数分布。分布在各组的个体单位数叫次数,又称额数。各组次数与总次数之比称比率,又称频率。将各组组别与次数依次编排而成的数列就叫做次数分布数列,简称分布数列。有时也可把比率列入分布数列中。分布数列又称分配数列或次数分配,它可以反映总体中所有单位在各组间的分布状态和分布特征,研究这种分布特征是统计分析的—项重要内容。40次数分布概念

各组名称(常用x表示)两个构成要素

各组次数(有两种表现形式:绝对数也称频数,用f表示相对数称为频率,用f/∑f表示。)41次数分布种类由于分组是次数分布的基础,因此有怎样的分组就形成怎样的次数分布。综合上述各种的分组,次数分布的类型,可归纳为:次数分布品质数列变量数列单项数列组距数列等距数列异距数列不连续组距数列连续组距数列42根据分组标志特征的不同.分布数列可以分为属性分布数列与变量分布数列两种。按品质标志分组形成的分布数列称为属性分布数列,简称品质数列。按数量标志分组形成的分布数列称为变量分布数列,简称变量数列。次数分布种类43种类例:1、某地人口的性别分布按性别分组次数人数(人)比重(%)男女154349271461329751.3748.63合计30048224100.002、学生的成绩分布学生按成绩分组x次数学生数(人)f比重(%)f/∑f60以下60-7070-8080-9090以上2820155416403010合计50100变量数列品质数列44对于品质数列来说,如果分组标志选择得好,分组标准定得恰当,则事物性质的差异表现得比较明确,总体中各组如何划分较易解决。因而属性分布数列一般也较稳定,通常均能准确地反映总体的分布特征。对于变量数列来讲,因为事物性质的差异表现得不甚明确,决定事物性质的数量界限往往因人的主观认识而异,因此按同一数量标志分组有出现多种分布数列的可能。为了使变量数列能比较准确地反映总体的分布特征.除了按照前面讲到的按数量标志分组的原理进行分组外,还需要从次数分布特征的角度,对变量数列中几个特有的问题加以讨论。种类45变量数列由各组变量值x和次数f(f/∑f)构成。变量数列的编制

1、确定变量数列的形式——根据变量的性质及特点选择不同的变量数列。2、确定组距和组数——组距=全距/组数。组数过多,组距太小,要避免将相同性质的单位分到不同组中去;反之,如果组数过少,组距太大,要避免将不同性质的单位分到同一组中去。3、确定组限——(1)客观数量界限。(2)第一组的下限和最后一组的上限。有极端值时,第一组和最后一组可采用开口组。(3)尽可能采用5或10的倍数。4、分配次数——可利用EXCEL表进行汇总。46单项数列不存在组距的问题,如表4-8所示。此时,组数等于数量标志所包含的变量值的数目。

确定组距和组数47然而当所包括的变量值较多时,单项数列显得十分繁琐,如表4-9,难以反映总体内不同性质组成部分的分布特征。这就有必要编制组距数列。确定组距和组数48若将上例根据考试成绩的不同,分为不及格与及格两组,可编成如下组距数列(如友4-10):这个数列也能说明该班统计学考试成绩的基本情况。但是,由于组数过少组距过大,第二组学生成绩相差的幅度太大,看不出学生成绩的分布特征。为了将考试成绩分布情况说明得细致些,按4分为组距分组,编成如下的组距数列(如表4-11)确定组距和组数49确定组距和组数50表4-11则显然又由于组距过小,组数过多,也难以看清学生成绩的分布特征。如果先根据考试成绩性质的不同,在60分的数量界限的基础上,再细致地分为不及格、及格、中等、良好、优秀等五个类型。并将每组组距扩大为10分,编成如下组距数列(表4-12),则基本上能准确地反映学生成绩的分布特征。确定组距和组数51由此可见,编制组距数列时,不仅要考虑各组的划分是否能区分总体内各组成部分的性质差别,还需要确定适当的组距和组数,才能准确而清晰地反映总体的分布特征。在实际进行分组时,采用等距数列或异距数列,应决定于现象的性质和研究的目的。

等距数列由于组距相同,各组次数的分布不受组距大小的影响,它和消除了组距因素影响的次数密度(即单位组距内分布的次数,也称为频数密度)的分布相一致。

确定组距和组数52表4-13中组距都是10分。因此,次数分布和次数密度的分布是一样的。确定组距和组数53如果画成直方图,图形是相同的(图4-1,①②)。确定组距和组数54

如果是异距数列,则各组次数的数值受组距不同的影响。在研究各组次数的实际分布时,要消除组距不同的影响。就是说,要按次数密度来看实际的次数分布情况。若上例按异距分组,编制组距数列如表4-14。

确定组距和组数55在这种情况下,次数密度才能准确地反映实际的次数分布情况,如果画成直方图,应该按照次数密度来画,如图4-2。

确定组距和组数56因此,从明确反映总体的分布特征考虑,编制组距数列时应尽量采用等距分组的方法。等距数列一般在社会经济现象性质差异的变动比较均衡的条件下使用。分组时,一般应依据对总体内部情况的定性分析,先确定组数,然后用变量的变动范围(即全距)除以组数,确定组距,并据以计分各组界限。设R为全距,即总体内变量最大值与最小值之差。K为组数,i为等组距。则:

(2)确定组距和组数57如上例,R=99-56=43设K=5则:i=R/K=43/5=8.6为计算方便,i宜取5或10的整倍数.故可令:i=10确定组距和组数58确定组距和组数当偏度系数不大时,用斯特吉斯(美国H.A.Sturges)经验公式确定组数:n为组数,N为总体单位数,d为组距,R为全距,即最大值(xmax)与最小值(xmin)的差。根据这个公式,可得出如下的组数参考标准:N15~2425~4445~8990~179180~359n56789当偏度系数大时,分布明显偏态时,以平均数为中心,以K倍标准差为组距。59异距数列能比较准确地反映总体内部各组成部分的性质差异。在社会经济统计总体中,有一部分现象性质差异的变动并不均衡,很难用等组距的办法近似地区分性质不同的组。再如,为研究人口总体在人生各发展阶段上的分布,就需要按照人在一生中自然的和社会的发展规律采用异距分组。例如,整理我国1982年第三次人口普查资料时采用了如下的异距分组:确定组距和组数60

确定组距和组数61异距数列的组距与组数应根据对现象本身质量关系的分析研究来确定。由于异距数列的各组往往均表明某一种性质的现象,因此可将其分布视同品质数列的分布。除非统计分析的需要,可不再考虑与次数密度分布不相一致的问题。确定组距和组数62当组距、组数确定后,只需划定各组数量界限便可编制组距数列。一般讲来,按数量分组标志分组的组限应是决定事物性质的数量界限。然而在具体划分时,尚需在遵循这一原则的前提下,从次数分布特征的角度考虑编成的组距数列是否真实地反映了总体内各个单位的实际分布特征。例如:某小组10名工人的基本工资变量资料如下(单位:元):45495456586062646970组限63设已确定分为低、中、高三个工资组,各组组距为10元(已确定组数和组距)。于是可以有如下两种划分组限的方法,形成两个分布特征不同的组距数列(表4-15、表4-16)。表4-15的分布持征反映着高工资的工人占全小组工人数的一半,中等工资的工人数持中,低工资的工人数最少。表4-16的分布特征反映着中等工资的工人占全小组工人数的一半,低工资的工人数持中,高工资的工人数最少。究竟哪一种分布特征准确?需要依据该小组工人工资变量的实际分布来检验。组限64

65可以看出,这一数轴可以分为三个区段:其中以55—65元一段变量值分布最为密集;数轴的首段,则是另外一种形态,变量值分布较为稀疏;而在数轴末段,直至70元附近才有两个变量值出现。因而可以判断,表4-15的组距数列正是由于组限划分不当将最密集的55-65段变量值拆散在两个组内,造成了高工资组分布最多的假象。组限66组距数列掩盖了分布在组内各单位的实际变量值。为了反映各组中个体单位变量值的一般水平,统计工作中往往用组中值来代表它。组中值是组内变量范围的中间数值,通常可根据备组的上限、下限进行简单平均,即:例如:组中值67

组中值68用组中值来代表组内变量值的一般水平有一个必要的前提:各单位的变量值在本组范围内呈均匀分布或在组中值两侧呈对称分布。完全具备这一条件实际上是不可能的。我们在划分各组组限时,必须考虑使各组内变量值的分布尽可能满足这一要求,以减少用组中值代表各组变量值一般水平时所造成的误差。此外,为了统计分析计算的方便,还应力求使组中值能取整齐的数值。组中值69在编制组距数列时,为了避免出现空白组,同时又能使个别变量离差较大的单位不致于无组可归,往往在首末两组使用“××以下”及“××以上”的不确定组限的形式。这种形式叫做“开口组”。为进行统计分桥,有时也要假定开口组的组限,并计算其组中值。一般可按相邻组的组距来计算“开口组”的假定的组限.然后再计算组中值。计算式为,首组假定下限=首组上限-邻组组距………………(4)末组假定上限=末组下限+邻组组距………………(5)组中值70次数是分布在各组中的个体单位数。如用相对数形式表示便是比率。比率是一种结构相对数,各组比率之和应等于1或100%。各组次数或比率的大小意味着相应的变量值在决定总体数量表现中所起的作用不同。次数或比率大的组,其变量值在决定总体数量表现中的作用就大,反之就小。

一、次数分布的特征71由于社会经济现象性质的不同,各种统计总体都有不同的次数分布,形成各种不同类型的分布特征。研究各种类型的次数分布特征对于准确认识不同社会经济性质的变量在形成总体数量表现中的作用有着重要的意义。

一、次数分布的概念72表示法——即用统计表来表示次数分布,并可列入累计次数。例如,前举某班学生统计学考分的次数分布可以列成如下的统计表4—19:次数分布的表示法1.表示法73表中:70一80分组的次数为11人,比率为27.5%,表示考分在70一80分范围内的学生共11人,占全班学生的27.5%。向上累计次数及比率是将各组次数和比率由变量值低的组向变量值高的组累计,各累计数的意义是备组上限以下的累计次或累计比率。向下累计次数及比率是将各组次数和比率由变量值高的组向变量值低的组累计,各累计数的意义是各组下限以上的累计次数或累计比率。次数分布的表示法1.表示法74图示法:即用统计图形来表示次数分布的方法。常用的有三种:直方图折线图曲线图次数分布的表示法2.图示法75直方图,即用直方形的宽度和高度来表示次数分布的图形。如锯表4-19资料可绘制直方图如图4-3。次数分布的表示法(1)直方图2.图示法76绘制直方图时,横轴表示各组组限,纵轴表示次数(一般标在左方)和比率(一般标在右方),没有比率的直方图只保留左侧次数。然后按分布在各组的次数及比率确定各组在纵轴上的坐标,并依据备组组距的宽度与次数的高度绘成直方形。次数分布的表示法2.图示法(1)直方图77遇到异距数列时,则通常按次数密度绘制直方闻以表示共分布,如图4-2所示。

直方图一般不用来表示累计次数的分布。次数分布的表示法2.图示法(1)直方图78折线图可以在直方图的基础上,用组中值与次数求坐标点连接而成,它表示次数分布的图形。如据表4-19资料可绘制折线图如图4-4。次数分布的表示法2.图示法(2)折线图79折线图还可以用来表示累计次数的分布。根据表4-19的资料可以绘制两种累计次数分布折线图,如图4-5。

次数分布的表示法2.图示法(2)折线图80累计次数分布折线图的画法和次数分布折线图有些不同。画递增累计分布折线图时,从首组下限开始,将各累计次数组的上限的纵坐标连接起来。画递减累计分布折线图时,从末组的上限开始,将各累计次数组的下限的纵坐标连接起来。次数分布的表示法2.图示法(2)折线图81当变量值非常多,变量数列的组数无限增多时,折线便近似地表现为一条平滑的曲线。曲线图是组数趋向于无限多时折线图的极限描绘,是一种理论曲线。它实质上是对应于连续变量的次数或比率分布的函数关系图。曲线图的绘制方法与折线图基本相同,只是连接各组次数坐标点的线段应当用平滑曲线而不用折线。

根据表4-19的资料,可以近似地画成如下的次数分布曲线图。如图4-6。

次数分布的表示法2.图示法(3)曲线图82

次数分布的表示法2.图示法(3)曲线图83根据表4-19的资料,也可以绘制如下两种近似的累计次数分布曲线图。如图4-7。

次数分布的表示法2.图示法(3)曲线图84洛伦茨曲线累计频数(频率)分布曲线,可用于分析社会财富、土地和工资收入等的分配是否公平的问题。该曲线图是由美国洛伦茨博士提出,故称为洛伦茨曲线。洛伦茨曲线某国家收入所得的分配情况按收入所得水平分组人口收入累计收入的(%)人口数(万人)结构%累计%月收入额(亿美元)结构%实际累计%绝对平等绝对不平等最低中下等中等较高最高128.5348.0466.945.611.012.8534.8046.694.561.112.8547.6594.3498.91001.574.0816.337.541.8851352246518709410012.8547.6594.3498.91000000100合计1000.0100.0__31.40100______8520406080100806040200100绝对平等线实际收入分配线绝对不平等线绝对不平等线人口(%)收入(%)洛伦茨曲线AB86洛伦茨曲线与基尼系数

20世纪初意大利经济学家基尼,根据洛伦茨曲线找出了判断分配平等程度的指标。实际收入分配曲线和收入分配绝对平等曲线之间的面积为A,实际收入分配曲线右下方的面积为B。以A除以A+B的商表示不平等程度。这个数值被称为基尼系数或称洛伦茨系数。87洛伦茨曲线与基尼系数当A=0时,A/(A+B)=0,则基尼系数为0,收入分配完全平等;当B=0时,A/(A+B)=1,则基尼系数为1,收入分配绝对不平等;所以,基尼系数可在0和1之间取任何值。

联合国有关组织规定:若低于0.2表示收入绝对平均;0.2-0.3表示比较平均;0.3-0.4表示相对合理;0.4-0.5表示收入差距较大;0.6以上表示收入差距悬殊。基尼系数还可用于财产、资本、资源、产品、市场等资源分配均衡程度的分析。88各种不同性质的社会经济现象都有着特殊的次数分布。概括起来,主要有下列四种类型:钟形分布水平分布U形分布J形分布

次数分布的主要类型891.钟形分布钟形分布的符征是“两头小、中间大”,即靠近中间的变量值分布的次数多,靠近两端的变量值分布的次数少。绘成曲线图,宛如一口古钟。次数分布的主要类型90钟形分布具体可分为对称分布和非对称分布。对称分布的特征是中间变量值分布的次数最多,两侧变量值分布的次数则随着与中间变量值距离的增大而渐次减少,并且围绕中心变量值两侧呈对称分布,如图4—8①。

次数分布的主要类型91对称分布中的正态分布最为重要,许多社会经济现象统计总体的分布都趋近于正态分布。例如,农业平均亩产量的分布、零件公差的分布、商品市场价格的分布等。正态分布在社会经济统计学中具有重要意义。在非对称的分布中,有不同方向的偏态,如图4—8②、②所示。关于偏态分布及其偏斜度的测定问题,将在本书第七章中论述。次数分布的主要类型92

次数分布的主要类型932.水平分布水平分布的特征是总体内各个变量值分布的次数大体相等,绘成图形,表现为一条平行于横铀的水平线,如图4-9。次数分布的主要类型94例如,某些必需而用途又比较狭窄的商品(如丧葬用品)的价格,需求弹性小,不论价格如何变化,而需求量变动不大。需求量按价格水平分组便呈现水平分布。现实生活中严格的水平分布是比较少见的,但对这种分布的研究,在统计理论上有着特殊的意义。次数分布的主要类型953.U形分布U形分布的待征与钟形分布恰恰相反,靠近两端的变量值分布的次数多,靠近中间的变量值分布的次数少,形成“两头高、中间低”的分布持征。绘成曲线图,象英文字母“U”字。图形如图4—30。次数分布的主要类型96有些社会经济现象的分布表现为U形分布,例如人口死亡率分布。由于人口总体中幼儿死亡人数和老年死亡人数均较高,而中年死亡人数最低,因而按年龄分组的人口死亡率便表现为U形分布。次数分布的主要类型974.J形分布J形分布有两种类型。正J形分布是次数随着变量值的增大而增多,绘成曲线图,犹如英文字母“J”字。反J形分布是次数随着变量值的增大而减少,绘成曲线图,犹如反写的英文字母“J”字,图形如下:次数分布的主要类型98在社会经济现象中,有一些统计总体呈J形分布。例如,资本主义社会中,投资额按利润率大小分布,一般均呈正J形分布;而人口总体按年龄大小分布,则一般均呈反J分布。次数分布的主要类型99第三章统计资料整理§1统计整理的一般问题§2统计分组§3次数分布§4数据显示100

§4数据显示

统计表统计图101统计表

将统计数据按一定的顺序排列在表格上,就形成了统计表。从广义讲,统计表包括统计工作各阶段

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论