第4章spss基本统计分析_第1页
第4章spss基本统计分析_第2页
第4章spss基本统计分析_第3页
第4章spss基本统计分析_第4页
第4章spss基本统计分析_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第第4章章 SPSS基本统计分析基本统计分析 4.1 频数分析频数分析4.2 计算基本描述统计量计算基本描述统计量4.3 交叉分组下的频数分析交叉分组下的频数分析4.4 多选项分析多选项分析4.5 比率分析比率分析 1 频数分析频数分析 粗略把握变量值的分布状况。例: 研究被调查者的特征(如:性别、年龄、收入) 研究被调查者对某个问题的总体看法(如:教学方式、选修课程) 研究被调查者某方面的状态(如:购买家电的类型、居民月支出状况)n计算频分布表:包括计算 频数、累计频数、百分比、累计百分比,有效百分比n绘制统计图形:条形图、饼图、直方图频数分析的基本操作频数分析的基本操作 步骤:步骤:1.1

2、.菜单:菜单:AnalyzeAnalyzeDescriptive Descriptive StatisticsStatisticsFrequenciesFrequencies2.2.将若干频数分析变量选择到将若干频数分析变量选择到VariablesVariables框框中中3.3.单击单击Statistics ,选择其他基本描述统计选择其他基本描述统计量;单击量;单击ChartsCharts,选择绘制统计图形;单,选择绘制统计图形;单击击FormatFormat, ,对频数分布表的格式进行调整对频数分布表的格式进行调整案例:案例:利用住房状况调查数据,分析被利用住房状况调查数据,分析被调查家庭

3、中户主的从业状况、目前所住调查家庭中户主的从业状况、目前所住房屋的产权情况。房屋的产权情况。案例:案例:分析人均住房面积的分布情况,并对分析人均住房面积的分布情况,并对本市和外地户口家庭进行比较。本市和外地户口家庭进行比较。 该分析的特点是:该分析的特点是:涉及的变量是定距型变量涉及的变量是定距型变量需要分别对本市和外地户口的家庭进行分析需要分别对本市和外地户口的家庭进行分析利用频数分析的扩展功能进行分析利用频数分析的扩展功能进行分析 分析思路:分析思路:由于人均住房面积是定距型变量,直接采用频数分由于人均住房面积是定距型变量,直接采用频数分布不利于对其分布形态的把握,因此考虑对数据分组布不利

4、于对其分布形态的把握,因此考虑对数据分组后再编制频数分布表。后再编制频数分布表。进行数据拆分,分别计算本市和外地家庭的人均住进行数据拆分,分别计算本市和外地家庭的人均住房面积的四分位数,并通过四分位数比较两者分布上房面积的四分位数,并通过四分位数比较两者分布上的差异。的差异。 分析过程:分析过程:数据分组。将人均住房面积重新分成四组。四数据分组。将人均住房面积重新分成四组。四组的区间分别为:组的区间分别为:1010平方米以下、平方米以下、10102020平方米、平方米、20203030平米、平米、30304040平米、平米、4040平米以上。进行频平米以上。进行频数分析并绘制带正态曲线的直方图

5、。数分析并绘制带正态曲线的直方图。利用频数分析计算所有样本的人均住房面积的利用频数分析计算所有样本的人均住房面积的四分位数,然后,按照户口类型对数据进行拆分四分位数,然后,按照户口类型对数据进行拆分(Split fileSplit file)并重新计算分位数,分别得到本)并重新计算分位数,分别得到本市和外地户口家庭人均住房面积的四分位数。市和外地户口家庭人均住房面积的四分位数。案例:案例:分析人均住房面积的分布情况,并对分析人均住房面积的分布情况,并对本市和外地户口家庭进行比较。本市和外地户口家庭进行比较。第第4章章 SPSS基本统计分析基本统计分析 4.1 频数分析频数分析4.2 计算基本描

6、述统计量计算基本描述统计量4.3 交叉分组下的频数分析交叉分组下的频数分析4.4 多选项分析多选项分析4.5 比率分析比率分析集中趋势分析:集中趋势分析:均值:一组数据的简单算术平均数或加权算术平均数。适均值:一组数据的简单算术平均数或加权算术平均数。适合于正态分布或对成分布资料;中位数:将数据排序后位合于正态分布或对成分布资料;中位数:将数据排序后位于正中间的数值。适合于所有分布类型的数据;众数:出于正中间的数值。适合于所有分布类型的数据;众数:出现频率最高的数。现频率最高的数。离散趋势分析离散趋势分析极差:数据最大值减去最小值,最简单的离散程度测度值极差:数据最大值减去最小值,最简单的离散

7、程度测度值标准差、方差:最常用的离散程度测侧度值,一般适合于标准差、方差:最常用的离散程度测侧度值,一般适合于正态分布资料正态分布资料最小值、最大值最小值、最大值标准误:样本平均数的标准差标准误:样本平均数的标准差偏度、峰度测量偏度、峰度测量偏度系数:偏度系数:Skew nessSkew ness峰度系数:峰度系数:KurtosisKurtosis计算基本描述统计量的基本操作计算基本描述统计量的基本操作 步骤:步骤:1.1.菜单:菜单:AnalyzeAnalyzeDescriptive Descriptive StatisticsStatistics DescriptiveDescriptiv

8、e2.2.将若干频数分析变量选择到将若干频数分析变量选择到VariablesVariables框框中中案例:对人均住房面积计算基本描述统案例:对人均住房面积计算基本描述统计量,并分别对本市户口和外地户口家计量,并分别对本市户口和外地户口家庭进行比较。庭进行比较。先按照户口状况进行拆分(先按照户口状况进行拆分(Split file),然),然后再计算基本描述统计量后再计算基本描述统计量案例:分析人均住房面积是否存在不均案例:分析人均住房面积是否存在不均衡现象。衡现象。也就是分析人均住房面积是否有大量异常值。也就是分析人均住房面积是否有大量异常值。若人均住房面积(若人均住房面积( )服从正态分布,

9、则:)服从正态分布,则:ix) 1 , 0( Nxxzii%7 .993xxzPii原则认为正态分布中大概有原则认为正态分布中大概有0.30.3的异常值,超的异常值,超过这个标准就认为数据分布不均衡。过这个标准就认为数据分布不均衡。3P案例:分析人均住房面积是否存在不均案例:分析人均住房面积是否存在不均衡现象。衡现象。分析过程:分析过程:1 1、计算人均住房面积的标准化值:、计算人均住房面积的标准化值:Z Z人均面积人均面积;2 2、用计数功能找出、用计数功能找出 Z Z人均面积人均面积 3 3的个案,计算的个案,计算其比例并进行判断。其比例并进行判断。第第4章章 SPSS基本统计分析基本统计

10、分析 4.1 频数分析频数分析4.2 计算基本描述统计量计算基本描述统计量4.3 交叉分组下的频数分析交叉分组下的频数分析4.4 多选项分析多选项分析4.5 比率分析比率分析目的目的: 通过频数分析能够掌握单个变量的数据分布情通过频数分析能够掌握单个变量的数据分布情况。实际分析中,不仅要了解单变量的分布特征,况。实际分析中,不仅要了解单变量的分布特征,还要分析多个变量不同取值下的分布,掌握多变还要分析多个变量不同取值下的分布,掌握多变量的联合分布特征,进而分析变量之间的相互影量的联合分布特征,进而分析变量之间的相互影响和关系。响和关系。例:学习成绩与性别有关联吗?(两变量)例:职业、性别、爱逛

11、商店有关联吗?(三变量) 基本任务基本任务: 两大基本任务:两大基本任务: 第一是第一是 编制交叉列联表编制交叉列联表 根据收集到的样本数据,产生二维或多维根据收集到的样本数据,产生二维或多维交叉列联表;交叉列联表; 第二在交叉列联表的基础之上,对两两变量间第二在交叉列联表的基础之上,对两两变量间是否存在一定的相关性进行分析。是否存在一定的相关性进行分析。交叉列联表的主要内容交叉列联表的主要内容 编制交叉列连表是交叉分组下频数分析的第一编制交叉列连表是交叉分组下频数分析的第一个任务。交叉列联表是两个或两个以上的变量交个任务。交叉列联表是两个或两个以上的变量交叉分组后形成的频数分布表。叉分组后形

12、成的频数分布表。户口 * 什么合算 Crosstabulation1138720056.5%43.5%100.0%65.7%79.1%70.9%59238272.0%28.0%100.0%34.3%20.9%29.10%39.0%100.0%100.0%100.0%100.0%Count% within 户 口% within 什 么 合 算Count% within 户 口% within 什 么 合 算Count% within 户 口% within 什 么 合 算城 镇 户 口农 村 户 口户 口Total买 东 西存 钱什 么 合 算Total户口 * 什么

13、合算 Crosstabulation1138720056.5%43.5%100.0%65.7%79.1%70.9%59238272.0%28.0%100.0%34.3%20.9%29.10%39.0%100.0%100.0%100.0%100.0%Count% within 户 口% within 什 么 合 算Count% within 户 口% within 什 么 合 算Count% within 户 口% within 什 么 合 算城 镇 户 口农 村 户 口户 口Total买 东 西存 钱什 么 合 算Total 这是一张涉及两变量的二维交叉列联表,反映这

14、是一张涉及两变量的二维交叉列联表,反映了不同户口的储户对储蓄是否合算的不同看法。了不同户口的储户对储蓄是否合算的不同看法。表中的表中的户口变量户口变量称为行变量,称为行变量,什么合算什么合算称为列变称为列变量。行标题和列标题分别是两个变量的变量值量。行标题和列标题分别是两个变量的变量值(或分组值)。表格中间是观测频数和各种百分(或分组值)。表格中间是观测频数和各种百分比。比。三维列联表有层变量三维列联表有层变量交叉列联表的卡方检验交叉列联表的卡方检验 卡方检验属于假设检验的范畴,有四个步骤:卡方检验属于假设检验的范畴,有四个步骤:1 1、建立零假设(、建立零假设( )列联表分析中卡方检验的零假

15、设为行变量与列变列联表分析中卡方检验的零假设为行变量与列变量独立。量独立。2 2、选择和计算检验统计量、选择和计算检验统计量列联表分析卡方检验的检验统计量是列联表分析卡方检验的检验统计量是PearsonPearson卡卡方统计量,其数学定义为:方统计量,其数学定义为:0Hricjeijeijijfff1122021) 1()()(列数行数交叉列联表的卡方检验交叉列联表的卡方检验 ricjeijeijijfff1122021) 1()()(列数行数3 3、确定显著性水平和临界值、确定显著性水平和临界值4 4、结论和决策、结论和决策 例:分析本市和外地家庭对例:分析本市和外地家庭对“未来三年是否打

16、未来三年是否打算买房算买房”是否持相同的态度。是否持相同的态度。 其中,其中,r r为列联表的行数,为列联表的行数,c c为列联表的列数;为列联表的列数; 为观察频数,为观察频数, 为期望频数。期望频数的分布反为期望频数。期望频数的分布反映的是行列变量互不相干下的分布。映的是行列变量互不相干下的分布。0ijfeijfnCTRTfe)(步骤:步骤:1.1.菜单:菜单:AnalyzeAnalyzeDescriptive Descriptive StatisticsStatisticsCrosstabsCrosstabs2.2.分别选定行变量和列变量。分别选定行变量和列变量。3.3.选择选择Disp

17、lay clustered bar chartsDisplay clustered bar charts,指定绘制各变量指定绘制各变量交叉分组下频数分布柱型图。交叉分组下频数分布柱型图。Suppress tablesSuppress tables表示不输表示不输出列联表,在仅分析行列变量间关系时可选择。出列联表,在仅分析行列变量间关系时可选择。4.4.单击单击CellsCells,指定列联表单元格中的输出内容。,指定列联表单元格中的输出内容。5.5.单击单击FormatFormat指定列联表各单元的输出排列顺序。指定列联表各单元的输出排列顺序。6.6.单击单击StatisticsStatist

18、ics指定用哪种方法分析行变量和列变量之指定用哪种方法分析行变量和列变量之间的关系。间的关系。第第4章章 SPSS基本统计分析基本统计分析 4.1 频数分析频数分析4.2 计算基本描述统计量计算基本描述统计量4.3 交叉分组下的频数分析交叉分组下的频数分析4.4 多选项分析多选项分析4.5 比率分析比率分析什么是多选项问题什么是多选项问题 SPSS SPSS中的多选项分析是针对问卷调查中的多选中的多选项分析是针对问卷调查中的多选题的,多选项问题在问卷调查中普遍存在,它是题的,多选项问题在问卷调查中普遍存在,它是根据实际调查需要,要求被调查者从问卷给出的根据实际调查需要,要求被调查者从问卷给出的

19、若干个可选答案中选择一个以上的答案。若干个可选答案中选择一个以上的答案。如何处理多选项问题如何处理多选项问题第一,将多选项问题分解;第一,将多选项问题分解;第二,利用频数分析或交叉分组下的频数分析等第二,利用频数分析或交叉分组下的频数分析等方法进行分析。方法进行分析。多选项问题的分解多选项问题的分解 用用SPSSSPSS进行问卷处理时,单选题可以一个问进行问卷处理时,单选题可以一个问题设为一个变量,变量值为该问题的回答。对于题设为一个变量,变量值为该问题的回答。对于多选项问题由于答案不止一个,和单选题的处理多选项问题由于答案不止一个,和单选题的处理就不一样了。就不一样了。 解决多选项问题的思路

20、解决多选项问题的思路是将问卷中的一道多是将问卷中的一道多选题分解成若干问题,对应设置若干选题分解成若干问题,对应设置若干SPSSSPSS变量,变量,分别存放描述这些问题的几个可能被选择的答案。分别存放描述这些问题的几个可能被选择的答案。这样,对一个多选项问题的分析就可以转化成对这样,对一个多选项问题的分析就可以转化成对多个问题的分析,也就是对多个多个问题的分析,也就是对多个SPSSSPSS变量的分析。变量的分析。多选项问题的分解方法多选项问题的分解方法多选项二分法多选项二分法 是将多选项问题中的每个答案设为一个是将多选项问题中的每个答案设为一个SPSSSPSS变变量,每个变量只有量,每个变量只

21、有0 0或或1 1两个取值,分别表示选择了两个取值,分别表示选择了该答案和不选择该答案。该答案和不选择该答案。 例如,高考志愿的调查中,志愿选择有例如,高考志愿的调查中,志愿选择有6 6个答个答案案,(,(1 1)北大;()北大;(2 2)清华;()清华;(3 3)人大;()人大;(4 4)北京理工;(北京理工;(5 5)北师大;()北师大;(6 6)北外。对应设置)北外。对应设置6 6个个SPSSSPSS变量,取值为变量,取值为1 1或或0 0。多选项二分法多选项二分法SPSS变量名变量名变量名标签变量名标签变量值变量值V1V1 报考北大吗报考北大吗0/10/1V2V2报考清华吗报考清华吗0

22、/10/1V3V3报考人大吗报考人大吗0/10/1V4V4报考北京理工吗报考北京理工吗0/10/1V5V5报考北师大吗报考北师大吗0/10/1V6V6报考北外吗报考北外吗0/10/1多选项分类法多选项分类法 多选项分类法中,首先应估计多选项问题最多多选项分类法中,首先应估计多选项问题最多可能出现的答案个数;然后,为每个答案设置为一可能出现的答案个数;然后,为每个答案设置为一个个SPSSSPSS变量,变量取值为多选项问题中的可选答案。变量,变量取值为多选项问题中的可选答案。 例如,高考志愿的调查中,由于问卷要求被例如,高考志愿的调查中,由于问卷要求被调查者选择三个答案,所以可设置三个调查者选择三

23、个答案,所以可设置三个SPSSSPSS变量,变量,分别表示志愿一、志愿二、志愿三,变量取值是分别表示志愿一、志愿二、志愿三,变量取值是1 16 6,依次对应于,依次对应于北大;清华;人大;(北大;清华;人大;(4 4)北京)北京理工;北师大;北外。理工;北师大;北外。多选项分类法多选项分类法SPSS变量名变量名变量名标签变量名标签变量值变量值V1V1 志愿一志愿一1/2/3/4/5/61/2/3/4/5/6V2V2志愿二志愿二1/2/3/4/5/61/2/3/4/5/6V3V3志愿三志愿三1/2/3/4/5/61/2/3/4/5/6 多选项二分法与多选项分类法各有利弊。在高多选项二分法与多选项

24、分类法各有利弊。在高考志愿的调查中,采用多选项二分法,对变量考志愿的调查中,采用多选项二分法,对变量V1V1至至V6V6作频数分析,就能很方便地分析出各个学校的考作频数分析,就能很方便地分析出各个学校的考生报考情况,但是不能体现考生志愿的填报顺序信生报考情况,但是不能体现考生志愿的填报顺序信息;如果采用多选项分类法分解,对变量息;如果采用多选项分类法分解,对变量V1V1至至V3V3作作频数分析,就能很方便地分析出考生在各个志愿中频数分析,就能很方便地分析出考生在各个志愿中的报考学校情况,但不便于分析各个学校的考生报的报考学校情况,但不便于分析各个学校的考生报考情况。考情况。 在选择多选项问题的

25、分解方法时,应考虑到具在选择多选项问题的分解方法时,应考虑到具体问题和具体分析目标,在避免信息丢失的前提下,体问题和具体分析目标,在避免信息丢失的前提下,减少稀疏数据。减少稀疏数据。 对多选项问题分解后,就可以进行频数分析了。对多选项问题分解后,就可以进行频数分析了。首先应定义多选项变量集,即将多选项问题分解并首先应定义多选项变量集,即将多选项问题分解并设置成多个变量后,指定这些变量为一个集合。只设置成多个变量后,指定这些变量为一个集合。只有通过定义多选项变量集,有通过定义多选项变量集,SPSSSPSS才能确定应对才能确定应对那些那些变量取相同值的个案数进行累加。(原因变量取相同值的个案数进行

26、累加。(原因p.96p.96) 定义多选项变量集的基本操作:定义多选项变量集的基本操作:1.1.菜单:菜单:AnalyzeAnalyzeMultiple Response Multiple Response Define SetsDefine Sets。2.2.将进入多选项变量集的变量选择到将进入多选项变量集的变量选择到Variables in SetsVariables in Sets中。中。3.3.在在Variables Are Coded AsVariables Are Coded As中中指定多选项变量集中的变量指定多选项变量集中的变量是按照哪种方法分解的。是按照哪种方法分解的。4.4

27、.为多选项变量集命名。为多选项变量集命名。5.5.单击单击AddAdd将定义好的多选项变量集加到将定义好的多选项变量集加到Mult Response SetsMult Response Sets中。中。 定义多选项变量集完成后,便可进行多选项频定义多选项变量集完成后,便可进行多选项频数分析了。数分析了。1.1.菜单:菜单:AnalyzeAnalyzeMultiple Response Multiple Response FrequenciesFrequencies。2.2.把待分析的变量集选择到把待分析的变量集选择到Tables ForTables For中。中。3.3.指定是否处理缺失数据。

28、指定是否处理缺失数据。SPSSSPSS规定,只要样本在规定,只要样本在多选项变量集中的某一个变量上取缺失值,分析时多选项变量集中的某一个变量上取缺失值,分析时就将该样本剔除。就将该样本剔除。 除多选项频数分析外,除多选项频数分析外,SPSSSPSS还可对多选项问题还可对多选项问题进行多选项交叉分组下的频数分析。进行多选项交叉分组下的频数分析。1.1.菜单:菜单:AnalyzeAnalyzeMultiple Response Multiple Response CrosstabsCrosstabs。2.2.选择列联表的行变量并定义取值范围,或选多选选择列联表的行变量并定义取值范围,或选多选项变量

29、集为行变量。项变量集为行变量。3.3.选择列联表的列变量并定义取值范围,或选多选选择列联表的列变量并定义取值范围,或选多选项变量集为列变量。项变量集为列变量。4.4.选择列联表的控制变量并定义取值范围,或选多选择列联表的控制变量并定义取值范围,或选多选项变量集为控制变量。选项变量集为控制变量。5.5.单击单击OptionOption按钮选择列联表的输出内容和计算方按钮选择列联表的输出内容和计算方法。法。多选项分析的应用举例多选项分析的应用举例 利用保险市场调查数据进行分析,实现以下两利用保险市场调查数据进行分析,实现以下两个分析目标:个分析目标:分析老年人购买养老保险的原因(案例分析老年人购买养老保险的原因(

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论