第四章基本统计分析_第1页
第四章基本统计分析_第2页
第四章基本统计分析_第3页
第四章基本统计分析_第4页
第四章基本统计分析_第5页
已阅读5页,还剩46页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1 - 1第四章 SPSS的基本统计分析1 - 2SPSS的基本统计分析频数分析频数分析 -对应图表法对应图表法计算描述统计量计算描述统计量 -对应数值法对应数值法探索性描述分析探索性描述分析 -结合结合交叉分组下的频数分析交叉分组下的频数分析多选项分析多选项分析统计图统计图 -对应图形法对应图形法1 - 3频数分析目的粗略把握变量的总体分布状况。例: 对某个问题的总体看法,如新业务的使用愿望、教学效果等对某事物的客观描述,如通话的漫游类型、大客户的行业分布采用的方法n 制作频数分布表:包括计算 频数、累计频数、百分比、累计百分比n 绘制统计图形:条形图(品质数据)、饼图、直方图(数量数据)1 - 4频数分析基本操作步骤(1)菜单选项 :Analyze-Descriptive Statistics-Frequencies(2)选择几个待分析的变量到 variables框 .(3)chart选项,选择所需要的图形例:班级男女生频数分布表、成绩分布表1 - 5频数分析 应用举例移动通话的漫游类型分析特点:定类数据使用频数、百分比、总数 (不可缺少的 )不使用频数表中给出的累计频数和累计百分比移动通话时间分析、移动客户话费分析特点:定序数据、数量数据除使用频数、百分比、总数外,还可以充分使用累计频数和累计百分比1 - 6频数分析 数据中存在缺失值 使用有效百分比 (分母为有效样本数 ) 例:学生成绩得优率、得良率Frequencies-Format频数分布表输出按变量值、频数升序、降序输出1 - 7频数分析 频数分析中的其他分析 计算中位数、分位数 :适用于定序、定距数据数据按升序排序后,找到若干个分位点上的变量值 quartiles:计算 四分位数 25%(QL)、 50%(中位数 )、 75%(QU) cut points for n equal groups: n等份 percentile: 自定义百分位点 计算众数 :适用于定类数据(但必须是数值型)1 - 8频数分析 频数分析中的其他分析 分位数的应用 从 一个侧面比较两组样本数据的集中趋势 例: ( QL=50,QU=80) 和 (QL=70,QU=75) 的比较 在排除极端值影响的条件下,通过计算分位数差,比较两组样本数据的离散程度 例 : ( QL=50,QU=80) 和 (QL=70,QU=75) 的比较分位数、中位数、众数的应用举例不同类型的移动客户月话费比较(数据拆分)利用分位数(不显示频数分布表),比较男女生成绩集中程度1 - 9计算描述统计量目的n 精确把握变量的总体分布状况,了解数据的集中趋势、离散趋势、对称程度、陡峭程度。基本方法n 计算基本描述统计量1 - 10计算描述统计量描述集中趋势的统计量n 均值 (mean):表示某变量所有变量值集中趋势或平均水平的统计量。l 适用于定距 定比 数据。l 特点:利用了全部数据,易受极端值的影响。描述离散程度的统计量n 标准差 (standard deviation-Std Dev):表示某变量的所有变量值离散趋势的统计量。l SPSS中计算的是样本标准差。n 方差 (variance):标准差的平方。l SPSS中计算的是样本方差。n 极差 (range):最大值 (minimum)-最小值 (minimum)1 - 11计算描述统计量描述对称程度的统计量 n 偏度 (skewness):描述某变量所有变量值分布形态的偏斜程度和方向的统计量 .l偏度为 0表示 对称 ;l大于 0表示正偏差大 (右偏 ),众数比均值小,极值大于均值 ;l小于 0表示负偏差大 (左偏 )。1 - 12计算描述统计量描述陡峭程度的统计量n 峰度 (kurtosis):描述某变量所有变量值分布形态陡缓程度的统计量。l峭度为 0表示与正态分布峭度相同。l大于 0表示比正态分布陡,尖峰。l小于 0表示比正态分布缓;平峰。1 - 13计算描述统计量其他统计量 n 均值标准误差 (S.E means)l中心极限定理认为:样本均值N(u,2/n)l反映样本均值与总体真值间的平均离散程度l样本数越大,样本均值的离散程度越小,对真值的估计越准确 1 - 14计算描述统计量基本操作步骤(1)菜单选项 :Analyze-Descriptive Statistics-Descripive(2)选择将参加计算的 数值型 变量名到 Variables框。 仅适用于 数值型 变量分析比较男生和女生的学习成绩l 比较集中趋势l 比较离散趋势l 比较偏斜程度l 比较陡峭程度l 实现方式:数据拆分1 - 15其他功能n 数据标准化处理l 新变量的均值为 0,标准差为 1;l 小于 0表示在平均水平下 ,大于 0反之 .l 正态分布的数据标准化后呈标准正态分布( 68%, 95%, 99%)l save standardized values as variables选项l 将变量作标准化后 ,结果存入名为 “Z+ 原变量名” 的新变量中 .n 数据标准化处理应用举例l 快速找到移动话费出众的客户l 网通集团企业效益评价计算描述统计量1 - 16探索性描述分析目的 :在未知数据分布特点情况下 ,通过计算详尽描述统计量 ,辅助全面的统计图 ,认识数据分布。基本操作步骤(1)菜单选项 :analyze-descriptive statistics-Explore(2)选择将参加计算的 数值型 变量名到 Dependent list框(3)进行分组描述分析时,将分组变量选入 Fact list框描述统计量:M统计量:集中趋势的估计值,不受极端值影响。用于判断有无异常值。1 - 17探索性描述分析相关图形n 箱线图n 茎叶图n 直方图n 正态分布图:检验变量是否符合正态分布n 方差齐性检验:各组离散程度是否相同l H0:方差相等举例:两班学生成绩分布情况,离散程度是否相同。购买 数量 已婚者 单 身者多 31 52少 69 48列 总计 100 100个案数 700 300购买 数量男性 女性已婚者 单 身者 已婚者 单 身者多 35 40 25 60少 65 60 75 40列 总计 100 100 100 100个案数 400 120 300 180购买 数量 全部 样 本多 37.3少 62.7列 总计 100个案数 1000购买流行服装 1 - 19交叉分组下的频数分析针对定类数据和定序数据的频数分析 (用于定类定序数据分析有 custom tablelogisticloglinear)目的 :通过了解不同变量在不同水平下的数据分布情况 ,判断水平对变量是否有影响l 例:女生的学习成绩比男生好吗? (两变量 )l 不同专业的女生学习成绩都比男生好吗? (三变量 )分析的主要步骤n 产生交叉列联表n 分析列联表中变量间的关系1 - 20产生 交叉列联表什么是列联表多个变量在不同取值下的数据分布频数表列变量行变量 工商管理控制变量频数性 别 成 绩优 良 差男女1 - 21产生 交叉列联表基本操作步骤(1)菜单选项 : analyze-descriptive statistics- crosstabs(2)选择一个变量作为行变量到 row框 .(3)选择一个变量作为列变量到 column框 .(4)可选一个或多个变量作为控制变量到 layer框 .(5)是否显示各分组的条图 (display clustered bar charts )1 - 22产生 交叉列联表scale数据可做适当分组后再产生列联表仅利用频数,信息利用不充分进一步计算n cells选 项 :选择在频数分析表中输出各种百分比 .lrow:行百分比 (Row pct);lcolumn:列百分比 (Col pct);ltotal:总百分比 (Tot pct);1 - 23分析列联表中变量间的关系目的:通过列联表分析,检验行列变量之间是否独立。方法:n 卡方检验:对品质数据的相关性进行度量(这里两变量均为定类数据或定序数据)1 - 24分析列联表中变量间的关系卡方检验基本步骤(1)H0:行列变量之间无关联或相互独立(2)构造 卡方统计量统计量服从 (r-1)*(c-1)个自由度的卡方分布count:观察 (实际 )频数expected count:期望频数(期望频数反映的是 H0成立情况下的数据分布特征 )1 - 25分析列联表中变量间的关系卡方检验基本步骤(3)计算 卡方统计量的值,并得到该统计量值的概率P值(4)决策。概率 P与显著性水平比较,小于等于则拒绝 H0,否则不能拒绝实现步骤l statistics选项Pearson Chi-Square:常用于行列变量独立性检验Likelihood Ratio:可用于对数线性模型检验Fishers Exact Test: N=40, T=5, Pearson卡方检验,若P ,改用 确切概率法检验n N40,或 T5, 确切概率法检验1 - 27分析列联表中变量间的关系行列变量相关性的其他测度指标Nominal:n phi系数:在 22列联表中 ,通常 -1,1,负号无实际意义n 列联 C系数 (contingency coefficient) , 通常为 0,1)n V系数 0,1n 值越大表示行列变量的相关性越大1 - 28分析列联表中变量间的关系Ordinaln 反映定序变量一致性指标n 行变量等

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论