《差异分析》课件.ppt_第1页
《差异分析》课件.ppt_第2页
《差异分析》课件.ppt_第3页
《差异分析》课件.ppt_第4页
《差异分析》课件.ppt_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、差异分析,参数检验:t检验 方差分析:单因素方差分析 非参数检验:卡方检验,SPSS的参数检验,参数检验是推断统计的重要组成部分,是根据样本数据推断总体特征的方法,它在对样本数据描述的基础上,以概率的形式对统计总体的未知数量特征(如均值、方差等)进行表述。 利用样本数据对总体特征的推断在以下两种情况下进行 总体分布已知(如总体为正态分布)的情况下,根据样本数据对总体分布的统计参数(如均值、方差等)进行推断 总体分布未知的情况下,根据样本数据对总体的分布形式或特征进行推断,假设检验的基本思想 首先对总体参数值提出假设,然后再利用样本告之的信息区验证先前提出的假设是否成立。如果样本数据不能够充分证

2、明和支持假设,则在一定的概率条件下,应拒绝该假设;相反,如果样本数据不能充分证明和支持假设是不成立的,则不能推翻假设成立的合理性和真实性。 基本信念是小概率原理,即发生概率很小的随机事件,在某一次特定的试验中是几乎不可能发生的 上述假设检验过程有两大重要问题:第一,如何计算在假设成立的条件下样本值或更极端值发生的概率?第二,如何定义小概率事件?推断统计已经科学解决该问题。,假设检验的基本步骤 第一,提出原假设(记为H0)。根据推断检验的目标,对待推断的总体参数或分布提出一个基本假设 第二,选择检验统计量。在假设检验中,样本值(或更极端值)发生的概率并不直接由样本数据得到,而是通过计算检验统计量

3、观测值发生的概率而间接得到。这些检验统计量服从或近似服从某种已知的理论分布。对于不同的假设检验以及不同的总体条件,会有不同的选择检验统计量的理论 、方法和策略,这是统计学家研究的课题。应用中只需要依据实际,明确问题,遵循理论套用即可。,第三,计算检验统计量观测值发生的概率。选定检验统计量之后,在认为原假设成立的条件下,利用样本数据便可计算出检验统计量观测值发生的概率,即概率P-值或称为相伴概率(即指该检验统计量在某个特定的极端区域值在H0成立时的概率),该概率值间接地给出了样本值(或更极端值)在原假设成立条件下发生的概率。对此可以依据一定的标准来判定其发生的概率是否为小概率,是否是一个小概率事

4、件。,第四,给定显著性水平a,并作出统计决策。显著性水平a是指原假设正确但被错误地拒绝了的概率或风险,一般认为确定为0.05或0.01等,意味着不拒绝原假设正确的可能性(概率)为95%或99%。事实上,虽然小概率原理告诉我们,小概率事件在一次实验中是几乎不会发生的,但这并不意味着小概率事件就一定不发生。由于抽样的随机性,在一次试验中观察到小概率事件的可能性是存在的,如果遵循小概率原理而拒绝了原本正确的原假设,该错误发生的概率便是a.,得到检验统计量的概率P-值后的决策就是要判定应拒绝原假设还是不应拒绝原假设。如果检验统计量的概率P-值小于显著性水平a,则认为如果此时拒绝原假设犯错误的可能性小于

5、显著性水平a,其概率低于预先控制的水平,不太可能犯错误,可以拒绝原假设;反之,如果检验统计量的概率P-值大于显著性水平a,其概率比预先控制的水平高,很有可能犯错误,不应拒绝原假设。,SPSS的参数检验-t检验,单样本t检验:利用来自某总体的样本数据,推断该总体的均值是否与指定的检验值之间存在显著差异。它是对总体均值的假设检验。 案例5-1:利用“住房状况调查.sav”的调查数据,推断家庭人均房面积的平均值是否为20平方米。,步骤: 一、提出原假设H0为总体均值与检验值之间不存在显著差异,表述为:H0=u0,,u为总体均值,u0为检验值。 二、选择检验统计量 t 三、计算检验统计量观测值和概率p

6、-值 四、给定显著性水平a,并作出决策,两独立样本t检验:利用来自两个总体的独立样本,推断两个总体的均值是否存在显著差异。 前提:样本来自的总体服从或近似服从正态分布;两样本相互独立,即从一总体中抽取一组样本对从另一总体中抽取一组样本没有任何影响,两组样本的个案数目可以不等。,步骤: 一、提出原假设H0为总体均值与检验值之间不存在显著差异,表述为:H0:u2,-u1=0,u1 u2为第一总体和第二总体均值 二、选择检验统计量 F统计量和t统计量 三、计算检验统计量观测值和概率p-值 四、给定显著性水平a,并作出决策 案例5-3根据“住房状况调查.sav”调查数据,推断本市户口总体和外地户口总体

7、的家庭人均住房面积的平均值是否有显著差异。,SPSS的方差分析,如在制定某商品广告宣传策略时,不同组合方案所获得的广告效果是不一样的。广告效果可能会受到广告形式、地区规模、选择的栏目、播放的时间段、播放的频率等因素的影响。人们需要研究在影响广告效果的众多因素中,哪些因素是主要的,它们是如何产生影响的,哪些因素的搭配是最合理的。,这些问题的解决可以通过方差分析实现 将广告效果称为因变量(dependent variable);将广告形式、地区规模、选择的栏目、播放的时间段、播放的频率等因素成为自变量(factor);将自变量的不同类别如电视广告、广播广告成为自变量的不同水平。,方差分析正是从因变

8、量的方差入手,研究诸多自变量中哪些变量是对因变量有显著影响的变量。对因变量有显著影响的各个自变量其不同水平以及各水平的交互搭配是如何影响因变量的。 方差分析是通过推断自变量各水平下因变量的总体分布是否有显著差异来实现其分析目标。 前提:因变量各总体应服从正态分布;因变量各总体的方差应相同。 基于此,方差分析对各总体分布是否有显著差异的推断就转化成对各总体均值是否存在显著差异的推断了。,根据自变量个数可以将方差分析分成单因素方差分析、多因素方差分析、协方差分析。因变量为一个以上的方差分析称为多元方差分析。,单因素方差分析 基本思想:用来研究一个自变量的不同水平是否对因变量产生了显著影响。由于仅研

9、究单个因素对因变量的影响,因此称为单因素方差分析。如分析不同施肥量是否给农作物产量带来显著影响,考察地区差异是否会影响妇女的生育率,研究学历对工资收入的影响等。 一、明确因变量和自变量(如上述中,因变量分别是农作物产量、妇女生育率、工资收入;自变量分别为施肥量、地区、学历) 二、剖析因变量的方差 方差分析认为:因变量值的变动会受自变量和随机变量两方面的影响。据此,因变量总的离差平方和SST分解为组间离差平方SSA(由自变量的不同水平造成的变差)和与组内离差平方和SSE(由抽样误差引起的变差)两部分。SST=SSA+SSE,三、比较因变量总离差平方和各部分的比例 在因变量总离差平方和中,如果组间

10、离差平方所占比例较大,则说明因变量的变动主要是由自变量引起的,可以主要由自变量来解释,自变量给因变量带来了显著影响;反之,如果组间离差平方所占比例较小,则说明因变量的变动不是主要由自变量引起的,不可以主要由自变量来解释,自变量的不同水平没有给因变量带来显著影响,因变量值的变动是由随机变量因素引起的。,基本步骤: 一、提出原假设H0,自变量不同水平下自变量各总体的均值无显著差异,没有对因变量产生显著影响,即自变量不同水平下的效应为0 二、选择检验统计量 F统计量 三、计算检验统计量观测值和概率p-值 如果自变量对因变量造成了显著影响,因变量总的变差中自变量影响所占比例相对于随机变量比如较大,F值

11、显著大于1;反之,如果自变量没有对因变量造成显著影响,因变量的变差应归结为随机变量造成的,F值接近1. 四、给定显著性水平a,并作出决策 P-值小于显著性水平a,则应拒绝原假设,认为自变量不同水平下因变量各总体的均值存在显著差异,自变量的各个效应不应同时为0,自变量的不同水平对因变量产生了显著影响;反之,如果概率p-值大于显著性水平a,认为自变量不同水平下因变量各总体的均值无显著差异,自变量的各个效应应同时为0,自变量的不同水平没有对因变量产生显著影响,案例6-1某企业在制定某商品的广告策略时,收集了该商品在不同地区采用不同广告形式促销后的数据“广告地区与销售额.sav”,希望对广告形式和地区

12、是否对商品销售额产生影响进行分析。,单因素方差的进一步分析 一、方差齐性检验 自变量不同各水平下因变量总体方差无显著差异是方差分析的前提要求,若没有满足这个前提要求,就不能认为个总体分布相同,因此,有必要对方差是否齐性进行检验。 采用了方差同质性检验方法,其原假设是:各水平下因变量总体的方差无显著差异,其实现思路通spss两独立样本t检验中的方差检验一样,二、多重比较检验 基本分析只能判断自变量是否对因变量产生了显著影响。如果自变量确实对因变量产生显著影响,进一步还应确定自变量的不同水平对因变量的影响程度如何,其中哪个水平的作用明显别于其他水平,哪个水平的作用是不显著的。 可通过两独立样本t检

13、验解决,但无疑要比较多次,多重比较检验正是解决该类问题方法 原假设是:相应水平下自变量的均值间不存在显著差异 构造检验统计量: LSD方法:最小显著性差异,水平间的均值只要存在一定程度的微小差异就可能被检验出来,适用于各总体方差相等的情况,但没有对犯一类错误的概率问题加以有效控制,Bonferroni方法:与LSD方法基本相同,但对一类错误进行了控制,再每一次两两组的检验中,将显著性水平a除以两次检验的总次数N,使得显著性水平缩小到原有的1/N。 S-N-K方法:是一种有效划分相似子集的方法,适合于各水平自变量个数相等的情况。 案例6-2:在案例6-1结论是不同的广告形式、不同的地区对某产品的

14、销售额有显著影响。进一步希望研究,究竟哪种广告形式的作用较明显,哪种不明显。,SPSS的卡方检验,非参数检验是统计分析方法的重要组成部分,它与参数检验共同构成统计推断的基本内容。参数检验是在总体分布形式已知的情况下,对总体分布的参数如均值、方差等进行推断的方法。 非参数检验在总体分布未知或知道甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数,因而得名为“非参数”检验,总体分布的卡方检验 基本思想是根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,是一种吻合性检验,通常适用于对有多项分类值的总体分布的分析。 步骤: 一、它的原假设是:样本来自得总体分布与期望分布或某一理论分布无显著差异。,二、检验统计量用卡方检验统计量,典型的是Pearson卡方,如果x2值较大,则说明观测频数分布与期望频数分布差距较大,如果x2值较小,则说明观测频数分布与期望频数分布接近。 三、如果x2的概率p-值小于显著性水平a,则应拒

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论