试验设计与数据处理课件_第1页
试验设计与数据处理课件_第2页
试验设计与数据处理课件_第3页
试验设计与数据处理课件_第4页
试验设计与数据处理课件_第5页
已阅读5页,还剩250页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试验设计与数据处理

第一章绪论科学试验:是一种计划好的调查或试验研究,是以获得新的事实和证据得出试验结论为基本目的,它有助于发现新规律、新材料和新方法,推动技术的开发与利用,提高研究和决策的正确性。科学方法:任何一项研究工作都要依据事实,建立有检验有逻辑的试验方法,并对其结果假设作出客观的正确评价,这种手段和方法称为科学方法。

第一节试验的意义一、试验是正确认识事物的基本环节和科学方法正确认识事物包括:1、想象或理想:根据初步实践或别人的经验想象。2、演绎:逻辑推理。3、试验:科学试验和调查研究。4、归纳:试验结果的统计分析检验,得到新的认识。在此基础上,四个环节循环往复,推动科技的发展。

二、试验设计是认识事物本质的工具1、试验设计是认识事物的安排方法。2、统计分析(数据处理)是对数据进行整理、精炼,估计试验误差、精度,找到真值和置信区间,提供各种关系表达式,提高综合认识事物的能力和科学预见性。

第二节试验的科学性一、试验思想的先进性

试验的前提是选好课题,只有选好课题才能体现试验思想的先进性,再配合科学的方法,才能取得良好的效果。选题是科学研究的起点,决定主攻方向和研究目标,它属于战略性的决策。

爱因斯坦说“提出一个问题往往比解决一个问题更重要,因为解决问题也许仅是一个数学上或实验上的技能而已。而提出一个新的问题,产生新的可能性,从新的角度去看旧的问题,却需要有创造性的想象力,而且标志着科学的真正进步”。

二、试验条件的典型性

林业和水土保持比较复杂,在一次试验中不可能做哪么多的试验组合。因此,在安排试验前要认真考虑,力求使自然条件、试验材料和方法措施都具有代表性,这就是试验的典型性。它要求试验与生产相结合,做到切实可行,并取得良好的效果。三、试验数据的精确性1、试材来源可靠2、试验数据可靠3、误差的控制四、试验结果的重现性

足够的重复和试验次数可以保证提高试验结果的重现性。

第三节试验研究的选题与申报一、选题

选题是否正确直接关系到科研工作的成败与水平。选题应遵循以下三个原则:(一)客观性原则

选择研究课题,无论是基础研究,或应用基础研究,还是应用研究,都要求课题是客观存在的。因此,选题必须坚持客观第一性观点。

(二)创造性原则

创造是科学研究的基本特点,科学研究必须是在前人研究的基础上向前发展,形成新的创造、新的突破和新的闪光点,并建立新的理论与技术。(三)生产性原则

应用研究的根本目的是促进生产的发展,提高生产力。所以应用研究必须满足生产实践的需要,解决生产中存在的重大问题,推动生产的发展。

二、编制研究计划(一)研究计划的编制(科研项目申请书)

1、研究的目的意义

2、国内外研究现状和发展趋势

3、研究内容及创新点

4、技术路线与研究方法

5、预期的成果、应用前景及效益

6、进度安排

7、研究的基础与条件

8、承担单位及研究人员

9、经费预算二、试验因素:指可能影响试验指标的条件。1、影响土壤侵蚀的因素:降雨量、雨强;地形、坡度、坡长;耕作方式;植被类型等。2、影响苗木产量的因素:施肥量、灌水量、种植密度等。3、影响幼树成活生长的因素:树种特性(抗旱性、耐涝性、喜光性、耐荫性、速生性等);苗木质量(根系、地径、树高);立地条件(土壤水分、土壤养分等)。三、处理与水平:1、在单因素试验中,将因素分成不同的等级,称为处理或水平。如研究同一立地条件上不同树种的造林造林技术时,树种为处理或水平。2、在双因素或多因素试验中,各因素的不同等级,称为水平;各水平的组合,称为处理组合(简称处理)。如苗圃水肥调控试验,灌水因素有A1和A2

两个水平,施肥因素有B1和B2

两个水平。处理组合为A1B1、

A1B2、

A2B1和A2B2。。四、试验的基本要求1、明确试验目的,选择试验对象;2、确定试验因素和水平;3、采用适宜的试验设计方法布设试验;4、对试验指标进行测定和记录;5、汇总和整理数据,用SPSS软件对数据进行统计分析;6、得出试验结果,并对其进行分析和评价。。第二节试验误差及其控制一、试验误差:按照误差产生的原因及性质,可分为系统误差和随机误差。1、系统误差也称片面误差,指试验处理以外的其它条件明显不一致所造成的误差。它是由于试验的初始条件相差较大,立地条件不同,苗木参差不齐、修剪、施肥、灌水、松土锄草不一致,测量的仪器不准、标准试剂未经校正,以及观测、记载、抄录、计算中的错误所引起。系统误差影响试验的准确性。2、随机误差:指通过控制,使试验条件相对一致后不能消除的误差。它是由许多无法控制的内在和外在的偶然因素所造成。随机误差带有偶然性质,在试验中,即使十分小心也难以消除。随机误差影响试验的精确性。如苗木大小、土壤肥力、水分不均匀性,试验小区的微小差异,病虫害的影响等。这种误差有时大,有时小,有时正,有时负,方向不定。当测量次数足够多时,随机误差完全符合统计规律,误差的大小和正负是由概率决定的。二、误差来源1、试验材料固有的差异试验中所采用的试验材料,在遗传和生长发育等方面存在的差异,如试验材料基因、种子大小或苗木大小的差异等等。2、管理和操作不一致所引起的差异试验过程中整地、种子处理、播种、间苗、施肥、灌水、起苗、栽植、松土除草、修枝不一致所造成的差异;观测时间和仪器操作不一致所造成的误差。3、外界条件的差异

试验地土壤结构、质地、理化性质及肥力的差异,地势高低起伏,生物群落不同;病虫害不同,人畜践踏,风雨影响等的试验误差。这些误差较难控制。因此,要选择合适的试验地,并采用适宜的试验设计和精确的小区技术,使误差减少到最小程度。三、控制误差的途径1、选择均匀一致的试验材料,控制试验材料误差树木是多年生的木本植物,繁殖方法不同,如种子繁殖和营养繁殖,种子繁殖的苗木变异很大,扦插、嫁接繁殖因插穗、砧木及接穗的差异,必然引起植株的差异,加之多年环境(气候、土壤等)差异的积累,试验材料差异很大。因此,造林试验应选择同一年龄、同一繁殖方法、生长健壮、整齐一致的苗木作为试验材料,控制试验材料误差。2、选择有代表性的试验地,控制外界环境条件

不一致引起的差异(1)选择有代表性的试验地试验地的自然条件因具有典型性,能代表该地区的气候、地势、土壤等方面。山区试验地要考虑地形、坡向、坡度、海拔及土壤水分、温度等因子,尽可能选环境条件一致的试验地。(2)试验地不要太靠近大的建筑物、公路、铁路、水塘等,以免受遮荫、人畜践踏和积水的影响。

4、选择适宜的试验设计方法控制误差

(1)调查分析试验地的环境影响因子,从中找出差异较大的主导因子。

(2)根据主导因子的差异,选择适宜的 试验设计方法对误差进行控制。3、改进管理和操作技术控制误差(1)管理的质量和数量要一致。(2)技术操作要一致。第四节试验设计的原则与小区、区组设置技术一、试验设计的原则(一)重复(replication)指在一个试验中每个处理出现的次数或同一处理安排的小区数。其作用为:

1、估算试验误差:如果两个处理各有一个重复,则二者之间的差异只有一个数值,无法判断这一差异是由两处理本身产生的,还是由试验误差的。如果每个处理设置两个或两个以上的重复,则可以断定同一处理间的差异是由不易控制的试验误差引起的。因此,试验重复可以估算误差。2、降低试验误差,提高试验的精确性平均数标准误Sx=S/√n,即误差的大小与重复次数的平方根成反比,重复次数多误差小。通过增加重复次数,增大自由度,可降低显著性水平的临界值,从而易反映处理间的差异。所以,重复能提高试验的精确性。3、扩大试验的代表性只有增加重复才能得到代表性较大的试验结果,为示范和推广提供科学依据。一般来说,苗圃试验设5-10个重复,造林试验占地面积大,可设10-20个重复。(二)随机排列:

指处理的重复或小区排列次序的随机化。在统计分析中,如果从总体中随机抽取样本,对每个样本随机地施以不同的处理,或把各个处理随机地安排在试验小区上,就满足了观测值及误差的独立分布,使差异显著性检验有效,这就是随机排列的作用。如果用随机排列和重复相结合,就能提供无偏的试验误差估计值。随机排列可用抽签法和随机数字表进行。(三)局部控制

指在试验地内分段控制非处理因素的差异,使各种非处理因素的影响趋于一致,致从而减少试验误差,提高试验的精确性。重复虽能降低误差,但由于重复的增加,试验面积增大,某一主要影响因素,如土壤水分或肥力的差异随之增大,这样,即使增加重复次数,也不会有效地降低误差。因此,造林时可将试验地(土壤水分的高低)按重复次数划分为几个区组,使同一区组内的土壤水分基本相同,区组之间差异较大。这就要采用局部控制的原则。二、试验小区、重复和区组的设置技术(一)试验小区:在试验中,安排一个处理的小块地段称为小区。1、小区的大小适当的增加小区面积会减少误差,当小区面积增加到一定程度后,试验误差的降低就不明显。对于一块一定面积的试验地而言,增大小区面积势必减少重复次数,从而降低试验的精确性。因此,小区面积应按试验的性质和要求、试验材料和试验地环境条件等进行确定。一般来说,造林试验小区面积为1-2亩,生产试验小区面积可扩大到5亩以上。2、小区的形状和方向

(1)形状:一般为长方形和正方形。在通常情况下,长方形小区的试验误差比正方形小。(2)方向:在坡地,小区的方向应与坡面上下方向平行;风大的地区,小区的方向应与主风向平行。设计时作到小区与小区之间的条件一致,可降低误差,提高试验的精确性。就林木而言,小区的株数为:乔木4—20株,灌木20—40株,苗圃苗木50—100株。果树研究也可用单株小区。小区的排列按随机法进行排列。(二)重复次数重复次数应按精确度的要求、试验地的立地条件、小区的大小等具体条件而定,当精确度要求高、立地条件差异大、小区面积较小时,重复次数应增多,否则可少些。对造林试验而言,一般设置5—10个重复。(三)设置对照区试验研究中,常把对照作为与处理比较的标准。目的是:有利于观察比较和衡量处理的优劣;估计和矫正试验地土壤的好坏。设置对照的方式为随机排列设置。数理统计分析内容简介

统计分析最重要的内容是差异显著性检验。通过抽样调查或控制试验,获得的是具有变异的资料。因此,需要对处理进行比较,例如不同品种、不同造林方法间有实质性的差异或是由于无法控制的偶然因素所引起的?显著性检验的目的就在于承认并尽量排除这些无法控制的偶然因素的干扰,将处理间是否存在本质差异揭示出来。显著性检验的方法很多,常用的有:

t检验——主要用于检验两个处理平均数差异是否显著;

方差分析——主要用于检验多个处理平均数间差异是否显著;

统计分析的另一个重要内容是对试验指标间的关系进行研究,或者研究它们之间的联系性质和程度,或者寻求它们之间的联系形式,即进行相关分析与回归分析。通过对资料进行相关、回归分析,可以揭示出试验指标间的内在联系,为进一步研究或生产提供强有力的依据。

第一节统计分析常用术语

一、总体与样本根据研究目的确定的研究对象的全体称为总体(population);总体中的一个研究单位称为个体(individual);总体的一部分称为样本(sample);

样本中所包含的个体数目叫样本容量或大小(samplesize),样本容量常记为n。通常把n≤30的样本叫小样本,n>30的样本叫大样本。研究的目的是要了解总体,然而能观测到的却是样本,通过样本来推断总体是统计分析的基本特点。

为了能可靠地从样本来推总体,要求样本具有一定的容量和代表性。只有从总体随机抽取的样本才具有代表性。所谓随机抽取(randomsampling)的样本是指总体中的每一个个体都有同等的机会被抽取组成样本。样本毕竟只是总体的一部分,尽管样本具有一定的容量和有代表性,通过样本来推断总体也不可能是百分之百的正确。有很大的可靠性,但有一定的错误率这是统计分析的又一特点。

二、参数与统计量

为了表示总体和样本的数量特征,需要计算出几个特征数。由总体计算的特征数叫参数(parameter);由样本计算的特征数叫统计量(staistic)。常用希腊字母表示参数,例如用μ表示总体平均数,用σ表示总体标准差;常用拉丁字母表示统计量,例如用表示样本平均数,用S表示样本标准差。

下一张

主页

退出

上一张

总体参数由相应的统计量来估计,例如用估计μ,用S估计σ等。

三、准确性与精确性

准确性(accuracy)也叫准确度,指在调查或试验中某一试验指标或性状的观测值与其真值接近的程度。设某一试验指标或性状的真值为μ,观测值为

x,若x与μ相差的绝对值|x-μ|小,则观测值x的准确性高;反之则低。

精确性(precision)也叫精确度,指调查或试验中同一试验指标或性状的重复观测值彼此接近的程度。若观测值彼此接近,即任意二个观测值xi

、xj

相差的绝对值|xi-xj|小,则观测值精确性高;反之则低。调查或试验的准确性、精确性合称为正确性。

在调查或试验中应严格按照调查或试验计划进行,准确地进行观测记载,力求避免人为差错,特别要注意试验条件的一致性,即除所研究的各个处理外,供试的初始条件如品种、立地条件、管理措施等应尽量控制一致,并通过合理的调查或试验设计努力提高试验的准确性和精确性。

由于真值μ常常不知道,所以准确性不易度量,但利用统计方法可度量精确性。第二节t检验

统计推断是根据样本和假定模型对总体作出的以概率形式表述的推断,它主要包括假设检验(testofhypothesis)和参数估计(parametricestimation)二个内容。

假设检验又叫显著性检验(testofsignificance)。下面以两个平均数的差异显著性检验为例来阐明显著检验的原理,介绍几种t检验的方法,然后介绍总体参数的区间估计(intervalestimation)。

一、显著性检验的基本原理(一)显著性检验的意义随机抽测10株油松苗木和10株樟子松苗木的高度(cm),数据如下:油松苗木:11,11,9,12,10,13,13,

8,10,13

樟子松苗木:8,11,12,10,9,8,8,

9,10,7

经计算,得油松苗木平均高x1=11cm,标准差S1=1.76cm;樟子松苗木平均高x2=9.2cm,标准差S2=1.549cm。

能否仅凭这两个平均高的差值-=1.8cm,立即得出两树种苗木高度不同的结论呢?统计学认为,这样得出的结论是不可靠的。这是因为如果我们再分别随机抽测10株油松苗木和10樟子松苗木的高度,又可得到两个样本资料。由于抽样误差的随机性,两样本平均数就不一定是11cm和9.2cm,其差值也不一定是1.8cm。造成这种差异可能有两种原因,一是树种造成的差异,即是油松与樟子松本质不同所致,另一可能是试验误差(或抽样误差)。

对两个样本进行比较时,必须判断样本间差异是抽样误差造成的,还是本质不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这正是显著性检验要解决的问题。两个总体间的差异如何比较?一种方法是研究整个总体,即由总体中的所有个体数据计算出总体参数进行比较。这种研究整个总体的方法是很准确的,但常常是不可能进行的,因为总体往往是无限总体,或者是包含个体很多的有限总体。因此,不得不采用另一种方法,即研究样样本,通过样本研究其所代表的总体。例如,设油松苗木高度的总体平均数为,樟子松苗木高度的总体平均数为,试验研究的目的,就是要给、是否相同做出推断。由于总体平均数、未知,在进行显著性检验时只能以样本平均数、作为检验对象,更确切地说,是以(-)作为检验对象。为什么以样本平均数作为检验对象呢?这是因为样本平均数具有下述特征:(1)离均差的平方和∑(-)2最小,说明样本平均数与样本各个观测值最接近,平均数是资料的代表数。

(2)样本平均数是总体平均数的无偏估计值,即E()=μ。(3)根据统计学中心极限定理,样本平均数服从或接近正态分布。所以,以样本平均数作为检验对象,由两个样本平均数差异的大小去推断样本所属总体平均数是否相同是有其依据的。由上所述,一方面我们有依据由样本平均数和的差异来推断总体平均数、相同与否,另一方面又不能仅据样本平均数表面上的差异直接作出结论,其根本原因在于试验误差(或抽样误差)的不可避免性。

通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受个体差异和诸多无法控制的随机因素的影响。所以观测值由两部分组成,即

=+

总体平均数反映了总体特征,表示误差。若样本含量为n,则可得到n

个观测值:,,,。于是样本平均数

说明样本平均数并非总体平均数,它还包含试验误差的成分。对于接受不同处理的两个样本来说,则有:

=+,=+

这说明两个样本平均数之差(-)也包括了两部分:一部分是两个总体平均数的差(-),叫做试验的处理效应(treatmenteffect);另一部分是试验误差(-)。

也就是说样本平均数的差(-)只是试验的表面效应。因此,仅凭(-)就对总体平均数、是否相同下结论是不可靠的。只有通过显著性检验才能从(-)中提取结论。对(-)进行显著性检验就是要分析:

试验的表面效应(-)主要由处理效(-)引起的,还是主要由试验误差(-)所造成。

虽然处理效应未知,但试验的表面效应是可以计算的,借助数理统计方法可以对试验误差作出估计。所以,可从试验的表面效应与试验误差的权衡比较中间接地推断处理效应是否存在,这就是显著性检验的基本思想。(二)显著性检验的基本步骤

1、首先对试验样本所在的总体作假设

这里假设=或-=0,即假设油松和樟子松苗木高度的总体平均数相等,其意义是试验的表面效应:-=1.8cm是试验误差,处理无效,这种假设称为无效假设(nullhypothesis),记作:=或。无效假设是被检验的假设,通过检验可能被接受,也可能被否定。提出:=或-=0的同时,相应地提出一对应假设,称为备择假设(alternativehypothesis),记作。备择假设是在无效假设被否定时准备接受的假设。

本例的备择假设是:≠或-≠0,总体平均数与不相等或与之差不等于零,亦即存在处理效应,其意义是指试验的表面效应,除包含试验误差外,还含有处理效应在内。

2、在无效假设成立的前提下,构造合适的统计量,并研究试验所得统计量的抽样分布,计算无效假设正确的概率

对于上述例子,研究在无效假设:=成立的前提下,统计量(-)的抽样分布。经统计学研究,得到一个统计量t:其中=

叫做平均数的标准差;n1、n2为两样本的含量。

所得的统计量t服从自由度df=(n1-1)+(n2-1)的t分布。根据两个样本的数据,计算得:-=11-9.2=1.8;

我们需进一步估计出|t|≥2.426的两侧概率,即估计P(|t|≥2.426)是多少?查附表3,在df=(n1-1)+(n2-1)=(10-1)+(10-1)=18时,两侧概率为0.05的临界值:

=2.101,

P(|t|>2.101)=P(t>2.101)+P(t<-2.101)=0.05两侧概率为0.01的临界t值:=2.878,即:

P(|t|>2.878)=P(t>2.878)+P(t<-2.878)=0.01

由于根据两样本数据计算所得的t值为2.426,介于两个临界t值之间,即:

t0.05<2.426<t0.01

所以,|t|≥2.426的概率P介于0.01和0.05之间,即:0.01<P<0.05。

|t|≥2.426的两侧概率说明试验的表面效应为试验误差的可能性在0.01─0.05之间。

3、根据“小概率事件实际不可能性原理”否定或接受无效假设在统计学上,把小概率事件在一次试验中看成是实际上不可能发生的事件,称为小概率事件实际不可能原理。根据这一原理,当试验的表面效应是试验误差的概率小于0.05时,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的。

因而否定原先所作的无效假设:

=,接受备择假设:≠,即认为:试验的处理效应是存在的。当试验的表面效应是试验误差的概率大于0.05时,则说明无效假设:=成立的可能性大,不能被否定,因而也就不能接受备择假设:≠。

本例中,按所建立的:=,试验的表面效应是试验误差的概率在0.01─0.05之间,小于0.05,故有理由否定:=,而接受:≠。可以认为油松和樟子松苗木高度的总体平均数和不相同,有显著差异。综上所述,显著性检验,从提出无效假设与备择假设到根据小概率事件实际不可能性原理来否定或接受无效假设,这一过程实际上是应用所谓“概率性质的反证法”对试验样本所属总体所作的无效假设的统计推断。(三)显著水平在显著性检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著水平(significancelevel),记作α。在生物学研究中常取α=0.05或α=0.01。

若|t|<t0.05

,则说明试验的表面效应属于试验误差的概率P>0.05,即表面效应属于试验误差的可能性大,不能否定:=,统计学上把这一检验结果表述为:“两个总体平均数与差异不显著”,在计算所得的t值的右上方标记“ns”或不标记符号;

若t0.05≤|t|<t0.01,则说明试验的表面效应属于试验误差的概率P在0.01—0.05之间,即0.01<P≤0.05,表面效应属于试验误差的可能性较小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异显著”,在计算所得的t值的右上方标记“*”;

若|t|≥t0.01,则说明试验的表面效应属于试验误差的概率P不超过0.01,即P≤0.01,表面效应属于试验误差的可能性更小,应否定:=,接受:≠,统计学上把这一检验结果表述为:“两个总体平均数与差异极显著”,在计算所得的t值的右上方标记“**”。

这里可以看到,是否否定无效假设,是用实际计算出的检验统计量t的绝对值与显著水平α对应的临界值tα比较。若|t|≥tα

,则在α水平上否定;若|t|<tα

,则不能在α水平上否定。区间和称为α水平上的否定域,而区间()则称为α水平上的接受域。

假设检验时选用的显著水平,除α=0.05和0.01为常用外,也可选α=0.10。到底选哪种显著水平,应根据试验的要求或试验结论的重要性而定。如果试验中难以控制的因素较多,试验误差可能较大,则显著水平可选低些,即α值取大些。反之,如试验耗费较大,对精确度的要求较高,或者试验结论的应用事关重大,则所选显著水平应高些,即α值应该小些。显著水平α对假设检验的结论是有直接影响的,所以它应在试验开始前即确定下来。(四)双侧检验与单侧检验

在上述显著性检验中,无效假设与备择假设。此时,备择假设中包括了或两种可能。这个假设的目的在于判断与有无差异,而不考虑谁大谁小。

此时,在α

水平上否定域为和,对称地分配在t分布曲线的两侧尾部,每侧的概率为α/2。这种利用两尾概率进行的检验叫双侧检验(two-sidetest),也叫双尾检验(two-tailedtest),为双侧检验的临界t值。

但在有些情况下,双侧检验不一定符合实际情况。如采用某种新的配套技术措施以期提高林木的产量,已知此种配套技术的实施不会降低产量。此时,若进行新技术与常规技术的比较试验,则无效假设应为,即假设新技术与常规技术产量是相同的,备择假设应为,即新配套技术的实施使产量有所提高。检验的目的在于推断实施新技术是否提高了产量,这时H0的否定域在t分布曲线的右尾。在α水平上否定域为,右侧的概率为α。若无效假设H0为,备择假设HA为,此时H0的否定域在t分布曲线的左尾。在α水平上,H0的否定域为,左侧的概率为α。

这种利用一尾概率进行的检验叫单侧检验(one-sidedtest)也叫单尾检验(one-tailedtest)。此时tα为单侧检验的临界t值。显然,单侧检验的tα=双侧检验的t2α。由上可以看出,若对同一资料进行双侧检验,也进行单侧检验,那么在α水平上单侧检验显著,只相当于双侧检验在2α水平上显著。所以,同一资料双侧检验与单侧检验所得的结论不一定相同。

双侧检验显著,单侧检验一定显著;但单侧检验显著,双侧检验未必显著。

(五)显著性检验中应注意的问题

上面我们已详细阐明了显著性检验的意义及原理。进行显著性检验还应注意以下几个问题:

1、为了保证试验结果的可靠及正确,要有严密合理的试验或抽样设计,保证各样本是从相应同质总体中随机抽取的。并且处理间要有可比性,即除比较的处理外,其它影响因素应尽可能控制相同或基本相近。否则,任何显著性检验的方法都不能保证结果的正确性。

2、选用的显著性检验方法应符合其应用条件。由于研究变量的类型、问题的性质、条件、试验设计方法、样本大小等的不同,所用的显著性检验方法也不同,因而在选用检验方法时,应认真考虑其适用条件,不能滥用。

3、要正确理解差异显著或极显著的统计意义。显著性检验结论中的“差异显著”或“差异极显著”不应该误解为相差很大或非常大,也不能认为在专业上一定就有重要或很重要的价值。“显著”或“极显著”是指表面上如此差别的不同样本来自同一总体的可能性小于0.05或0.01,已达到了可以认为它们有实质性差异的显著水平。有些试验结果虽然差别大,但由于试验误差大,也许还不能得出“差异显著”的结论,而有些试验的结果间的差异虽小,但由于试验误差小,反而可能推断为“差异显著”。

显著水平的高低只表示下结论的可靠程度的高低,即在0.01水平下否定无效假设的可靠程度为99%,而在0.05水平下否定无效假设的可靠程度为95%。

“差异不显著”是指表面上的这种差异在同一总体中出现的可能性大于统计上公认的概率水平0.05,不能理解为试验结果间没有差异。下“差异不显著”的结论时,客观上存在两种可能:一是本质上有差异,但被试验误差所掩盖,表现不出差异的显著性来。如果减小试验误差或增大样本容量,则可能表现出差异显著性;二是可能确无本质上差异。显著性检验只是用来确定无效假设能否被推翻,而不能证明无效假设是正确的。

4.合理建立统计假设,正确计算检验统计量。就两个样本平均数差异显著性检验来说,无效假设与备择假设的建立,一般如前所述,但有时也例外。二、样本平均数与总体平均数差异显著性检验

在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。如正常生理指标、生产性能指标等,都可以用样本平均数与之比较,检验差异显著性。检验的基本步骤是:

(一)提出无效假设与备择假设,,其中为样本所在总体平均数,为已知总体平均数;

(二)计算t值计算公式为:

式中,n为样本含量,为样本标准差。

(三)查临界t值,作出统计推断由查附表3得临界值t0.05,t0.01。将计算所得的t值的绝对值与其比较:

若|t|<t0.05,则P>0.05,不能否定,表明样本平均数与总体平均数差异不显著,可以认为样本是取自该总体;若t0.05≤|t|<t0.01,则0.01<P≤0.05,否定,接受,表明样本平均数与总体平均数差异显著,有95%的把握认为样本不是取自该总体;

若|t|≥t0.01,则P≤0.01,表明样本平均数与总体平均数差异极显著,有99%的把握认为样本不是取自该总体。

三、两个样本平均数的差异

显著性检验

在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。对于两样本平均数差异显著性检验,因试验设计不同,一般可分为两种情况:

一是非配对设计或成组设计两样本平均数差异显著性检;二是配对设计两样本平均数差异显著性检。(一)非配对设计两样本平均数的差异显著性检验

非配对设计或成组设计是指当进行只有两个处理的试验时,将试验单位完全随机地分成两个组,然后对两组随机施加一个处理。在这种设计中两组的试验单位相互独立,所得的二个样本相互独立,其含量不一定相等。

非配对设计两样本平均数差异显著性检验的基本步骤如下:

1、提出无效假设与备择假设,

2、计算t值

计算公式为:

其中:

当时

为均数差异标准,、,、,、分别为两样本含量、平均数、均方。

3、根据df=(n1-1)+(n2-1),查临界值:t0.05、t0.01,将计算所得t值的绝对值与其比较,作出统计推断。

在非配对设计两样本平均数的差异显著性检验中,若总的试验单位数()不变,则两样本容量相等比两样本容量不等有较高检验效率,因为此时使最小,从而使t的绝对值最大。所以在进行非配对设计时,两样本容量以相同为好。

(二)配对设计两样本平均数的差异显著性检验非配对设计要求试验单位尽可能一致。如果试验单位变异较大,如苗木的年龄、生长相差较大,若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性。为了消除试验单位不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。

配对设计是指先根据配对的要求将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一个重复。

(三)步骤

1、提出无效假设与备择假设,其中为两样本配对数据差值d总体平均数,它等于两样本所属总体平均数与之差,即=-。所设无效假设、备择假设相当于,。

2、计算t值计算公式为

式中,为差异标准误,计算公式为:

d为两样本各对数据之差

Sd为d的标准差;n为配对的对子数,即试验的重复数。

(三)查临界t值,作出统计推断根据df=n-1查临界t值:t0.02(n-1)和t0.01(n-1),将计算所得t值的绝对值与其比较,作出推断。四总体参数的区间估计

区间估计是在一定概率保证下指出总体参数的可能范围,所给出的可能范围叫置信区间(confidenceinterval),给出的概率保证称为置信度或置信概率(confidenceprobability)。一、正态总体平均数的置信区间设有一来自正态总体的样本,包含n个观测值,样本平均数,标准差。总体平均数为μ。因为服从自由度为n-1的t分布。双侧概率为a时,有:,也就是说t在区间内取值的可能性为1-a,即:

对变形得:

亦即上式称为总体平均数μ置信度为1-a的置信区间。其中称为置信半径;和分别称为置信下限和置信上限;置信上、下限之差称为置信距,置信距越小,估计的精确度就越高。

常用的置信度为95%和99%,总体平均数μ的95%和99%的置信区间如下:

第三节方差分析

t检验法适用于样本平均数与总体平均数及两样本平均数间的差异显著性检验,但在生产和科学研究中经常会遇到比较多个处理优劣的问题,即需进行多个平均数间的差异显著性检验。这时,若仍采用t检验法就不适宜了。方差分析(analysisofvariance)是由英国统计学家R.A.Fisher于1923年提出的。

这种方法是将k个处理的观测值作为一个整体看待,把观测值总变异的平方和及自由度分解为相应于不同变异来源的平方和及自由度,进而获得不同变异来源总体方差估计值;通过计算这些总体方差的估计值的适当比值,就能检验各样本所属总体平均数是否相等。

方差分析法是一种在若干能相互比较的资料组中,把产生变异的原因加以区分开来的方法与技术”,方差分析实质上是关于观测值变异原因的数量分析。一、方差分析的基本原理与步骤

本节结合单因素试验结果的方差分析介绍其原理与步骤。(一)线性模型与基本假定假设某单因素试验有k个处理,每个处理有n次重复,共有nk个观测值。这类试验资料的数据模式如下表所示。

表3-2k个处理每个处理有n个观测值的数据模式

表中表示第i个处理的第j个观测值(i=1,2,…,k;j=1,2,…,n);表示第i个处理n个观测值的和;表示全部观测值的总和;表示第i个处理的平均数;表示全部观测值的总平均数;可以分解为(3-1)

表示第i个处理观测值总体的平均数。为了看出各处理的影响大小,将再进行分解,令

(3-2)(3-3)则

(3-4)

其中μ表示全试验观测值总体的平均数;ai是第i个处理的效应(treatmenteffects)表示处理i对试验结果产生的影响。显然有

(3-5)εij是试验误差,相互独立,且服从正态分布N(0,σ2)。(3-4)式叫做单因素试验的线性模型(linearmodel)亦称数学模型。在这个模型中Xii表示为总平均数μ、处理效应αi、试验误差εij之和。

由εij相互独立且服从正态分布N(0,σ2),可知各处理Ai(i=1,2,…,k)所属总体亦应具正态性,即服从正态分布N(μi,σ2)。尽管各总体的均数

可以不等或相等,σ2则必须是相等的。所以,单因素试验的数学模型可归纳为:

效应的可加性

(additivity)、分布的正态性(normality)、方差的同质性(homogeneity)。这也是进行其它类型方差分析的前提或基本假定。

若将表(3-2)中的观测值xij(i=1,2,…,k;j=1,2,…,n)的数据结构(模型)用样本符号来表示,则

(3-6)

与(3-4)式比较可知,分别是μ、(μi-μ)=、(xij-)=的估计值。

(3-4)、(3-6)两式告诉我们:每个观测值都包含处理效应(μi-μ或),与误差(或),故kn个观测值的总变异可分解为处理间的变异和处理内的变异两部分。(二)平方和与自由度

在方差分析中是用样本方差即均方(meansquares)来度量资料的变异程度的。将总变异分解为处理间变异和处理内变异,就是要将总均方分解为处理间均方和处理内均方。但这种分解是通过将总均方的分子──称为总离均差平方和,简称为总平方和,剖分成处理间平方和与处理内平方和两部分;将总均方的分母──称为总自由度,剖分成处理间自由度与处理内自由度两部分来实现的。

1、总平方和反映全部观测值总变异的总平方和是各观测值xij与总平均数的离均差平方和,记为SST。即因为

其中所以(3-7)(3-7)式中,为各处理平均数与总平均数的离均差平方和与重复数n的乘积,反映了重复n次的处理间变异,称为处理间平方和,记为SSt,即(3-7)式中,为各处理内离均差平方和之和,反映了各处理内的变异即误差,称为处理内平方和或误差平方和,记为SSe,即于是有

SST

=SSt+SSe

(3-8)这个关系式中三种平方和的简便计算公式如下:(3-9)

其中,C=/kn称为矫正数。2、总自由度在计算总平方和时,资料中的各个观测值要受这一条件的约束,故总自由度等于资料中观测值的总个数减1,即kn-1。总自由度记为dfT,即dfT=kn-1。

在计算处理间平方和时,各处理均数要受这一条件的约束,故处理间自由度为处理数减1,即k-1。处理间自由度记为dft,即dft=k-1。在计算处理内平方和时,要受k个条件的约束,i=1,2,…,k。故处理内自由度为资料中观测值的总个数减k,即kn-k

。处理内自由度记为dfe,即dfe=kn-k=k(n-1)。

因为所以

(3-10)

综合以上各式得:

(3-11)

各部分平方和除以各自的自由度便得到总均方、处理间均方和。(三)期望均方如前所述,方差分析的一个基本假定是要求各处理观测值总体的方差相等,即(i=1,2,…,k)表示第i个处理观测值总体的方差。如果所分析的资料满足这个方差同质性的要求,那么各处理的样本方差S21,S22,…

,S2k都是σ2的无偏估计(unbiasedestimate)量。

S2i(i=1,2,…,k)是由试验资料中第i个处理的n个观测值算得的方差。

显然,各S2i的合并方差(以各处理内的自由度n-1为权的加权平均数)也是σ2的无偏估计量,且估计的精确度更高。很容易推证处理内均方MSe就是各的合并。

其中SSi、dfi(i=1,2,…,k)分别表示由试验资料中第i个处理的n个观测值算得的平方和与自由度。这就是说,处理内均方MSe是误差方差σ2的无偏估计量。试验中各处理所属总体的本质差异体现在处理效应的差异上。我们把称为效应方差,它也反映了各处理观测值总体平均数的变异程度,记为。

因为MSe是σ2的无偏估计量,MSt是n+σ2的无偏估计量,所以σ2为MSe的数学期望(mathematicalexpectation),n+σ2为MSt的数学期望。又因为它们是均方的期望值(expectedvalue),故又称期望均方,简记为EMS(expectedmeansquares)。当处理效应的方差=0,亦即各处理观测值总体平均数(i=1,2,…,k)相等时,处理间均方MSt与处理内均方一样,也是误差方差σ2的估计值,方差分析就是通过MSt

与MSe的比较来推断是否为零即是否相等的。

(四)F分布与F检验

1、F分布

设想我们作这样的抽样试验,即在一正态总体N(μ,σ2)中随机抽取样本含量为n的样本k个。此时所谓的各处理没有真实差异,各处理只是随机分的组。因此,计算出的和都是误差方差的估计量。以为分母,为分子,求其比值。统计学上把两个均方之比值称为F值。

(3-13)F具有两个自由度:若在给定的k和n的条件下,继续从该总体进行一系列抽样,则可获得一系列的F值。这些F值所具有的概率分布称为F分布(Fdistribution)。F分布密度曲线是随自由度df1、df2的变化而变化的一簇偏态曲线,其形态随着df1、df2的增大逐渐趋于对称。

F分布的取值范围是(0,+∞),其平均值=1。用表示F分布的概率密度函数,则其分布函数为:

(3-14)因而F分布右尾从到+∞的概率为:

(3-15)

附表列出的是不同df1和df2下,P(F≥)=0.05和P(F≥)=0.01时的F值,即右尾概率α=0.05和α=0.01时的临界F值,一般记作,。

2、F检验

F附表是专门为检验代表的总体方差是否比代表的总体方差大而设计的。若实际计算的F值大于,则F值在α=0.05的水平上显著,我们以95%的可靠性(即冒5%的风险)推断代表的总体方差大于代表的总体方差。这种用F值出现概率的大小推断两个总体方差是否相等的方法称为F检验(F-test)。

在单因素试验结果的方差分析中,无效假设为H0:μ1=μ2=…=μk,备择假设为HA:各μi不全相等,或H0

:=0,HA:≠0;

F=MSt/MSe,也就是要判断处理间均方是否显著大于处理内(误差)均方。如果结论是肯定的,我们将否定H0;反之,不否定H0。

实际进行F检验时,是将由试验资料所算得的F值与根据df1=dft(大均方,即分子均方的自由度)、df2=dfe(小均方,即分母均方的自由度)查附表4所得的临界F值,相比较作出统计推断的。若F<,即P>0.05,不能否定H0,统计学上,把这一检验结果表述为:各处理间差异不显著,在F值的右上方标记“ns”,或不标记符号;

若≤F<,即0.01<P≤0.05,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异显著,在F值的右上方标记“*”;若F≥,即P≤0.01,否定H0,接受HA,统计学上,把这一检验结果表述为:各处理间差异极显著,在F值的右上方标记“**”。二、多重比较

F值显著或极显著,否定了无效假设HO,表明试验的总变异主要来源于处理间的变异,试验中各处理平均数间存在显著或极显著差异,但并不意味着每两个处理平均数间的差异都显著或极显著,也不能具体说明哪些处理平均数间有显著或极显著差异,哪些差异不显著。

因而,有必要进行两两处理平均数间的比较,以具体判断两两处理平均数间的差异显著性。统计上把多个平均数两两间的相互比较称为多重比较(multiplecomparisons)。多重比较的方法甚多,常用的有最小显著差数法(LSD法)和最小显著极差法(LSR法),现分别介绍如下。

(一)最小显著差数法

(LSD法,leastsignificantdifference)

此法的基本作法是:在F检验显著的前提下,先计算出显著水平为α的最小显著差数,然后将任意两个处理平均数的差数的绝对值与其比较。

若>LSDα时,则与在α水平上差异显著;反之,则在α水平上差异不显著。最小显著差数由(3-16)式计算。

(3-16)

式中:为在F检验中误差自由度下,显著水平为α的临界t值,为均数差异标准误,由(6-18)式算得。

(3-17)

其中为F检验中的误差均方,n为各处理的重复数。当显著水平α=0.05和0.01时,从t值表中查出和,代入(3-16)式得:

(3-18)

利用LSD法进行多重比较时,可按如下步骤进行:

(1)列出平均数的多重比较表比较表中各处理按其平均数从大到小自上而下排列;(2)计算最小显著差数和;

(3)将平均数多重比较表中两两平均数的差数与、比较,作出统计推断。

对于多个处理平均数所有可能的两两比较,LSD法的优点在于方法比较简便,克服一般检验法所具有的某些缺点,但是由于没有考虑相互比较的处理平均数依数值大小排列上的秩次,故仍有推断可靠性低、犯I型错误概率增大的问题。为克服此弊病,统计学家提出了最小显著极差法。

(二)最小显著极差法(LSR法,Leastsignificantranges)

LSR法的特点是把平均数的差数看成是平均数的极差,根据极差范围内所包含的处理数(称为秩次距)k的不同而采用不同的检验尺度,以克服LSD法的不足。这些在显著水平α上依秩次距k的不同而采用的不同的检验尺度叫做最小显著极差LSR。

例如有10个要相互比较,先将10个依其数值大小顺次排列,两极端平均数的差数(极差)的显著性,由其差数是否大于秩次距k=10时的最小显著极差决定(≥为显著,<为不显著);而后是秩次距k=9的平均数的极差的显著性,则由极差是否大于k=9时的最小显著极差决定;……直到任何两个相邻平均数的差数的显著性由这些差数是否大于秩次距k=2时的最小显著极差决定为止。因此,有k个平均数相互比较,就有k-1种秩次距(k,k-1,k-2,…,2),因而需求得k-1个最小显著极差(LSRα,k),分别作为判断具有相应秩次距的平均数的极差是否显著的标准。

因为LSR法是一种极差检验法,所以当一个平均数大集合的极差不显著时,其中所包含的各个较小集合极差也应一概作不显著处理。

LSR法克服了LSD法的不足,但检验的工作量有所增加。常用的LSR法有q检验法和新复极差法两种。

1、q检验法(qtest)

此法是以统计量q的概率分布为基础的。q值由下式求得:

(3-19)

式中,ω为极差,为标准误,分布依赖于误差自由度dfe及秩次距k。利用q检验法进行多重比较时,为了简便起见,将极差与比较,从而作出统计推断。即为α水平上的最小显著极差。(3-20)

当显著水平α=0.05和0.01时,从附表5(q值表)中根据自由度及秩次距k查出和代入(3-20)式得

(3-21)

实际利用q检验法进行多重比较时,可按如下步骤进行:(1)列出平均数多重比较表;

(2)由自由度dfe、秩次距k查临界q值,计算最小显著极差LSR0.05,k,LSR0.01,k;

(3)将平均数多重比较表中的各极差与相应的最小显著极差LSR0.05,k,LSR0.01,k比较,作出统计推断。

2、新复极差法(newmultiplerangemethod)

此法是由邓肯(Duncan)于1955年提出,故又称Duncan法,此法还称SSR法(shortestsignificantranges)。新复极差法与q检验法的检验步骤相同,唯一不同的是计算最小显著极差时需查SSR表(附表6)而不是查q值表。最小显著极差计算公式为

(3-22)

其中是根据显著水平α、误差自由度dfe、秩次距k,由SSR表查得的临界SSR,。α=0.05和α=0.01水平下的最小

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论