试验统计方法_第1页
试验统计方法_第2页
试验统计方法_第3页
试验统计方法_第4页
试验统计方法_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验统计方法第一章 绪论1、 合理地进行调查或试验设计,科学地整理、分析所收集得来的资料是生物统计的根本任务。2、生物统计在植物科学研究中的作用:(1) 提供试验或调查设计的方法合理地收集必要而有代表性资料。(2) 提供整理分析资料的方法。 整理资料的基本方法绘制统计表、统计图; 统计分析最重要的内容差异显著性检验; 统计分析的另一个重要内容对试验指标或植物性状间的关系进行研究,即相关回归分析。3、科学研究的一般流程: 4、常用分析资料的统计分析:5、生物统计学:用数理统计学的原理来收集、分析、表达和解释生物现象的科学。6、 近代描述统计学。 英国人高尔登生物统计学之父。 贡献:首先在生物学研

2、究中应用统计方法;提出变异、相关、回归等概念和方法。 1886年,高尔登在论文中提出在遗传中身长向中等身长回归观点,正式提出回归概念。7、 现代推断统计学。由定性转为定量;变革在农业田间试验中完成。(1)哥塞特的t检验与小样本思想;1908年提出平均数的概率误差概念。(2)R费雪(在统计学的地位非常显赫)提出抽样分析、方差分析、随机化原则等概念和方法。第二章 资料的整理一、常用术语1、总体:根据研究目的而确定的研究对象的全体。2、样本:从总体中抽出的用于研究总体的部分个体称为样本。(n30为大样本,n30为小样本)。3、样本容量:样本中所包含的个体数目,记为n ,对应总体参数为N 。4、随机样

3、本:指总体中的每一个个体都有同等的机会被抽取组成样本。5、参数(总体特征数): 总体平均数 总体标准差 (希腊字母) 统计量(样本特征数): 样本平均数 S样本标准差 (拉丁字母)2、 资料的分类 数量性状资料、质量性状资料、半定量(等级)资料1、 数量性状:能够以测量或计数的方式表示其特征的性状。2、 数量性状资料:观察测定数量性状而获得的数据。3、 连续性变数:量、测手段得到的计量资料; 间断性变数:计数方式得到的计数资料。4、 质量性状:能观察到而不能直接测量的性状。5、 质量性状转化为数量性状的方法:(1)统计次数法;(2)分级法。3、 资料的整理1、 检查和核对原始资料的目的是保证资

4、料的在正确性和完整性。2、 小样本不必分组,大样本宜分组,将观测值分组后,制成次数分布表。求全距(极差)R=Max(x) - Min(x) ; 确定组数;确定组距;确定组限及组中值;归组划线计数,作次数分布表。4、 常用统计表与统计图统计表标题在上方,统计图标题在下方;连续性变数资料采用直方图和折线图;次数分布图一般有间断符号。5、 作业1、 什么是总体、个体、样本、样本含量、随机样本?统计分析的两个特点是什么?2、 什么是参数、统计量?二者有何关系?3、 资料可以分为哪几类?它们二者有何区别和联系?4、 统计表与统计图有何用途?常用统计图有哪些?常用统计表有哪些?列表绘图应注意什么?第3章

5、变异数1、 平均数 反应资料的集中性(算术平均数x:直接法、加权法;中位数Md;众数Mo;几何平均数G)。 变异数、变异系数 反应资料的离散性。2、 全距(极差):R=Max(x) - Min(x) 3、 方差:离均差平方和与自由度的比值。 ss/df(样本) SS/DF(总体) 离均差(x -x) 自由度 df = n - 1 DF = N (样本自由度减1,总体自由度不减1) 样本方差(S2,MS)S2 = (x -x)2 /(n - 1) ;总体方差(2)2 = (x - )2 / N4、 样本标准差 S2的正平方根。 直接法: 矫正数法:5、 全距近等于6倍的标准差。6、 变异系数:标

6、准差与平均数的比值(相对值) CV =(S /x)100%作业1、 生物统计中常用的平均数有几种?各在什么情况下应用? 算术平均数(正态);中位数(正态);众数(偏态);几何平均数(遗传)2、 15、13、8、9、12 Md = ? 7、8、15、6、4、12 Md = ? 13、14、14、15、15、15、15、16、15、15、16、16、16、17、18、20 Mo = ?3、 何谓标准差? 方差的正平方值,用于表示资料的变异度。4、 何谓变异数? 表示数据变异程度的统计值。第4章 理论分布和抽样分布1、 事件与概率1、 必然事件; 不可能事件。2、 小概率事件:P 0.053、 小概

7、率原理:统计学上,一个随机事件概率很小的话(P 0.05),在一次试验中,这个事件被认为实际不可能发生的事件。是显著性测验的基本依据。2、 正态分布1、 普通: X服从于以为平均差,2为方差的正态分布2、 标准正态分布: 3、 特征:曲线是单峰,对称曲线,对称轴x = ; 。4、 P(-1.960 u 1.960)= 0.95 ;P(-2.576 u 2.576)= 0.99 。5、 正态离差U 。3、 抽样分布1、 标准误 ; 样本平均数抽样总体的总体平均数2、 = ; ;3、 设有一个N = 3的有限总体,变数为2,4,6。从中抽取n = 2的样本。 = 32 = 9 计算变数X的分布的参

8、数 = 4 ; 2 = 8/3 计算样本平均数分布总体参数 ; 结论:若随机变量,则由x总体随机抽样的样本统计量。若x服从(,2)不是正态分布,则n相当大时逼近正态分布。,中心极限定理。4、 中心极限定理告诉我们:不论x变量连续还是离散,也无论x服从何种分布,一般只要n30,就可认为的分布是正态的,若x分布不很偏倚,在n20时,的分布就近似于正态分布。5、 标准化 ; ; 样本标准误 。6、 两个正态总体抽出的独立样本平均数差数的分布 ,各理论分布的标准化: ; ; 。4、 分布 t分布受自由度的约束,每一个自由度都有一条分布密度曲线。5、 作业1、 必然事件、不可能事件、随机事件。必然事件:

9、对于一类事件来说,在同一组条件的实现之下必然要发生的事件。不可能事件:在同一组条件的实现之下必然 不发生的事件。随机事件:某特定事件只是可能发生的几种事件中的一种的事件。2、 小概率事件实际不可能原理3、 标准误;标准误与标准差联系与区别。4、 样本平均数抽样总体与原始总体的两个参数间的联系。5、 t分布与标准正态分布的区别与联系。第5章 统计假设检验1、 思路1、 假设对试验样本所在的总体;2、 确定显著水平;3、 在H0正确的前提下,计算实际差异由抽样误差造成的概率;4、 作接受或否定H0的判断。2、 基本步骤例:某地多年种植的早熟品种牛心甘蓝记录亩产3000斤,其标准差为582.9斤;现

10、培育成一新的早熟品种在10个小区的试验结果为亩产3400斤,问两品种在产量上是否存在本质差异?(1) 首先对试验样本所在的总体作假设 建立无效假设 H0 : = 0(2) 确定显著水平 否定H0的概率标准称为显著水平,通常用表示。在生物学上常用的显著水平是=0.05/=0.01(三)在H0正确的前提下,计算实际差异由抽样误差造成的概率 我们认为该样本是从已知总体中随机抽取的样本,符合抽样分布的规律 正态离差u值:= ; =(4) 作接受或否定H0的判断 根据小样本实际不可能原理判断,查出p0.05,则否定H0;P0.05,则差异显著;P0.01,则差异极显著。 = 2.17 U0.05 = 1

11、.960 ,P 0.05 ; 结论:两品种在产量上差异显著。例:早熟辣椒矮树早多年种植的亩产2500斤,先引进一新的早熟辣椒品种伏地尖在36个小区种植,平均某产2700斤,其标准差为480斤;问新品种伏地尖是否比矮树早增产?解:(1)H0 : = 0 (2) = 0.05 / = 0.01(3) n = 36 为大样本,认为大样本的标准差为总体的标准差(4) ; (5) = 2.5 U0.05 = 1.960 ; P 0.05 ; 差异显著结论:新品种伏地尖比矮树早增产。5、 t测验 小样本时,不能用 例:某茄子品种植株高度为75cm ,现有一随机抽取10株的样本,其平均株高为70cm ,其标

12、准差为8cm ,试测定这个平均数能否代替总体平均数?解:(1)H0 : = 0 = 75cm(2) = 0.05 / = 0.01(3) ; (4) 查表知r = 10 - 1 = 9时,P = 0.05 ,t = 2.262 1.976 2.262 ; P 0.05结论:这个平均数能代替总体平均数。6、 显著性检验的计算(1) 单样本平均数显著性检验1、 若2已知,无论样本容量n大小,都用u测验。 ; 。2、 若2未知,当样本容量n 30 时,认为 ,用u测验。3、 若2未知,当样本容量n 30 时,不能认为 ,用t测验。 ; 受自由度f影响 。7、 两个样本显著性检验由于实验设计不同,可分

13、为成组数据(非配对设计)和成对数据(配对设计)(一)成组数据1、 若两样本所属总体12、22已知,无论n大小,都用u测验。 ; 。2、 若两样本所属总体12、22未知,可以假定两个样本来自于同一总体,当n1、n2都为大样本时,用u测验。 ; 。3、 若两样本所属总体12、22未知,且当n1、n2都为小样本时,用t测验。 引入新概念:合并均方Se2 矫正数法 ; 。例:某辣椒品种栽培在甲、乙两地: 甲 5个小区产量:12.6;13.4;11.9;12.8;13.6 (斤) 乙 7个小区产量:13.1;13.4;12.8;13.5;13.5;12.7;12.4 (斤)问该品种在甲、乙两地是否有显著

14、性差异。解:(1)H0 :1 = 2 ;(2) = 0.05 / = 0.01(3) 甲: = 12.86 ; = 0.6768 ; = 828.73 ; = 64.3 ; 乙: = 13.06 ; = 0.4353 ; = 1194.56 ; = 91.4 。 = = 0.297 ; = 0.319 ; = -0.6269 ; 推断:查表,当df = 10 , = 0.05时 , = 2.228 0.627 即 P 0.05 结论:该品种在甲、乙两地没有显著性差异。(二)成对数据的平均数比较1、对大样本: ; 、 、 ; 实际转化为单样本问题。2、对小样本: ; df = n - 1 ; ;

15、 差异标准误。8、 习题1、 已知红星苹果单株产量为65kg,标准差为12kg,现有一芽变株产量为71kg,调查株数为40株,问芽变株产量与红星苹果株产量的差异是否显著?2、 现有两个柑橘品种A、B,A品种调查400株,平均株产为66.7kg,标准差为5.6kg;B品种也调查400株,平均株产为75.2kg,标准差为6.2kg,问两个柑橘品种产量上差异是否显著?3、 在芽变选种时考察芽变品种的果实硬度性状: A品种: 14.5 ,15.5 ,14.0 ,14.0 ,13.5 ,14.7 ,14.8 ; B品种: 14.0 ,14.0 ,13.8 ,14.2 ,14.0 ; 问这两个品种在果实硬

16、度上有无显著性差异?4、 试验对CK普通型/矮化型实行同一处理,得数据如下:普通型:54.35 ,43.62 ,40.79 ,32.35 ,39.58 ,41.34 ,37.53 ,38.46 ,35.55矮化型:37.50 ,31.78 ,20.83 ,20.83 ,32.35 ,32.24 ,27.67 ,34.02 ,23.83问该处理对两类型有没有作用?第6章 试验设计一、名词解释1、 原则:对照原则、重复原则、随机原则、局部控制原则。2、 试验:在严格控制的条件下,人为的改变某些试验因素来观察研究对象变化规律的一种认识活动。3、 试验设计(狭义):指将试验方案中拟定的试验处理在试验区

17、域的布置方式,主要包括试验单位的选取、重复数目的确定及试验单位的分组。4、 试验指标:为衡量试验结果的好坏或处理效应的高低,在试验中具体测定的性状或观测的项目。5、 试验因素:试验中由人为控制的,影响试验指标的因素、6、 效应:试验因素对性状所引起的增进或减少的作用。7、 主效应:一个因素内各简单效应的平均数称为平均效应,也称主效应。8、 互作:因素内各简单效应间的平均差异称为交互作用,简称互作。9、 因素水平:试验因素采用的具体数量等级称为因素水平,简称水平(A1、A2)。10、 试验处理:事先设计好的实施在试验单位上的具体项目,简称处理。单因素试验,因素的一个水平就是一个处理;多因素试验,

18、试验因素的一个处理就是一个水平组合。11、 重复:在试验中,将一个处理实施在两个或两个以上的试验单位,称为处理有重复;一处理实施的试验单位数称为重复数。12、 试验设计基本要求:实验条件要有代表性(生物学和环境条件两个方面);实验结果要有正确性;试验结论要有重演性。13、 试验方案:根据试验目的与要求而拟定的进行比较的一组试验处理的总称。试验方案中必须设定比较标准。试验方案(试验指标、试验因素、因素水平、试验处理) 试验设计(对照、重复、随机、局部控制)2、 试验误差的来源(1) 来源:1、试验误差 试验测定数值与真值的差异。2、供试个体固有差异;土壤肥力差异或者不均匀;管理不一致所引起的差异

19、;环境条件的差异;测试仪器和方法的不一致;由一些随机因素引起的偶然差异(疾病、抽样主观因素等)。(2) 初步控制:避免株间差异,尽量选用一致的实验材料;土壤因素的控制(空白试验:先播种对土壤肥力敏感的、生长期较短的植物,评价土壤肥力分布情况);试验管理规范化、使管理一致;测试前仪器要进行检查和校正,使用同一仪器和同一方法;遵循随机抽样的方法。3、 试验设计的基本原则(1) 重复 是指试验中同一处理实施在两个或两个以上的试验单位上。不少于3次,多至68次。(2) 随机化 指在对试验个体进行分组时必须使用随机的方法,使供试个体进入各实验组的机会相等。(3) 局部控制 试验条件的局部一致性。 1、小

20、区技术:指所采用的试验方法使一个基本单元一致; 小区:指安排一个试验处理的基本单元。 2、区组技术:把整个试验区域划分为若干个局部区域,再在一个区域安排一组处理。 方向:垂直于肥力梯度。4、 完全随机设计 根据试验处理数将全部供试个体随机地分成若干组,然后再按组实施不同处理的设计。 条件:在试验中,试验条件完全一致时;两个原则,重复、随机。(一)试验方案:1、指标;2、因素;3、水平;4、处理(二)试验设计:1、确定重复次数;2、确定小区数;3、完全随机安排小区;4、画出试验布置图;5、分小区收集实验数据。5、 随机区组设计要求:1、区组内不同小区试验条件一致,不同区组不一致;2、既可以做单因

21、素,也可以做复因素试验。特点:应用广泛(单、复);要求有伸缩性;设计简单。(1) 单因素 设计:确定重复次数;按重复次数划区组,确定区组数;区组内随机设置小区;画出试验布置图;分小区收集试验数据。(2) 复因素 例:研究三种N肥施用量对4个甘蓝品种的影响。试验方案:1、试验指标:产量(kg)/品质 2、试验因素:N肥种类A ; 甘蓝品种B 3、试验水平:(A1、A2、A3)(B1、B2、B3、B4) 4、试验处理:12个 A1B1、A1B2、A3B4 。试验设计:1、6、 正交设计正交表:L8(27) L表示正交表;8表示处理数8行;2表示水平数;7表示最多可安排因素个数,有7列。类别:相同水

22、平正交表;混合水平正交表。7、 习题1、 产生试验误差的主要原因是什么?如何避免和控制试验误差?2、 试验设计应遵循哪三条基本原则?这三条基本原则的相互关系与作用是什么?3、 常用的试验设计方法有哪几种?各有何优缺点?各在什么情况下应用?4、 有一多因素试验,考察因素A、B、C、D分别有2个水平,同时要考察B与C的交互作用,若用正交表L8(27)安排试验,请画出试验设计图。第7章 方差分析一、基本原理1、方差分析:将总变异分解为各个相应因素的变异,并对其作出数量估计,从而找到各个相应因素在总变异种所占的重要程度。 总变异(VT)= 误差变异(Ve)+ 处理变异(Vt) 对于总变异的分解。2、解

23、决的问题是:在总变异中,由于处理不一样引起的变异与误差引起的变异哪个更大。3、总均方不是分解为处理间均方加处理内均方,而是通过平方和与自由度的分解来实现的。 总平方和(SST)= 组内(误差)平方和(SSe)+ 组间(处理)平方和(SSt) ; 总自由度(dfT)= 组间自由度(dft)+ 组内自由度(dfe) 。2、 例题:研究3种培养基对某细菌生长的影响培养基细菌增长倍数 A618568 12 11 13 14 B121392119 16101611 C3110109 861312解:1、数据整理: 目标t(处理)、n(重复)、Tt(处理总和)、(处理平均数)、T(总和)处理Ttt = 3

24、n = 9T = 292A9310.33B12714.11C728.002、 平方和与自由度的分解: VT = Vt + Ve ; SST = SSt + SSe ; dfT = dft + dfe (1) 计算矫正数CC = (x)2 /(tn)= 2922 / 27 = 3157.926(2) 计算SST、dfT ; dfT = tn - 1 = 26(3) 计算SSt、dftSSt = Tt2 / n - C = 29962 / 9 - C = 171.185 ; dft = t - 1 = 2(4)计算SSe、dfeSSe = SST - SSt = 418.889 ; dfe = d

25、fT - dft = 243、 方差分析:列方差分析表进行F测验。 变异来源平方和(SS)自由度(df) 方差(S2) F F0.05F0.01 处理间171.1852 85.594.90* 3.405.61处理内(误差)418.88924 17.45 总变异590.07426方差也叫均方,写成MSF测验:(1)计算F值:F = St2 / Se2 将F值写在分子一行。(2) 初步判断:F 1 Vt Ve 无差异 ; F = 1 Vt = Ve 无差异 ; F 1 Vt Ve 有差异(3) 按处理与误差的自由度查F值0.05,0.01临界值,与F值比较; F F0.05 认为处理间有显著性差异

26、,标记* ; F F0.01 认为处理间有极显著性差异,标记* 。(4) 总结:F 1 或1 F F0.05 可以下结论:处理间无显著性差异; F F0.05 进一步判断两两处理间的关系。4、 平均数的多重比较采用最小显著极差(LSR)法(1) H0 :A = B = C (2) = 0.05(3) 计算平均数的标准误 (4) 计算LSR值a、 首先确定参与比较的平均数的个数b、 按误差的自由度dfe查SSR(显著差异范围)表c、 计算LSR值LSR = SSR P23SSR0.052.923.07LSR0.054.064.27(5) 进行平均数的多重比较字母表示法(最通用的方法),对比较的结

27、果用字母表示。 B - A = 3.78 4.06 B - C = 6.11 4.27 A - C = 2.33 4.06 处理 平均数 B 14.11 a A 10.33 a b C 8.00 ba、 首先将平均数从大到小依次排列;b、 在最大的平均数上标字母a,再将它与以下各个平均数比较,凡差异不显著(LSR值)的都标上字母a,直到差异显著的平均数,标上字母b。在0.05水平上比较,用小写字母:a、b、c.;在0.01水平上比较,用大写字母A、B、C. ;c、 从b往上走找到分界点,再从分界点往下;d、 重复b、c 。3、 主要试验设计结果的方差分析 试验共4个处理,采用4次重复,试验布置

28、图如下:B 20C 21A 19A 23C 24B 18C 27B 19B 15A 21D 22A 13D 25C 20D 27D 22解:1、数据整理n、Tt、T2、平方和与自由度的分解(1)计算矫正数C C = (x)2 /(tn)(2)计算SST、dfT ; dfT = t n - 1(3)计算SSt、dft SSt = Tt2 / n - C ; dft = t - 1(4)计算SSe、dfe SSe = SST - SSt ; dfe = dfT - dft 3、 方差分析;列方差分析表进行F测验4、 多重比较LSR法第8章 直线回归与相关1、 变量间的关系有两类:(1)完全确定性的关系:函数关系;(2)不存在完全的确定性关系,不能用精确数学公式表示:相关变量

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论