生物统计学1的学习教案_第1页
生物统计学1的学习教案_第2页
生物统计学1的学习教案_第3页
生物统计学1的学习教案_第4页
生物统计学1的学习教案_第5页
已阅读5页,还剩69页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

生物统计学1的学习教案第1页/共74页基本内容概述——生物统计学中的基本术语研究设计的基本原则和设计的类型研究设计资料的整理分析——统计描述研究设计资料的整理分析——统计推断22009-5第2页/共74页生物统计学(biostatistics)概念:以概率论与数理统计的原理和方法研究生命科学领域中随机现象的数量科学.内容:科研研究设计、资料的收集、整理综合归纳、表达与分析。目的:获得可信结论实质:应用性数学应用:生物学、医学、农学32009-5第3页/共74页科学研究的基本程序作为一项正规的生命科学研究,一般应有6个过程提出问题——选题科学研究设计——统筹安排获取试验与观察的资料数据审核与录入(真实)分析资料(重点,描述性统计和统计推断)分析结果的合理解释42009-5第4页/共74页生物统计学中的基本术语一、总体、个体、样本总体(population),基本单元为个体(individudual);有限总体和无限总体样本(sample),样本容量(n)样本大小:小样本(n﹤30),大样本(n≥30)2009-55第5页/共74页生物统计学中的基本术语二、变量与常数变量(variable):记为如身高155-180cm连续变量与离散变量(整数,人数)定量变量与定性变量(分类变量,如血型)常数(constant):总体均数2009-56第6页/共74页生物统计学中的基本术语三、参数与统计数参数——总体特征的度量(均数μ,标准差σ,希腊字母表示)统计数——statistic,源于样本。英文字母表示s,2009-57第7页/共74页生物统计学中的基本术语四、误差与错误误差——试验误差随机误差(抽样误差,偶然误差)系统误差(不当操作)2009-58第8页/共74页研究设计中的基本统计学原则研究设计——调查设计和试验设计调查设计——没有干预措施的描述性研究;

试验设计——有干预措施的分析性研究。生物学试验的基本要求——目的明确试验条件有代表性试验结果的可靠性试验结果的重演性92009-5第9页/共74页试验设计的相关要求基本要素——处理因素(treatment):单因素单水平,单因素多水平,多因素单水平,多因素多水平,;受试对象(testedsubject):同质性处理效应(treatmenteffect):结果(将试验效应分解——处理效应和试验误差,统计学检验-确定处理效应是否显著)102009-5第10页/共74页试验误差(experimenterror)类型:系统误差和随机误差来源:试验材料的固有差异;试验条件的不一致;操作技术不一致;偶然性因素等;控制途径:选择纯合一致的材料;标准操作;试验单位选择;合理的试验设计112009-5第11页/共74页试验设计的基本原则目的——控制和减少试验误差,提高准确度和精确度,减少人力、物力和财力。遵循的原则——1、重复(repetition)——同一处理设置的试验单位数。每个处理有2个或以上的试验单位,称为有重复的试验。例如:野外试验:每一样区为一个试验单位;

动物试验:一头动物可以为一个试验单位,有时一群为一个试验单位。

作用:估计试验误差和降低试验误差。

重复次数的选择——根据试验的要求和条件而定。122009-5第12页/共74页试验设计的基本原则遵循的原则——2、随机(random)——一个重复中的某一个处理或处理组合被安排在哪一个试验单位是随机的。

方法:随机数字表法作用:降低试验误差。3、局部控制——在不能把所有的非处理因素均衡控制时,将大环境分解成若干个相对一致的小环境,称为区组(block)或重复,再将小环境其分成若干试验单位安排不同的试验处理,在局部对非处理因素进行控制。小环境间的差异用方差分析去除。作用:降低试验误差。132009-5第13页/共74页试验设计中的对照对照(control,CK)——确定误差的大小。类型空白对照(blankcontrol)-不加处理;实验对照(experimentcontrol)-在有关条件下进行观察的对照;标准对照(standardcontrol)相互对照(intercontrol)-实验组间配对对照(pairedcontrol)自身对照(self-control)142009-5第14页/共74页试验设计方法1、对比设计(comparisondesign)

最简单的试验设计方法。设置一个试验组和几个试验组与许多标准区(对照区)依次比较,在同一重复内各处理顺序排列。配对设计——将受试对象按照某些特征或条件配对。

(1)同源配对——同一受试对象用两种处理方法;同一受试对象自身前后实验结果的对比;双生子

(2)非同源配对——具有相同条件的配对。152009-5第15页/共74页配对设计例1:10只家兔接种疫苗后的体温变化如表1,检验接种前后体温是否有显著变化?表110只家兔接种疫苗后的体温变化(℃)162009-5兔号12345678910A10138352067103B25121415122718111514第16页/共74页配对设计例2:选生长期、发育进度一致的番茄植株配成一组,得到10组,每组中一株接种A处理病毒,另一株接种B处理病毒,研究不同处理方法钝化病毒的效果,测定病毒在番茄上的产生的病痕数目如表2,检验两种处理方法是否有差异?表2两种处理的病毒在番茄上的产生的病痕数172009-5组别12345678910接种前38.038.238.238.438.438.138.138.238.538.3接种后38.438.538.538.838.938.538.738.538.539.0第17页/共74页2、完全随机设计(completelyrandomdesign)将观察单位完全随机地分配到试验组和对照组中或几个对比组中。目的:研究不同处理因素间是否存在差异。可进行单因素方差分析。若各处理间有差异,可进一步做两两比较-多重比较,如LSD法。表3不同剂量激素处理后植物根系的生长变化182009-5激素浓度(mM)观察值(cm)00.20.30.20.30.40.20.20.10.20.30.30.30.40.40.30.40.30.50.60.60.70.60.80.70.80.61.00.30.40.50.40.40.30.50.3第18页/共74页例4:有5个不同品种猪的育肥实验,后期30天增重结果如表3,检验不同品种间增重是否有差异?表45个不同品种猪的增重(kg)192009-5品种增重A121.519.520.022.018.020.0A216.018.517.015.520.016.0A319.017.520.018.017.0A421.018.519.020.0A515.518.017.016.0第19页/共74页试验设计方法3、随机区组设计(randomizedblocksdesign)将多方面条件相近的受试对象配成一组,构成一个区组,使区组内非实验因素差异最小而区组间非实验因素差异最大,每个区组均包括全部的处理。区组内各处理随机排列,各区组独立随机排列。可进行单因素、多因素统计分析202009-5第20页/共74页试验资料的收集与整理试验资料的类型数量性状资料——计数和测量获得计数资料——非连续变量计量资料——连续变量质量性状资料——按属性统计(A型、B 型等)统计次数法——计算频率评分法——将质量性状量化(免疫0,高度抵抗1,中度抵抗2,感染3)2009-521第21页/共74页例5.为了探讨四种不同药物配方(A,B,C,D)对肿瘤细胞增殖的抑制效应,选用每4只同质的大白鼠为一个区组,共设5个区组,区组内的4只大白鼠随机分配一种处理药物,观测肿瘤细胞种植后相同时间内瘤体的大小,见表5.(配伍组设计)表5不同药方对肿瘤体积变化的观测结果222009-5区组ABCD10.500.380.260.2620.740.620.180.1830.810.340.200.2040.520.400.340.3450.660.260.170.17第22页/共74页试验资料的收集调查——方法:普查与抽样抽样——随机抽样,代表性好,样本容量根据特定的要求而计算。2009-523第23页/共74页平均数资料样本容量的确定南洋黄牛的体高均值为133cm,s=4.07cm,现希望以95%的可靠性进行估计,要求估计误差不超过0.5cm,问需要抽取的黄牛样本数为多少?解:L为允许误差,L=t0.05Sx,,Sx=S/n=(t20.05S2

/

L2t(0.05,∞)=1.96

n=4S2/

L2

=4×4.072/0.052=2652009-524第24页/共74页频率资料样本容量的确定n=4pq/

L2希望了解40岁以上男性冠心病患病率,根据以往调查,患病率可能在10%左右,允许误差为2%,调查多少人合适?解:p=10%;q=90%;L=2%n=4pq/

L2=9002009-525第25页/共74页试验资料的收集试验方法——试验设计方法——对比设计,完全随机设计,随机区组设计,正交试验设计等2009-526第26页/共74页试验资料的整理原始资料——检查核对正确原始资料的整理——样本容量在30以下直接分析;样本容量在30以上分组分析——频数表与分布图2009-527第27页/共74页计数资料的整理100只来亨鸡每月的产蛋数11-17个。列出频数表每月产蛋数次数频率累积频率1120.020.021270.070.0913190.190.2814350.350.6315210.210.8416110.110.951750.051.002009-528第28页/共74页计数资料的整理如果变量较多,变异范围较大,可以按照变量值归组。如不同小麦品种300个麦穗粒数的分布表。麦穗粒数频数频率累积频率18-2230.010.0123-27180.060.0728-32380.130.2033-37510.170.3738-42680.230.5943-47530.170.7748-52410.140.9153-57220.070.9858-6260.021.002009-529第29页/共74页计量资料的整理组距归组计算全距,组数,组距,上、下限150尾鱼的体长——150个数据全距=max-min=85-37=48cm组数与样本容量有关:30-60:5-8组;60-100:7-10组;100-200:9-12组;200-500:10-18组;500以上:15-30组;本题:取10组2009-530第30页/共74页计量资料的整理组距=全距/组数=48/10=4.8≈5cm上、下限确定:最小组应包括最小值,最后组包括最大值本题min=37,max=85(第一组)35~;40~;45~;50~;55~;60~;65~;70~;75~;80~;85~(最后一组)组中值=(上限+下限)/22009-531第31页/共74页计量资料的整理组限/cm组中值/cm频数频率累积频率35~37.530.020.0240~42.540.030.0545~47.5170.110.1650~52.5280.190.3555~57.5400.270.6160~62.5250.110.7865~67.5170.040.8970~72.560.050.9375~77.570.010.9880~82.520.010.9985~87.510.011.002009-532第32页/共74页次数分布图——纵坐标为频数条形图——适合于计数资料和属性资料的频数分布。每个格间隔一定距离;饼图——适合于计数资料和属性资料的频数分布。可以计算频率(构成比);直方图——适合于计量资料频数分布。以组中值为横坐标,连续无间隔;多边图——折线图,适合于计量资料频数分布;散点图——适合于计量资料和计数资料的频数分布2009-533第33页/共74页342009-5表1100只来亨鸡每月产蛋数的次数分布表每月产蛋数次数频率累积频率1120.020.021270.070.0913190.190.2814350.350.6315210.210.8416110.110.951750.051第34页/共74页352009-5图1来亨鸡每月产蛋数的次数分布图图2来亨鸡每月产蛋数的次数分布图条形图与饼图每月产蛋数(个)每月产蛋数频数第35页/共74页362009-5多边图与散点图图3来亨鸡每月产蛋数的次数分布图图4来亨鸡每月产蛋数的次数分布图每月产蛋数(个)每月产蛋数频数每月产蛋数(个)每月产蛋数频数第36页/共74页372009-5组限/cm组中值/cm频数频率累积频率35~37.530.020.0240~42.540.030.0545~47.5170.110.1650~52.5280.190.3555~57.5400.270.6160~62.5250.110.7865~67.5170.040.8970~72.560.050.9375~77.570.010.9880~82.520.010.9985~87.510.011.00表2150尾鲤鱼体长(cm)的次数分布表第37页/共74页382009-5图1鲤鱼体长(cm)的次数分布图直方图鲤鱼体长(cm)鲤鱼体长频数鲤鱼体长(cm)鲤鱼体长频数鲤鱼体长(cm)鲤鱼体长频数折线图散点图饼图第38页/共74页统计分析图示均值和离散趋势2009-539试验资料特征数的计算第39页/共74页试验资料特征数的计算集中趋势:均数(算术均数)*——直接计算和加权计算(频数的加入),总体均数与样本均数的表示中位数(Md,P50

:借助累积频率计算众数:几何均数:2009-540第40页/共74页计量资料的整理组限/cm组中值/cm频数频率累积频率35~37.530.020.0240~42.540.030.0545~47.5170.110.1650~52.5280.190.3555~57.5400.270.6160~62.5250.110.7865~67.5170.040.8970~72.560.050.9375~77.570.010.9880~82.520.010.9985~87.510.011.002009-541众数=57.5也是P50所在组段表2150尾鲤鱼体长(cm)的次数分布表第41页/共74页集中趋势422009-5P50中位数=中位数所在组段的下限+组距×(0.5n-中位数所在组前一组的累积频数)/中位数所在组段的频数P50=55+5×(0.5×150-28)/40=60.875第42页/共74页试验资料特征数的计算离散趋势极差:R方差:s2标准差:s:(标准误sx)变异系数(单位不同,或样本均数差别较大时):CV%=s/x×100%多样性指数2009-543第43页/共74页概率与概率分布频率与概率:p∈[1,0]事件:必然事件,随机事件,不可能事件事件间的关系:独立事件,互斥事件,对立事件概率计算法则:积定律(乘法定理),和定率(加法定理)概率分布:离散型与连续型2009-544第44页/共74页常见的理论分布1、二项分布特征:每次试验两种结果,每次试验具有重复性和独立性做n次试验,A结果出现x次,x=0,1,…n次数的分布为二项分布:

2009-545第45页/共74页1、一个家庭有5个孩子,3男2女的概率?2、某小麦品种在条件出现自然变异植株的概率为0.0045,试计算(1)100株苗,获得2株或以上便衣植株的概率?(2)期望有0.99的概率获得1株或以上的变异植株,至少应调查多少株?(1):p(0)=?

p(1)=?p(x≥2)=1-p(0)-p(1)=0.2879(2)调查的株数n应该满足的条件:p(0)=1-0.99=0.01p(0)=Cn0p0qn=0.01

n=10212009-546第46页/共74页二项分布的参数频数表示:μx=npσx2=npq频率表示:μp=pσp2=pq2009-547第47页/共74页正态分布(normaldistribution)第48页/共74页一.概念正态分布又称高斯(Gauss分布),是统计学中最重要的分布,生物学、农学、医学资料中有许多指标如身高、体重、红细胞数频数分布都呈正态分布。第49页/共74页第50页/共74页第51页/共74页二.

图形

正态分布密度函数其中是μ均数,σ是标准差。记N(μ,σ2)第52页/共74页三.

特征1.

是单峰曲线,x=μ2.

以均数μ为中心左右对称

3.

有2个参数,μ:位置参数,

σ:变异度参数

σ越大,数据越分散,曲线越平坦。特别地N(0,1)称为标准正态分布(z分布、u分布)第53页/共74页第54页/共74页四.正态曲线下面积的分布规律第55页/共74页正态曲线下,横轴上所夹的面积为1,标准正态分布下-1.96~1.96部分的面积为0.95(可以通过积分求得)。也就是说|u|>1.96的面积为0.05,对任意的x,-x~x区间面积为多少呢?统计学家已将此编制成了正态分布界值表(U值表),不过表中的面积是指p(u<x),也记作φ(x)。四.正态曲线下面积的分布规律第56页/共74页以上讨论的是标准正态分布对一般的正态分布,某指标x~N(μ,σ2),则u=(x-μ)/σ~N(0,1)即-1.96<u<1.96的面积为0.95μ-1.96σ<x<μ+1.96σ的面积为0.95第57页/共74页正态分布正态分布记为:N(μ,σ2

)正态离差:离开均数μ有几个σu=(x-μ)/σu的重要数值:μ±1.96σ

(95%)

μ±2.58σ(99%)2009-558第58页/共74页五.

正态分布的应用1、估计常值范围第59页/共74页例120名健康成年男性农民舒张压的均数为10.1kPa,标准差为0.93kPa,求舒张压的95%双侧正常值范围。±1.96s=10.1±1.96×0.93即8.28~11.92kPa95%参考范围(referencerange)或正常范围(normalrange)仅仅告知95%健康者的测定值在此范围之内,并非告知凡在此范围之内皆健康,也非告知凡在此范围之外皆不健康,所以不可将之作为诊断标准。第60页/共74页2.

正态分布是许多统计方法的理论基础,如后面要讲的t检验、方差分析、相关回归等,t分布、二项分布、Poisson分布的极限分布也是正态分布。第61页/共74页3.估计频数分布例出生体重低于2500克为低体重儿。若由某项研究得某地婴儿出生体重均数为3200克,标准差为350克,估计该地当年低体重儿所占的比例。第62页/共74页记x为当年该地婴儿出生体重,则x服从正态分布N(3200,3502)P(x<2500)

查标准正态分布界值表Φ(-2)=0.0228即估计该地当年低体重儿所占的比例为2.28%第63页/共74页调查某玉米品种50穗的穗长资料:x=15.7cm,s=1.02cm。计算(1)玉米穗长95%的正常值范围;(2)穗长大于16cm的概率。解:

u分布的应用(1)正常值范围:x±us95%的正常值范围的双尾u0.05=1.96

上限:x+1.96s=17.70(cm)下限:x-1.96s=13.70(cm)

95%的正常值范围为:13.70~17.70cm(2)x>16cm:u=(16-15.7)/1.02=0.29

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论