医学统计学重点_第1页
医学统计学重点_第2页
医学统计学重点_第3页
医学统计学重点_第4页
医学统计学重点_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1 . 变 异: 同 质 事 物 之 间 的 差 别。2 .频数分布的两个特征:集中位置,离散趋势3 .数据分布的类型:对称分布和非对称分布。非对称分布又称偏态分布,包括正偏态和负偏 态。单峰分布,双峰分布,多峰分布。4 .统计描述:用统计表、统计图和统计指标等方法对资料的数量特征与分布规律进行描述。5 .集中位置的描述,集中位置指标又称平均数指标。有哪些及适用条件?(1)算数平均数:最适用于单峰对称分布资料的平均水平的描述,特别是正态分布资料(2)几何平均数:适用于等比资料 对数正态分布资料(3)中位数和百分位数:适用于偏态分布的资料开口资料 资料分布不明等6 .离散趋势的描述(1)全距亦称

2、极差,适用于单峰小样本资料(2)四分位数间距,适用于单峰小样本资料(3)方差和标准差,适用于对称分布尤其是正态分布资料(4)变异系数,常用于比较度量衡单位不同的两组或多种资料的变异度比较均数相差悬殊的两组或多组资料的变异度7 .常用相对数(1)率,是二分类指标(2)构成比(3)比8 .正确应用相对数应注意几个问题:(1)计算相对数的分母不宜过小(2)分析时不能以构成比代替率(3)对观察单位数不等的几个率,不能直接相加求其总率(4)计算率时要注意资料的同质性,对比分析时应注意资料的可比性(5)也有抽样误差,需要假设检验。9 .率的标准法(1)基本思想:采用统一的标准,以消除病情构成不同对治愈率比

3、较的影响,使算得的标 准化治愈率有可比性。(2)目的:控制混杂因素对研究结果的影响。10 .正态分布(1)概念P16(2)标准正态分布,u变换:u=-,u是标准正态离差,n是均数,o是标准差。uN (0, 1)(3)正态分布的特征:是单峰分布,高峰位置在均数 X=p处。以均数为中心,左右完全对称。取决于两个参数,均数仙和标准差八以为位置参数,以越大,则曲线沿横轴向右移动; 小越小,则曲线沿横轴向左移动。b为形态参数,表示数据的离散程度,若小,则曲线形 态“瘦高”;大,则曲线形态“矮胖”。有些指标不服从正态分布,但通过适当的变换后服从正态分布,如对数正态分布。正态分布曲线下的面积是有规律的:总面

4、积恒定为1,对称区域面积相等,对应区域面积相等。(4)几个u界化 90%:双侧110产单侧1005 =1.64 0.10.0595%:双侧 跳.05=单侧 廓.025 =1.9699%:双侧跳.0单侧跳.005=2.5811 .二项分布(1)样本率的标准差p的估计值sp计算公式:Sp=jplpl, p是样本率(2)样本个数n和概率冗如何影响二项分布的图形?给定n后,形状取决于冗。当冗=0.5时,分布对称;当冗0.5时分布呈正偏态;当冗0.5 时分布呈负偏态。随n的增大,分布逐渐逼近正态分布。如果 n冗或n(1-冗)大于5时,则 可用正态近似原理处理二项分布的相关问题。(3)应用条件:对立性,重

5、复性,独立性。12 .Poisson 分布(1)概念,描述罕见事件发生次数的概率分布,是特殊的二项分布。(2)均数与方差相等,均为入。(3)形状取决于人的大小,为正偏态分布,入越小分布越偏;随着人的增大,分布逐渐趋于 对称,当人=20时,已基本接近对称分布;当入 方0时,可按正态分布原理处理 Poisson分 布的有关问题。(4)Poisson分布具有可加性。(5)应用条件:对立性,重复性,独立性。即事件的发生是相互独立的,且发生的概率不变, 结果是二分类的(发生或不发生)13 .参考值范围(1)概念:绝大多数正常人某指标的波动范围。(2)正态分布法计算100 (1-a) %正常值范围:双侧

6、X u S单侧X-u S (高侧)X+u S (低侧)注意a取化 双侧95% X 1.96S单侧95%高侧<X 1.64S低侧 >X+1.64S(3)百分位数法:知道求得第几个百分位数 P2614 .抽样误差(1)概念:由于个体变异的存在,由抽样引起的样本统计量与总体参数间的差异。(2)产生的两个必备条件:抽样研究 个体变异,是根本原因(3)中心极限定理的涵义从均数为小、标准差为6的正态总体中独立、重复、随机抽取含量为n的样本,样本均数的分布仍为正态分布,其均数为小,标准差为大XN(小,0 一 XN(p, -2)即使从非正态总体(均数为小、标准差为6)中独立、重复、随机抽取含量为n

7、的样本,只要样本含量足够大(如n而0),样本均数也近似服从均数为八标准差为 、的正态分布。(4)标准误意义:1.用来衡量抽样误差的大小2.x =1n标准误与个体变异6成正比,与样本含量n的平方根成反比_ ssx =1n(5)标准误的估计值的计算公式:样本标准差 s代替总体标准差八(6)标准差与标准误的关系区 别差 标s准误标s 准意义个体 变异误抽量统 差样的计用途日 值正1.96s) X 范常 1(同信的均总96 x 区可数体与系n 关,稳趋n 士7E于,s于n丁Sx趋,_ s sx =1n联系:两者都是变异指标,说明个体之间的变异用标准差,说明统计量之间的变异用标准当样本量不足时,标准差大

8、,标准误也大,均数的标准差与标准误成正比15 .医学统计学:运用概率论和数理统计等数学的原理和方法, 研究医学领域中资料的搜集、 整理、分析和推断的一门学科。16 .三类资料:定量资料(数值资料)定性资料(无序分类资料)等级资料(有序分 类资料)17 .总体:按研究目的所确定的研究对象中,所有观察单位某项指标取值的集合。18 .样本:从研究总体中,随机抽取具有代表性的部分观察单位某项指标取值的集合。19 .同质性:具有相同性质的事物。20 .参数:描述某总体特征的指标。21 .统计量:描述某样本特征的指标。22 .概率:随机事件发生可能性大小的一个度量,取值范围为0印词23 .小概率事件:发生

9、概率怎.05的事件。24 .小概率原理:小概率事件发生的可能性很小,进而认为其在一次抽样中不可能发生。25 .理解和解释可信区间26 .统计推断:根据样本所提供的信息,以一定的概率推断总体的性质。包括两方面的内容: 参数估计和检验假设。27 .可信区间的两个要素:可靠性,精确性X -28 .均数的可信区间:从正态分布总体 N(p, 2)中随机抽取一个样本,则t=X一服从自由 sx度产n-1的t分布。总体均数的(1-a)可信区间定义为(X -ts. , X +tsx)。如n>100,可用标准正态分布代替t分布,相应的100 (1- a) %可信区间为(Xu sx, X + u sx)。29

10、 .率的可信区间:(1)率的标准差又称率的标准误,为 s=,包S2 spn(2)总体率冗的区间估计用正态近似法的条件:样本含量n足够大,且样本率p和(1-p)都不太小时,如np和n (1-p)均大于5时,冗的可信区间为(p-u sp, p+usp)030 .事件数的可信区间:当 X芭0也可以查附表7 "Poisson分布入的可信区间”,得到人的 95%或99%可信区间。31 .假设检验(1)基本思想:(2) 4个基本步骤:建立检验假设:H0:1 = 2= 3 =H1:1、2、3之间不等或不全相等。确定检验水准(拒绝H。时的最大允许误差a)计算检验统计量并求P值界定P值并作结论(要回下

11、结论):P 0a拒绝H0,接受H1 ;P > % 不!绝 H 0 0(3) I型错误:Ho真实时被拒绝。P>0.05却拒绝H0接受H1(4) II型错误:H0不真实时不拒绝。H1真实即P<0.05却不拒绝H0(5)检验功效:R型错误率B表示失去对真实的Hi作出肯定结论之概率,故1-B就是对真实的Hi作出肯定结论之概率,常被用来表达某假设检验方法的检验功效,即假设检验对真实的Hi作出肯定结论之把握程度。(6) I型错误与II型错误的关系 P51(7)单侧检验与双侧检验的关系(8)假设检验与可信区间的关系32 .怎么做题?判断资料类型一设计方法一计算自由度一确定P值一下结论33

12、.区分配对和成组配对:同质性差,要算差值 自身配对 一般有编号成组:无原始数据(还有均数)两组样本含量不等,不能配对 无编号34 .t检验(1)应用条件:独立性,正态性,方差齐性(2)两样本均数比较方差不齐时t'检验(3)两样本几何均数比较:取对数,t检验,不用反对数35 .方差分析,多个均数比较总变异SS、: =SSa间+ SS内处理因素、个体差异、随机因素,共同导致的差异。(2)组向变异ss且间:多个组的处理因素不同和随机误差,导致的差异。(3)组内变异SS且内:组内个体差异和其他随机因素,导致的差异。(4)二种变异的关系:ss>=SSm + SS&内,总=组间+组内

13、F MS组间/MS组内(5)单因素方差分析表和两因素方差分析表36 .多个样本均数的两两比较,对比的组数 k大于2,分别t检验则需经过m=k (k-1) /2次 比较,若每次比较的第一类错误率为 a,则多次比较后,至少犯一次第一类错误的概率为1(1- )m,比预先设计的a要大。37 .变量转换目的38 .F值、t值、q值、q'值之间的关系(1)两样本均数比较时,7F = t。用q检验或q'检验也得到同样的结论。说明在两样本均数比较时,t检验、F检验、q检验和q'检验是等价的。(2)当组数k>2时,q'检验的检验功效高于q检验,所以当实验研究设计为一个对照组

14、与 多个实验组均数比较时,q'检验科得到较高的功效。定性资料的分析39 .假设检当步骤P732 r 一八40. 检验(1)基本思想:(2)应用条件:nN0, T/,用2检验n N0但1 «5,需用校正2检验T<1或n<40,改用确切概率法(3)理论频数T的计算公式:TrcnR%n(4) RXC表的自由度v =(行数-1 )(列数-1),故四格表v =12要记的界化0g3. 8441 .配对2检验的应用条件:b、c为结果不同部分(甲阳乙阴、甲阴乙阳)b+cN0时不用校正2 = c v =1b clb-c-1220<b+c <40 时要校正2 = J v

15、=1b c42 .RXC表的应用条件:多个率或构成比的比较,其自由度大于 1RXC表中不宜有%以上格子的理论频数小于5,或不宜有一个理论频数小于143 .对理论频数太小的样本的处理办法:增加样本例数删去理论频数太小的行或列将太小理论频数所在的行或列的实际频数,与性质相近的邻行或邻列的频数,合并。44 .参数检验:以特定的总体分布(如正态分布、二项分布)作为前提,对总体的参数进行 的假设检验,限制条件:总体正态分布、总体方差齐性。45 .非参数检验:不依赖于总体的分布类型,不针对总体参数,只针对总体分布是否相同的 检验方法;常用于解决总体分布未知的统计问题。46 .秩和检验(1)基本思想:两组秩

16、和相加等于 N(N+1)/2。(Q + n2=N)(2)两组比较的秩和检验基本思想:若A、B两组等级分布相同,则含量为5的样本之实际秩和T与其理论秩和1(N+1)/2之差T ni(N 1)/2纯系抽样误差所致,因此差值不会很大,差值越大的概率越小。方法步骤:P88仔细弄明白1 0建立检验假设:H。:两组分布相同;Hi:两组分布不同。a=0.052 0编秩3 °求秩和T4 0确定检验统计量T50确定P值,作出推断性结论(3)配对秩和检验:设n为非0差值的个数,则T +T =n (n+1) /2。(4)秩和检验的使用范围:理论上可用于任意分布的资料等级资料定量资料,开口资料定量资料,分布

17、极度偏态,或个别数值偏离过大而不属于“过失误差”者定量资料,各组离散程度相差悬殊,即使经变量变换,也难以达到方差齐性定量资料,分布型尚未确知兼有等级和定量性质的资料(5)秩和检验的优缺点:P9547 .直线相关(1)概念:用来描述两个呈正态分布的变量之间的线性共变关系。(2)应用条件:双变量正态分布48 .相关系数(1)概念:表达两变量间线性相关的程度和方向的一个统计指标。(2)特征:无量纲取值范围为-1年司。相关系数小于0为负相关;大于0为正相关;等于0为零相关相关系数的绝对值越大,表示两变量间的相关程度越密切;相关系数越接近于0,表示相关越不密切。(3)相关系数的假设检验用t检验Sr为相关

18、系数的标准误r有公式建立检验假设:Hi :r t=Sr1-r2= r/'n-2p =0,与.无相关关系;p为,与有相关关系。a=0.05计算检验统计量Sr, r, t, v =n-2作结论:按V =8查t界值表得PV0.001。按0=0.05水准拒绝Hg,接受Hi。故可认为与之间有正相关关系。50 .何时用等级相关?51 .直线回归(1)自变量x,应变量y(2)直线回归方程的一般表达式:Y?=a+bXa、b是决定回归直线的两个参数:a为回归直线在y轴上的截距;b为回归系数,即回归直 线的斜率。(3) b的意义:表示自变量增加一个单位时,应变量的平均改变量。要会解释,例如b=0.2385

19、 (103cm2/kg),表示体重增加1 (kg),则体表面积平均递增0.2385 (103 cm2)。(4) Y?的意义:表示给定X时Y的平均值的估计。例如X=12 (kg)时,Y?=5.3832 (103 cm2), 其意义是:所有体重为12 (kg)的3岁男童,估计其平均体表面积为 5.3832 (103cm2)。(5) Y-Y?的意义:称为剩余、残差,是 y的观察值与对应的估计值之差。在回归图中表示各散点到回归直线的纵向距离。(Y必=02(6) Y Y?的意义:剩余平方和。坐标系中,每一条直线均可计算散点到该直线的纵2向距离之平方和;但只有各散点到回归直线的纵向距离之平方和,即 Y Y?是唯一最小的。以此为准则,可导出a、b的最小二乘估计(公式)。52 .回归系数的假设检验用t检验x的影响后,y本身的(1) SY?X为剩余标准差,常用于评价啊回归方程的拟合精度。扣除变异程度C 22 s吊(2) Sb为样本回归系数的标准误Sb = sY?X /3xx(3)检验假设:H。:总体回归系数 户0,即与无回归关系;Hi:总体回归系数B 0=,即与有回归关系。a=0.05。 b-0计算检验统计重:sY?X , sb , tb =, v =n-2Sb作结论:按v =8查t界

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论