医学统计学(医学检验检验总复习)_第1页
医学统计学(医学检验检验总复习)_第2页
医学统计学(医学检验检验总复习)_第3页
医学统计学(医学检验检验总复习)_第4页
医学统计学(医学检验检验总复习)_第5页
已阅读5页,还剩64页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

,医学统计学,总复习,绪 论,医学统计学是统计学的一门分支学科,它应用概率论和数理统计的原理和方法,研究医学领域数据资料的收集,整理分析和推断。它是进行医学科学研究所必需的主要手段。,医学统计学的主要内容有: 统计描述 参数估计 假设检验 医学科研设计,统计学基本步骤,设计,资料搜集,整理,分析,调查设计 实验设计,资料来源 质量控制,审核 合理分组,统计描述 统计推断,统计工作的步骤 设计 医学科研设计,调查设计,临床实验设计, 搜集资料 统计报表 统计资料 医疗卫生工作记录 (经常性工作记录) 专题调查或实验 (一时性工作记录), 计量资料 (数值变量) 观察单位某项指标测定值的集合。亦称变量值,是定量的指标,一般有单位。,统计资料的类型, 计数资料 (无序分类变量) 按性质和类别进行分组所得的资料。其变量值是定性的,可分二项分类和多项分类。 等级资料 (有序分类变量) 按某项指标的不同程度进行分组的资料。各组之间有量的差别亦为半定量的资料。,根据分析的需要各类资料可以互相转化。,三类数据间的关系,例:一组2040岁成年人的血压,以12kPa为界分为正常与异常两组,统计每组例数,8 低血压 8 正常血压 12 轻度高血压 15 中度高血压 17 重度高血压,定量数据,等级数据,定性数据,一、 变量与变异 变 量: 被观察单位的特征(即观察指 标)。观察指标的测定结果则 称变量值。 变 异: 同质个体间测定结果的差异。,医学统计学的几个基本概念,二、总体和样本 总 体 (population): 根据研究目的而确定的同质的观察单位某项指标测定值的集合。,有限总体,无限总体,总 体,样 本 (sample): 从总体中随机抽取部分观察单位组成 为使样本对总体具有代表性要求: 抽样必须遵循随机的原则 保证足够的样本含量,三、 抽样 从总体中抽样必须遵循科学原则 样本应具有: 代表性、随机性、可靠性、可比性,常用随机抽样方法:,机械抽样、分层抽样、随机数字表,完全随机设计:(两组或多组比较) 配对设计:(同源或异源两两配对) 随机区组设计:(两个以上受试对象组成一 个配伍组),四、 设计类型,五、 误差 (error) 系统误差、随机测量误差、抽样误差 (smapling error):指样本统计量与总体参数之差,由抽样所造成,是不可避免的,但可以控制。,抽样误差产生的原因:,1、个体之间存在变异; 2、样本是总体中的一部分。,是描述随机事件发生可能性大小的数值,用P表示。 0 P1 必然事件的概率为1(100%) 不可能发生事件的概率为0 随机事件的概率在01之间,六、 概率 (probability),总体 参数: , ,统计学基本概念,样本 统计量:,同质,变异,误差,变量,测量,P(A | B) = P(A and B) P(B),频率,概率,计量资料的分析,一、计量资料的统计描述 编制频数表, 频数分布的特征 集中趋势 变量值集中分布的位 置 离散趋势 变量值围绕集中位置 的分布情况 频数分布的类型 对称分布,某地区130名正常成年男子红细胞数(1012/L)的频数分布 红细胞数 划 记 频 数 (1) (2) (3) 3.70 | | 2 3.90 | | | | 4 4.10 正 | | | | 9 4.30 正正正 | 16 4.50 正正正正 | | 22 4.70 正正正正正 25 4.90 正正正正 | 21 5.10 正正正 | | 17 5.30 正 | | | | 9 5.50 | | | | 4 5.705.90 | 1 合 计 130,偏态分布 正偏态分布 238名正常人发汞值(g/g) 的中位数和百分位数的频数表计算 发 汞 值 频 数 累计频数 累计频率(%) (1) (2) (3) (4)=(3)/238 0.3 20 20 8.4 0.7 66 86 36.1 1.1 60 146 61.3 1.5 48 194 81.5 1.9 18 212 89.1 2.3 16 228 95.8 2.7 6 234 98.3 3.1 1 235 98.7 3.5 0 235 98.7 3.94.3 3 238 100.0,负偏态分布 某地某年恶性肿瘤死亡率的年龄分布 年龄组 恶性肿瘤死亡率(1/10万) 0 0.5 10 12 20 15 30 76 40 189 50 234 60 386 70 286,二、集中趋势(Central tendency) 的描述 平均数(average)常用于描述一组变量值的集中趋势,是反映同质资料的平均水平或集中位置的特征值。 均数 ( ) 常用平均数 几何均数(G) 中位数(M),常用平均数: 均数 (算术均数) (mean) 表示符号 总体均数 () 样本均数 () 应 用 对称分布资料,尤其是正态分布资料 计算方法 1+ 2+ n 直接法= = n n f 1 1+f 2 2+f kk f 加权法= = f 1 +f 2+f k n,常用平均数: 几何均数 (geometric mean) 表示符号 (G) 应 用 变量值呈倍数关系,对数正态分布资料 计算方法 直接法 G = n x1 x2 xn lgx1+lgx2+lgxn lgx 加权法 G = lg1 = lg1 n n f1lgx1+f2lgx2+fklgxk f lgx G = lg1 = lg1 n n,常用平均数 中位数 (median) 表示符号 (M) 偏态分布资料 应 用 变量值分布一端或两端无确定数值 分布不明资料 计算方法 直接用变量值计算 M = X n+1 (n为奇数时) 2 1 或 M= X n + X n+1 (n为偶数时) 2 2 2,i n 用频数表计算 M = L + ( fL ) fx 2 附:百分位数 ( Percentile,Px ) 描述变量值序列在某百分位位置的水平,多个百分位数结合可更全面地描述变量值的分布特征。 i Px = L + (n x% fL ) fx,三、离散趋势 (fendency of dispersion) 描述变量值的离散趋势用变异指标 全距( R ) 常用变异指标 标准差( S ) 变异系数( CV) 四分位数间距( Q),常用变异指标 全距 (range, 简记为R) 反映变量值的变异范围 R = 最大值 最小值 各种类型资料都可应用,但只作 参考资料,常用变异指标 四分位数间距 ( quartile, 简记为Q) 四分位数间距为特定的百分位数,可看作为中间1/2变量值的全距 Q = Qu QL Qu = P75 (上四分位数) QL = P25(下四分位数) 用途:用于表示偏态分布资料的变异程度,常与中位数配合使用,常用变异指标 方差 (variance) 和 标准差(standard deviation) 定义公式 ( ) 2 ( ) 2 2 = = N N ( ) 2 ( ) 2 S2 = S = n 1 n 1,应用公式 2 ( ) 2 / n 直接法 S = n 1 f2 ( f ) 2 / n 加权法 S = n 1, 方差和标准差 用 途 1. 表示变量值的离散程度,用于两组 变量值比较时,要求其性质相同, 均数相差不大 2. 与均数结合,表示均数的代表性 (s),常用变异指标 变异系数 (coefficient of variation, 简记为CV) 定义:CV = s / 100% 用途:比较两组或多组单位不同 或均数相差较大资料的变 异程度,描述性统计小结:,正态分布及其应用 正态分布的概念和特征 正态分布是以均数为中心呈对称的钟型分布 正态分布的特征有: 1) 正态分布曲线在均数处最高 2) 正态分布以均数为中心,左右对称且逐渐减少 3) 正态分布曲线的两个参数和,记作N (,) 4) 正态曲线下的面积为1 (或100%),正态曲线下的面积分布规律: 1 占正态曲线下面积的68.27% 1.96 占正态曲线下面积的95.00% 2.58 占正态曲线下面积的99.00% 若样本含量较大(n100),则上式可用代替, 用s代替。 则上式可写为: 1S 占正态曲线下面积的68.27% 1.96S 占正态曲线下面积的95.00% 2.58S 占正态曲线下面积的99.00%,正态分布、标准正态分布,曲线的高度(概率密度) 面积(概率密度函数积分) 正态分布的特点: 曲线下面积规律:,正态分布 N(,2),标准正态分布 N(0,1), 标准正态分布 标准正态分布为服从均数为0,标准 差为1,即N(0,1)的正态分布 其转换公式为:u = -/ 标准正态曲线的面积分布规律: -1 u +1 占总面积的68.27% -1.96 u +1.96 占总面积的95.00% -2.58 u +2.58 占总面积的99.00%, 正态分布的应用与临床参考值的确定 正态曲线面积分布规律可用于估计医学临床参考值与质量控制 临床参考值的确定方法 1) 正态分布法: 用于正态分布的资料 双侧参考值 uS 单侧参考值 - uS 或 + uS,2) 百分位数法:,用于偏态分布资料 双侧参考值(= 0.05) P2.5 P97.5 单侧参考值(= 0.05) P5 或 P95,医学参考值估计:,基本步骤,抽样 样本含量,“正常人”,测量/控制误差,分组确定?,单or双侧?,分布类型,百分界限,估计方法,正态分布法,对数正态分布法,百分位数法,用样本信息推断总体特征,称统计推断(statistical inference) 统计推断包括总体均数估计和假设检验 样本的统计指标和总体指标是有差别的,四、计量资料的统计推断, 均数的抽样误差和标准误 概念: 由于抽样造成的样本均数与总体均数之差别(-) 抽样误差是不可避免的,但可以控制。 表示方法:标准误(standard error) 标准误为样本均数的标准差,是说明样本均数抽样误差的大小的指标。,计算公式 = : 总体标准误 n S S = S :样本标准误, n 为的估计 值, t分布 概念 从正态总体N(,)中进行无数次样本含量为n的随机抽样,每次均可得 到一个和一个s,通过 式转换,可得无数个t值,t值的分布即 为含量为n的t值的总体或称t分布。, t分布 特征 以0为中心,左右对称 t分布曲线的形状与自由度有关 t分布曲线下面积为1 t分布曲线下面积分布可由t值表中查出: 双侧 P( t -t ) +P( t t) = 单侧 P( t -t ) = 或 P( t t) = , 总体均数的估计 点估计(point estimation) 用样本均数估计总体均数 区间估计(interval estimation) 按一定的概率(可信度,1 -)估计总体均数所在范围,亦称总体均数的可信区间,区间估计的方法: 1) 当未知时,2) 当已知或未知但n足够大时, 假设检验 (hypothesis testing) 假设检验的基本思想 先对总体的参数或分布作出某种假设,再用适当的方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。, 假设检验 (hypothesis testing),两组比较,资料呈正态分布 方差齐性,多样本方差分析,t检验,是,否,非参数统计,多组比较,样本与总体比较 配对资料比较,资料呈正态分布,否,是,两样本t检验,统计分 分析目的 可采用的指标统计和方法 析类型 统计 了解变量值的平均水平或集中趋势 均数 几何均数 中位数 描述 了解变量值的变异情况或离散趋势 极差 标准差 方差 变 异系数 了解客观事物或现象间相互关系 的密切程度与方向 相关分析 了解某一变量随其他变量的变化 而变化的数量关系 回归分析 统计 估计总体均数的大小 点估计 区间估计 推断 样本均数与总体均数的比较 t检验 u检验 两个样本均数的比较 t检验u检验(秩和检验,t检验) 配对样本均数的比较 配对t检验(秩和检验) 两个以上样本均数的比较 F检验(秩和检验) 两个以上样本均数间的两两比较 q检验(秩和检验),计量资料常用的统计分析方法,计数资料的分析,一、计数资料的统计描述 相对数,率、 构成比、 相对比 (率的标准化),二、计数资料的统计推断,总体率的估计,假设检验,分类变量资料统计分析小结,统计描述,统计推断,总体率的估计 各类卡方检验,有序分类,秩和检验,率、 构成比、 相对比 (率的标准化),无序分类,统计分 分析目的 可采用的统计 析类型 指标和方法 统计 反映某种随机事件发生的频率程度 率 描述 反映某个指标上另一个指标的多少倍 相对比 反映某一事件内部各组成部分的比重 构成比 由样本率推断总体率 点估计 区间估计 统计 样本率与总体率的比较 u检验 推断 两个样本率或构成比的比较 四格表X2检验(精确 概率法) 配对样本比较 配对X2检验 多个样本率或构成比的比较 行 列表X2检验 了解分类变量间有无联系 四格表或行 列表 X2检验,计数资料常用的统计分析方法,非参数检验方法:,适用于以下资料:,1)分布为偏态或分布形式未知的定量资料(数值变量),尤其在n30的情况下; 2)等级资料(有序分类变量); 3)个别数据偏大或数据的某一端无确定的数值。如“0.01mg”、“150mg”等,只有一个下限或上限而没有具体数值; 4)各组离散程度相差悬殊,即各总体方差不齐;,秩和检验的统计量、P值及统计推断,类型 统计量 P值 统计结论 配对比较 T在T0.05 内 P0.05 不拒绝H0,差异无统计学意义 T在T0.05外 P0 .05 拒绝H0, 差异有统计学意义 两样本 T在T0.05 内 P0.05 不拒绝H0,差异无统计学意义 比较 T在T0.05外 P0 .05 拒绝H0, 差异有统计学意义 多样本 H X20.05 P0.05 不拒绝H0,差异无统计学意义 比较 H X20.05 P0.05 拒绝H0, 差异有统计学意义,统计分 分析目的 可采用的统计 析类型 指标和方法 统计 反映各等级所占比重 构成比 描述 反映某一等级的数量是其余等级 的多少倍或百分之几 相对比 统计 了解按等级分类的两变量间的关系 等级相关系数 推断 比较单向等级资料的内部构成 行列X2检验 有无差别 等级资料的两个样本的比较 两样本比较的秩 和检验 等级资料的多个样本的比较 多个样本比较的秩 和检验 配对样本比较 配对符号秩和检验,等级资料常用的统计分析方法,双变量资料(线性关系),资料呈正态分布 方差齐性,是,否,线性相关与回归,等级相关,统计表 与统计图,1、统计表的结构和制作要求 2、统计图的制作要求 3、图型的选择,实验研究设计,三要素,受试对象,处理因素,试验效应,四原则,对照原则,随机原

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论