统计学方法概述课件_第1页
统计学方法概述课件_第2页
统计学方法概述课件_第3页
统计学方法概述课件_第4页
统计学方法概述课件_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2024/5/121

人群健康研究的统计学方法2024/5/122

“统计”一词,对一般人来说并不陌生。在报刊上常见用来说明我们工作、事业成绩的数字、表、图,称为统计数字、统计表和统计图。在西方,统计学(statistics)一词,源出于state(国家、情况),专指有关“国情”的学问,最初多用于文字记叙,后发展为数量比较,随着概率论思想与方法的引入,逐渐形成今天在理论与应用方面都已相当完备的独立学科。1.

某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高,如果甲班的平均身高大于乙班,能否推论甲班所有同学的平均身高也大于乙班?为什么?

2.用A,B两种药物分别治疗同病患者各50人,如果A药的治愈率(60%)高于B药(50%),证明A药的疗效优于B药。这种说法对吗?为什么?

思考题2024/5/124医学统计学的主要研究内容

1、统计学设计(1)内容:临床试验设计、实验室研究设计、调查研究设计等。(2)目的:①控制和缩小随机误差,消除系统误差;②节约样本含量;③尽可能多地获取有关信息,达到高效低耗的目的。2、统计分布

事物所表现的数量特征是千差万别的,其所呈现的分布规律是进行统计学推断的基础和根据。3、各种统计量(或称统计指标)的性质、特点及其分布规律4、统计分析方法(包括各种数学模型)尤其是随着计算机的普及和发展,多因素分析方法发展很快。2024/5/125如何学习医学统计学1、掌握基本概念、基本原理和基本方法。培养统计思维能力。2、掌握常用统计分析方法。对统计公式,要求了解其用途、适用条件和注意事项。切忌死记硬背,关键是灵活运用。3、重视习题课。联系实际,紧密结合专业知识,多做练习题。2024/5/126例:治疗某病的新疗法新法:(100例)有效20例,有效率20%;旧法:(100例)有效15例,有效率15%;这两个百分数就是统计描述指标,现在的问题是,这两种疗法的有效率会稳定不变吗?如果说不会,是什么原因?那么,两种疗法的真实有效率会是多少?我们能根据统计描述(20%与15%)就去正式采用还有较大副作用的新疗法?对这样的差异问题,你能再凭直觉去作“否定”?在作任何回答之前,必须判断20%与15%之间的差别是真实的差异,或是仅仅由于“机遇”所致。这里,统计推断可提供帮助。学过统计学,将会了解不仅可判断新疗法是否较好?而且,如果判断它是较好,还能估计判断是错误的可能性有多大。2024/5/127

统计分析是科研工作中的一种有力工具。它从科研的总体设计、资料采集、资料整理、资料分析直到最后作出结论都有密切关系。掌握了这个工具可以使用较少的人力、物力和时间获得比较可靠的结果。需要运用统计方法的场合而不去运用它可能造成不应有的缺陷或得出错误的结论。

2024/5/128

例:北京某医院某大夫使用“乌贝散”(乌贼骨3钱,白芨3钱,川贝3钱,甘草3钱,共研细末过120目筛,冲服)治疗胃溃疡病出血107例,有效101例,有效率为94.4%。那么如果别的医院,其它大夫使用“乌贝散”来治疗胃溃疡病出血,其有效率也一定是94.4%吗?显然,不一定恰为94.4%,那么是多少呢?比它高还是比它低?这就是一个求可信区间的问题。2024/5/129

例:某杂志中一篇文章报导,用某种中草药治疗玫瑰糠疹,有效率为78%,平均疗程为三周左右。问此药治疗玫瑰糠疹的确有效吗?由于玫瑰糠疹具有自然治愈的情况,一般不服药,多喝水,到三周左右有些患者也会自愈。所以,此药的78%疗效有待探讨。这就要求设立具有可比性的对照组。2024/5/1210

再譬如,用某药治某病,治一例有效,能说100%有效吗?治疗二例有效,能说明100%有效吗?治十例,其中九例有效,能说90%有效吗?显然,观察的例数将是个重要因素,例数太少不足以说明问题。观察例数太多,将费时,加重科研经济负担。那么观察多少例能说明问题?这是一个样本可靠性问题。

2024/5/1211

一些现象既有规律性又有随机性,肺癌患者中(主动或被动)吸烟的比例较大,这体现了规律性,而绝非每个吸烟的人都会患肺癌,这体现了随机性;再如,一般来说,白种人身材比黄种人要高些,这就是规律性,但对于具体的一个白人和一个黄种人,就很难说谁高谁矮了,这体现随机性。2024/5/1212第一节统计学方法概述一、统计学的意义统计学是运用数理统计的原理和方法,研究数据资料的搜集、整理、分析与推断的科学,是认识社会和自然现象客观规律的数量特征的重要工具。医学统计学是认识医学现象数量特征的重要工具,是运用数理统计的原理和方法,结合医学实际,来研究医学科研的实验设计和数据处理的一门科学。“医学统计学是处理医学资料中的同质性(homogeneity)和变异性(variation)的科学与艺术”2024/5/1213二、统计学中的几个基本概念

(一)同质与变异(二)总体与样本(三)参数与统计量(四)误差(五)概率2024/5/1214(一)同质与变异homogeneityandvariation

同质:指观察单位(研究个体)间被研究指标的影响因素相同。个体:即观察单位,是统计研究中的最基本单位。变量:观察单位的研究特征变量值:变量的观察结果变异:指同质的个体之间的差异。2024/5/1215

同质与变异的例子例1调查2008年淄博市7岁男童的身高和体重同质:2008年、淄博市、7岁男童变异:身高和体重各不相同例2研究某降压药的疗效同质:高血压患者、用某药治疗变异:疗效各不相同2024/5/1216120名正常成年男子红细胞计数值(1012/L)

5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.645.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.69最大值=6.18,最小值=3.29,极差=2.89算术均数=4.72,标准差=0.57

2024/5/12172024/5/1218(二)总体与样本populationandsample总体:根据研究目的所确定的同质观察单位某项变量值的集合(全体)。分有限总体与无限总体样本:从总体中随机抽取的部分观察单位变量值的集合。2024/5/1219随机抽样randomsampling为了保证样本的可靠性和代表性,需要采用随机的抽样方法(在总体中每个个体具有相同的机会被抽到)。2024/5/1220(三)参数与统计量

parameterandstatistic参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数

总体样本抽取部分观察单位

统计量

参数

推断inference统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。

参数附近波动的随机变量。2024/5/1221(四)误差

error误差:泛指实验数据的实测值与真实值之差1系统误差2随机测量误差3抽样误差2024/5/1222系统误差

systematicerror

在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为偏倚(bias)。特点:观察值系统性、方向性、周期性的偏离真值。可以通过严格的实验设计和技术措施消除。2024/5/12232随机测量误差(randomerrorofmeasurement)或称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机地变化。随机测量误差服从正态分布,可以用概率统计方法处理。2024/5/12243抽样误差

(samplingerror)我们从同一总体中随机抽取若干个例数相同的样本,其样本统计量之间会有所不同。这种由于随机抽样所引起的样本统计量与总体参数之间的差异以及各样本统计量之间的差异,统计上称为抽样误差。抽样误差在医学生物实验中最主要的来源是个体的变异。所以这是一种难以控制的、不可避免的误差。但抽样误差是有一定规律的。2024/5/1225(五)概率probability

确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。

随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。随机事件的特征:①随机性;②规律性:每次发生的可能性的大小是确定的。概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]。2024/5/1226必然事件P=1不可能事件P=0随机事件0<P<1

P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件2024/5/1227

样本的实际发生率称为频率。设在相同条件下,独立重复进行N次试验,事件A出现n次,则事件A出现的频率为f=n/N。频率与概率间的关系:概率是参数,频率是统计量;频率总是围绕概率上下波动;样本含量n越大,波动幅度越小,频率越接近概率。频率frequency2024/5/1228三统计资料的类型(一)数值变量资料(二)分类变量资料(三)变量间转化2024/5/1229住院号年龄岁身高cm体重kg住院天数d职业文化程度分娩方式妊娠结局20256552716571.55无中学顺产足月20256532216074.05无小学助产足月20258302515868.06管理员大学顺产足月20225432316169.05无中学剖宫产足月20224662515962.011商业中学剖宫产足月20245352715768.02无小学顺产早产20258342015866.04无中学助产早产20194642415870.53无中学助产足月20257832915457.07干部中学剖宫产足月观察单位observations个体individuals变量variablesnumericalvariabledata数值变量资料Categoricalvariabledata分类变量资料Units;elements2024/5/1230(一)数值变量资料

numericalvariabledata

用定量

方法测定观察单位(个体)某项指标数值的大小,所得的资料,称数值变量资料。也叫定量资料Quantitativedata或计量资料特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L);资料之间具连续性。2024/5/1231(二)分类变量资料

categoricalvariabledata

将观察单位按某种属性或类别分组,然后清点各组的观察单位数,所得的资料称分类变量资料也叫定性资料(Qualitativedata)

特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)2024/5/12321、无序分类(unorderedcategories)各类别之间有性质上的不同,而无程度上的差别。①二项分类如临床某些检验结果用阳性或阴性反应表示,对一批某病患者检验完毕后,清点呈阳性或阴性反应的各有若干例。②多项分类调查某人群的血型分布,按照A、B、AB、O四型分组。清点所得该人群的各血型组的人数是计数资料;2024/5/12332、有序分类资料(ordinalcategorydata)

各类别之间有性质上的差别,且排列有序,给人以“半定量”的概念,所以也叫等级资料Rankdata。

①癌症分期:早、中、晚。

②药物疗效:治愈、好转、无效、死亡。

③尿蛋白:

,,,++,+++2024/5/1234实例数据12024/5/1235实例数据22024/5/1236(三)变量间的转化

例:一组20

40岁成年人的血压以12kPa为界分为正常与异常两组,统计每组例数

<8低血压

8

正常血压

12

轻度高血压

15

中度高血压

17

重度高血压数值变量资料等级资料分类变量资料2024/5/1237

又如在计量诊断中,将某些阳性体征根据确诊病人的概率赋予分数,分数的多少代表量的大小,这样原来的计数资料就转化为计量资料。由于计量资料可以得到较多的信息,所以凡能计量的,尽量采用计量资料。2024/5/1238

统计资料的几种类型:2024/5/1239四、统计工作的基本步骤(一)统计设计:包括调查、实验设计。(二)收集资料:取得准确可靠的原始资料(三)整理资料:对资料进行核查、改错,系统化、条理化(四)分析资料:统计描述、统计推断2024/5/1240(一)统计设计statisticaldesign统计设计是影响研究能否成功的最关键环节,是提高观察或实验质量的重要保证。1.调查设计:surveydesign客观描述研究总体,不对研究总体施加任何干预,目的在于摸清某一事物的水平和分布状态。2024/5/1241(1)实验研究设计:以动物或生物材料为研究对象,在研究过程中对研究对象施加干预。(2)临床试验设计:以人为研究对象,在研究过程中施加干预。2.实验设计:experimentdesign2024/5/1242统计设计的内容:1.研究目的和假说。2.研究总体、研究对象、观察单位。3.是否施加干预,如何施加干预?4.需搜集那些资料,如何搜集?5.设置观察指标。6.资料的整理和汇总,计算有关统计量。7.控制误差。8.预期结果。9.时间和经费的安排等。2024/5/1243研究设计的几个关键问题:1.如何进行抽样?如何安排干预措施?随机化原则:随机抽样和随机分配。2.要达到研究目的应抽取多少观察单位?重复原则:确定样本含量。2024/5/12443.如何在诸多影响因素中,分离出研究因素对实验结果的效应?对照原则:在对比组中,除研究因素外,其它影响实验结果的非研究因素都尽可能相同。医学统计学研究设计数据处理观察性研究实验性研究统计描述统计推论动物实验临床试验假设检验参数估计(调查)实验设计实验分类动物实验临床试验社区干预试验基本要素处理因素受试对象实验效应实验设计基本原则对照随机化重复(样本含量)设置原则:均衡可比

类型:配对、组间

1-

、、

空白实验标准潜在安慰剂调查设计调查方法调查对象

调查指标研究目的按范围按时间抽样普查横向(现况调查)非概率概率简单随机系统

分层随机

整群纵向病例对照研究队列研究

调查工具

调查员2024/5/1249(二)搜集资料(collectionofdata)根据设计的要求,获取准确可靠的原始资料,是统计分析结果可靠的重要保证。医疗卫生工作中的统计资料主要来自:1.统计报表。2.医疗卫生工作记录。3.专题调查或实验研究。2024/5/12501、统计报表如出生死亡报告、疫情报告、医院工作报表等都是国家规定的,由医疗卫生机构定期逐级上报,提供居民健康和医疗卫生机构的各种数字,这些报表为各级卫生机构制定卫生工作计划、评价卫生工作和预测今后的工作提供重要依据,也为卫生管理研究提供了大量的原始资料;2、医疗卫生工作记录如病历、医学检查记录等,这些资料都是进行医学研究的宝贵原始资料,必需很好开发利用,但许多医疗卫生机构忽视它,不认真填写,漏填、误填严重,以致不能很好利用,因此加强这方面的资料管理工作是很重要的;3、专题调查或实验这是开展医学科研的主要资料来源,比上述2种经常性资料容易控制,可以得到较好的原始资料。如糖尿病、高血压的调查。2024/5/1251统计资料的要求1、资料完整、准确和及时2、资料有足够的数量3、资料的代表性及可比性代表性:是指在抽样研究中样本对总体的代表性

随机化原则:总体中每个对象都有同等机会被抽取。可比性:是指在进行统计比较时,对比的各组之间,除观察问题或实验因素不同外,其它一切条件都要求尽量一致。2024/5/1252(三)整理资料sortingofdata将原始数据净化、系统化和条理化,为下一步的计算和分析打好基础的过程。1.审核:对原始数据的检查、核对和纠正错误等。2.分组:根据研究目的将原始数据合理分组①质量分组即按事物的性质或类型分组,适用于计数及等级资料。如按性别、职业分组②数量分组即按变量值的大小来分组,适用于计量资料。3.汇总整理成统计表,可用计算机汇总2024/5/1253(四)分析资料(analysisofdata)

是根据设计的要求,对整理后的数据进行统计学分析,结合专业知识,做出科学合理的解释。

目的是在描述数据特征的基础上,阐明事物的内在联系和规律性。2024/5/12541.统计描述:statisticaldescription选用恰当的统计指标,合适的统计表和统计图,对资料的数量特征及其分布规律进行测定和描述。2024/5/1255(1)参数估计:estimationofparameters

如何由样本统计量推断总体参数。(2)假设检验:testofhypothesis

如何由样本差异来推断总体之间是否存在差异。2.统计推断:statisticalinference

如何在一定的可信程度下由样本信息推断总体特征。2024/5/1256如何学习统计学循序渐进认真完成各部分习题2024/5/1257复习思考题总体误差分类概率统计资料的类型统计工作的基本步骤2024/5/1258统计中所说的样本是指:A.随意从总体中抽取出的部分个体B.依照研究者要求从总体中抽取出有意义的部分个体C.按照随机原则抽取总体中有代表性的部分个体D.依照研究者要求从总体中抽取的部分个体E.按分布的顺序抽取部分个体统计中所说的总体是指:A.随意想象的研究对象的全体B.根据研究目的确定的研究对象某项观察值的的全体C.根据时间来划分的研究对象的全体D.根据地区来划分的研究对象的全体E.根据人群来划分的研究对象的全体CB2024/5/1259总体的要求是:A.大量的B.同质的C.随机的D.固定的E.对称的样本指标值与总体指标值之差主要是指:A.随机测量误差B.关系误差C.容许误差D.抽样误差E.系统误差由于各种偶然的因素影响,造成同一对象多次测定的结果不完全一致,往往是有的稍高,有的稍低,这种差异是:A.系统误差B.随机测量误差C.抽样误差D.偏倚误差E.标准误差BDB2024/5/1260抽样误差是指:A.个体值和总体参数值之差B.个体值和样本统计量值之差C.样本统计量值和总体参数以及各样本统计量之差D.样本统计量值和样本统计量值之差E.总体参数值和总体参数值之差统计学上说的系统误差、测量误差和抽样误差三种误差,在实际工作中有:A.三种误差都不可避免B.系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论