研究生 统计学讲义 第1讲第一章 绪论.ppt_第1页
研究生 统计学讲义 第1讲第一章 绪论.ppt_第2页
研究生 统计学讲义 第1讲第一章 绪论.ppt_第3页
研究生 统计学讲义 第1讲第一章 绪论.ppt_第4页
研究生 统计学讲义 第1讲第一章 绪论.ppt_第5页
已阅读5页,还剩18页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中医临床医学是一门经验科学。长期以来,临床研究方法主要停留在传统经典文献的体会和诠释、临床观察和医案报告、师徒口传心授以及个人经验积累。这些方法在过去和现在都对中医临床医学的发展发挥了积极作用,而且至今占据主导地位,成为研究方法的主要方面,但是上述研究毕竟有它的局限性和盲目性,由此得出许多结论带有片面性,有些甚至是错误和荒谬的。(参考:胡镜清,赖世隆,中医临床研究方法指南概论。国家中医药管理局科技教育司。,如何吸取和应用现代科技(包括西医理论)、方法、手段来促进中医学的发展,这是富有意义的,需要方法学的突破和思路创新。将统计学、临床流行病学(DME) 和循证医学(EBM)原理方法向中医学渗透。,1. 制定中医证候宏观辩证量表:统一辩证标准;表面效度评价:Kappa值方法。可靠性与反应度评价。,2.病证结合的观察性描述研究:横断面调查。,3.证候与微观指标之间的相关与回归分析。,4.为中医证候筛选微观指标的多元线性逐步回归分析,5.同病多种证候与多项微观指标之间的典则相关分析,6.某病多证候与多项基因指标之间的对应分析:证候,基因本质的研究。,7.中医体质诊断研究方法。,8.中医体质与分类指标之间的数量依存关系:Logistic 回归分析。,9.体质或证候的指数计量诊断。,10.体质或证候的判别分析。,11.建立体质或证候的指标聚类分析。,12.建立体质或证候分类标准的因子分析。,13.诊断研究及其循证医学评价。,14.疾病或证候预后研究:生存或死亡的COX比例风险回归模型分析。,15.中医文献的循证医学荟萃分析(Meta分析),第1章 绪论,一、统计学的意义与内容,意义,1.利用概率论与数理统计进行统计设计,搜集和整理资料,对分析结果进行恰当的解释,作出科学结论。,2.保证分组具有可比性,保证有合适的样本容量.,3.控制实验误差,是否在科学上具有可重复性.,4.在撰写论文或报告时,将大量原始数据归纳整理为正确的统计指标,按照规范列出统计表(图).,5.能够读懂国内外医学文献中的统计资料,判断其可靠程度和局限性,吸收和借鉴.,主要包括:统计学基本理论和统计方法:即设计、描述、推断.,内容,二、统计学常用概念,1随机变量,随机现象(random phenomenon)的特点是在相同条件下进行实验或观察时,具有二个或二个以上可能的结果,对一次实验或观察来说,究竟会发生哪一个结果,事先是不能确定的,但在大量重复试验中可呈现某种规律性。,对随机现象研究所做的试验或观察称随机试验(random trial),试验中每一个可能的结果称为基本事件。基本事件组合而成的事件称为复合事件。无论是基本事件还是复合事件都叫做随机事件,简称事件,常用大写字母A、B等表示。事件间的相互关系类似于中学数学介绍的集合间的相互关系。,观察单位(称为个体)的研究特征(或指标)称为变量(variable)。变量的观察结果即观察值(observed value),称为变量值(value of variable)。变量值是变量的具体表现。随机变量(random variable)是专指具有一个分布或一个概率或概率分布的变量,特性:(1) 在一次试验中,取值具有不确定性。随机事件在一次试验中可能发生,也可能不发生,所以随机变量的取值是随机的,取决于随机试验结果。(2) 在大量重复试验中,随机变量的各种可能取值发生的可能性大小具有一定的统计规律,也就是说,具有一定的“概率”意义。可见,随机变量既具有变量的意义,又具有概率意义,这种双重意义正是随机变量与普通变量的区别。在不致混淆的情况下,通常将随机变量简称变量。,2总体、个体与样本 研究对象的全体称为总体(population)。构成总体的每个成员称为个体,亦称样品或观察单位。总体是根据研究目的所确定的性质相同的所有个体的研究指标值的集合。,个体(individual)即观察单位(study unit)。总体的性质特征由其各个个体的性质而定,要研究总体的性质或特征,须对它的个体进行观测。,从总体中随机抽取部分个体的过程称为抽样(sampling),从总体中随机抽取的代表总体的部分个体的观察值集合称为样本(sample)。样本中所包含的个体数目,即样本例数,称为样本含量(sample size)。总体中有很多个体,究竟哪些个体在抽样中被抽到,要依机会而定。因此,样本是随机变量;,抽样的目的是用样本信息推断总体特征,所以样本要有足够的含量及代表性。,样本要具有:随机性:即要使总体中的每一个体都有同等的机会被抽到和分配,不受研究者的主观意愿或客观偏性影响,样本可能取值与总体是完全一样的,并且取各个值的概率也是完全一样的,这就是说,样本与总体是同分布的随机变量。独立性:即各个样品的取得互不影响,即任何一次抽样都未改变总体成份,因而下一次抽样是在同样条件下进行的。例如,有放回的抽样就能保证这一点;无放回的抽样在总体很大时,也近似满足这一点。,数理统计方法就是应用概率论的结果,通过样本来了解和判断总体的统计特征的科学方法。,3概率与频率 概率(probability)和频率(frequency)都是反映某一随机事件发生可能性大小的度量。,若随机事件A在n次独立重复试验中发生了m次,则称m为频数(counts)。称比值m/ n为事件A在n次试验中出现的频率或相对频数(relative frequency) ,0m/ n1,即事件A发生的频率为m/ n。,统计上常用符号 P 表示概率,概率的统计定义是:如果事件 A 在大量重复试验中出现的频率稳定在某一常数p,则称事件 A 的概率为p,记作P(A)=p,,概率的统计定义实际上给出了一个近似计算随机事件的概率的方法,即当试验次数 n 够大时,可用频率作为概率的近似值。,注意: 频率具有偶然性;而概率刻划的则是总体中随机事件(随机变量)出现的可能性大小,一个随机变量的概率是一个常数,具有必然性,是一种客观存在。,0P(A)1。必然事件概率为1,不可能事件的概率为0,概率越接近1,表明其事件发生的可能性越大,概率越接近0,其事件发生的可能性越小,P0.05表示事件发生的可能性小于0.05,P0.01表示事件发生的可能性小于0.01,5概率分布 对一个随机变量,不但要了解它可能取得的数值,还要了解它以多大的概率取得这些数值,只有这样,才算是掌握了这个随机变量所刻划的随机现象。事实上,随机变量的取值有一定的概率意义,所以必须用随机变量的取值及其相应的概率才能完整地刻划随机现象的规律。一个随机变量各可能的取值与其对应的概率共同构造出它的概率分布(probability distribution),简称分布。,样本的概率分布称为抽样分布,统计上描述一个样本的性质,就等价于给出它的概率分布。由样本的分布可以推断出总体的分布,这是随机抽样的特征,可以把它取作“随机抽样”的定义。从总体中随机抽取一定个体数目的样本进行研究,通过样本指标推断总体指标的方法,称为抽样研究方法。,样本的“质”通过适当的抽样方法来保证,必须使样本中的每一个体确属同质总体,必须遵循随机化抽样和分配的原则,使样本足以代表总体,能充分反映总体的实际情况,保证样本的可靠性,6参数与统计量 出现在总体分布中的统计指标称为参数(parameter),参数一般用小写的希腊字母表示,如用表示总体均数,用表示总体标准差。,通过对样本数据进行统计分析所产生的统计指标称为统计量(statistical variable)。,统计量也是随机变量,统计量的分布称为抽样分布。常用的有2分布、t分布、F分布。在统计推断中,抽样分布充分发挥作用。统计学研究的基本方法是通过样本构造统计量,再通过抽样分布的研究,对样本所来自的总体进行分析和推断。,7统计描述与统计推断,统计描述是对原始资料的一种概括,即把分散而不好理解的原始数据,通过统计指标、统计图、统计表等方法,来描述资料的特征及其分布规律。统计描述不考虑抽样误差问题。,统计推断通过样本所提供的信息来推断总体特征,并标明可能发生的误差。统计推断包括置信区间(confidence interval)与假设检验(hypothesis testing )。是对整理出的统计量作进一步的分析,统计推断的结果为研究者下专业结论时提供科学的依据,所下的推断结论将影响后来的决策。例如,某新药A与某常规药B对某病疗效的差异有统计意义,A药效应较好,这种推断结论所导致的决策就是把A药引入市场,推广应用于临床。,三、统计中资料类型与测量尺度,1定量资料 定量资料(measurement variable)又称数值资料(numerical variable)或计量资料。一般为连续型随机变量。,2分类资料 分类资料(categorical variable)亦称定性资料(qualitative variable)。它由分类因素构成,系对定性因素的观察结果,将研究因素按类别或档次分组,清点各组个体的个数所得的资料。一般为离散型随机变量,有有序分类和无序分类两种情况:,(1) 无序分类资料(unordered categorical variable):无序分类资料又称计数资料(enumeration data)。是将观察单位按互斥的属性或类型分组计数。根据属性或类型分组的多少又可分为两种:, 两分类资料:它是将观察单位按两种对立的属性分类,如按死亡和生存、治愈和未愈、有效和无效等两种分类计数。, 多分类资料:它是将观察单位按多种互斥的属性分类,清点各类观察单位的个数,如血型按A、B、AB、O四种分类计数。,(2) 有序分类资料(ordered categorical variable):亦称等级资料(ranked data)。是将观察单位按某种属性的不同程度、档次或等级顺序分类或分组后,清点各顺序分组的观察单位数。,必须指出:根据分析研究需要,定量资料、无序分类资料和有序分类资料可以互相转化,在多资料分析中,定性指标数量化时,例如将性别男、女取为0与1;又如制定中医证候宏观辩证量表,制定方法是四诊项目组合法+临床流行病学调查证候加权积分法:,0分-无某项症状;2分-轻症状;4分-中症状;6分-重症状。,四、统计工作的基本步骤,分为设计搜集整理分析资料和运用资料五个基本步骤:,1设计 设计就是制定完成科研目标的技术路线和实施方案,是对包括研究目的,观察指标,资料搜集,整理,分析和运用全过程总的安排,是先导,依据。,是研究保证。设计有专业设计与统计学设计之分,统计设计包括调查设计和实验设计。,表1-2 专业设计与统计设计对比,2搜集资料 搜集资料一项艰巨任务,是分析前提与基础,是科研实践中极其重要的一个组成部分。要求及时、准确、完整、清楚、统一,防止误差及偏倚影响观察结果的精确性。因为统计学各种数据处理公式都是科学地建立在原始数据基础上的,准确的原始资料是统计处理的关键。其中任何一项若有欠缺都会给资料的整理和分析带来困难,并影响到结果的准确性。一份不准确、不科学的资料(例如系统误差很大),统计处理不但不能解决问题,反而会给人一种错觉,得出某种错误结论。确保资料的科学性和可靠性,必须严格按科研设计方案收集,例如随机抽样,要注意审查样本是否从同质总体中随机抽取的,样本含量是否适当,资料是否完整,数据是否准确,是否是同时期的资料,诊断标准和疗效判断标准要有科学依据并要求统一,避免研究者的主观偏见。,通常运用观察法、实验法、调查法三类方法获得资料。,3整理资料 整理资料是在对资料作好检查、核对后,将杂乱无章的资料条理化,以便于进行统计计算与分析。包括:,(1) 对原始资料进行逻辑和计算审核。 (2) 设计分组,包括质量分组(如病人按性别、职业、病情轻重分组)和数量分组(如按年龄、体重、身高分组)两种。分组的原则是合理,具有同质性,先细后粗,先分后合。 (3) 拟订整理表。整理表是统计表的前身,是过渡性表格,作归纳汇总用。宜尽量把整理表设计成复合表及相关表,以免漏掉两指标间存在的相关信息。 (4) 编制统计表。,4分析资料 就是按照统计原理,利用对比分析、归纳、逻辑推理、假说的验证等统计学处理方法(统计描述和统计推断),对观察资料进行分析,排除偶然性,发现必然性,揭示其规律性,最后结合专业作出恰如其分的结论。,分析资料时常见的问题有: 抽样研究未作统计检验,只凭表面数据来观察; 统计分析方法选择不当或交待不清; 对有关联事物的分析提不出数据,找不出规律; 将偶然因素当作因果分析; 忽视对比条件,未作标准化处理; 将构成比当率分析(以比代率); 发病率与患病率相混淆,死亡率与病死率相混淆 等。,5运用资料 资料的搜集、整理和分析通常为科研实践或科研实施期,属于对客观事物的认识过程,而资料的运用则属于改造客观事物的过程,是理论指导实践的过程,是决策的兑现

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论