临床科研中常用的统计分析方法_第1页
临床科研中常用的统计分析方法_第2页
临床科研中常用的统计分析方法_第3页
临床科研中常用的统计分析方法_第4页
临床科研中常用的统计分析方法_第5页
已阅读5页,还剩149页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

临床科研中常用的统计分析方法第1页,共154页,2023年,2月20日,星期三一、如何正确抉择统计方法1分析集2研究目的3资料类型4设计类型5方法的应用/适用条件第2页,共154页,2023年,2月20日,星期三1分析集(ANALYSISSET)分析集应在研究设计阶段确定,建立规则。意向性分析集(intentiontotreat,ITT)全分析集(Fullanalysisset,FAS)符合方案集(perprotocolset,PPS)安全集(safetyset,SS)第3页,共154页,2023年,2月20日,星期三使用适宜、正确的统计分析方法是统计结论真实可靠的重要保证。统计分析包括:统计描述:选择什么样的指标,选用统计表还是图取决于资料的性质及研究目的等统计推断:方法的正确抉择与研究目的、资料类型、设计类型、样本大小、资料分布类型、数据结构、特定条件综合分析等有关。第4页,共154页,2023年,2月20日,星期三2研究目的研究目的通常有:估计——参数的点估计和区间估计比较——t、u、ANOVA筛选主要影响因素—回归相关分析——各种相关建立临床医学参考值范围校正与控制混杂因素——协方差分析、CMH因果关系分析——通径分析预测、预报分析——回归。等等第5页,共154页,2023年,2月20日,星期三3资料类型资料类型包括三个方面数据性质定量资料定性资料资料分布类型正态分布偏态分布分布类型不清结局变量的类型数值变量分类变量二分类无序多分类有序分类第6页,共154页,2023年,2月20日,星期三4设计类型统计设计的类型取决于研究目的,实际上是为了更好地达到研究目的而采取的设计方案从统计学上来讲,临床上常用的有:完全随机设计配对设计随机区组设计交叉设计序贯设计重复测量设计……第7页,共154页,2023年,2月20日,星期三5统计方法的应用/使用条件对样本量的要求对应变量、自变量分布类型的要求对数据缺失程度的要求第8页,共154页,2023年,2月20日,星期三二、常用的统计分析方法差异性检验疗效性检验优效性等效性非劣效性第9页,共154页,2023年,2月20日,星期三2.1差异性检验——(1)临床试验中的3种数据来源处理反应影响因素第10页,共154页,2023年,2月20日,星期三基线测定数据的可比性:20个指标中有4个有统计学意义,则随机有问题(P=0.0159)2.1差异性检验——(2)第11页,共154页,2023年,2月20日,星期三定性数据统计描述统计描述频数和百分比统计推论两个率的比较卡方检验、Fisher;logistic回归等级定性反应变量卡方、Ridit、秩和检验、CMH2.1差异性检验——(3)第12页,共154页,2023年,2月20日,星期三定量数据统计描述例数、均数、标准差、中位数、四分位数间距、最大值、最小值统计推论t检验ANOVAGLM(协方差)生存时间N年生存率、中位生存期、无病进展时间等LifetableK-MtestCOX2.1差异性检验——(4)第13页,共154页,2023年,2月20日,星期三申杰主编.中医统计学.北京:科学出版社,2009:P33.第14页,共154页,2023年,2月20日,星期三2.2临床试验的优效性、等效性、非劣效性检验方法差异性检验:通常所用的统计分析方法都是进行的差异性检验临床试验的三种检验,确切的说是为三种设计而进行的分析方法金丕焕.临床试验.复旦大学出版社.p86第15页,共154页,2023年,2月20日,星期三统计分析方法同差异性检验方法,但是单侧检验。须在研究设计阶段确定。第16页,共154页,2023年,2月20日,星期三第17页,共154页,2023年,2月20日,星期三第18页,共154页,2023年,2月20日,星期三第19页,共154页,2023年,2月20日,星期三第20页,共154页,2023年,2月20日,星期三可信区间估计第21页,共154页,2023年,2月20日,星期三3.中医领域的应用第22页,共154页,2023年,2月20日,星期三第23页,共154页,2023年,2月20日,星期三方差分析——一类方法完全随机设计随机区组设计交叉设计拉丁方设计析因设计正交设计均匀设计嵌套设计重复测量设计裂区设计协方差分析多元方差分析重复测量的方差分析第24页,共154页,2023年,2月20日,星期三协方差分析的概念协方差分析模型协方差分析举例协方差分析第25页,共154页,2023年,2月20日,星期三试验设计的三项基本原则,目的就是为了排除非处理因素的干扰和影响,使试验误差的估计降到最低限度,从而可以准确地获得处理因素的试验效应。但在某些实际问题中,有些因素在目前还不能控制或难以控制,如在动物饲养试验中,动物增加的平均体重不仅仅与动物的进食量有关,甚至与各动物的初始重量等因素有关系。如果直接进行方差分析,会因为混杂因素的影响而无法得出正确结论。一、协方差分析的概念第26页,共154页,2023年,2月20日,星期三协方差分析(AnalysisofCovariance)是将回归分析与方差分析结合起来使用的一种分析方法。它先将定量的影响因素看作自变量,或称为协变量,建立因变量随自变量变化的回归方程,这样就可以利用回归方程把因变量的变化中受定量因素的影响扣除掉,从而能够较合理地比较因变量的总体均数之间是否有显著性的差别,增加了分析的准确性。

协方差分析的功用就是用处理前的基数矫正处理后的结果,提高其精确度。定义第27页,共154页,2023年,2月20日,星期三考察某因素对因变量Y的影响,布置了一单项分类资料的试验,其方差分析模型为:yij=μi+εij

μi该因素第i个水平的效应,εij为随机误差同时收集到与y有密切回归关系的变量x,其方差分析模型变为:yij=μi+b(xij-x)+dijb为y对x的回归系数,dij为随机误差二、协方差分析模型ˉ平行性假定:各组协变量和因变量的关系是线性的各组残差正态各组回归斜率相等,即各组回归线是平行的第28页,共154页,2023年,2月20日,星期三1、比较三种猪饲料A1,A3,A3对猪催肥的效果,测得每头猪增加的重量(y)与初始重量(x)与数据如表。试测定三种饲料对猪的催肥有无显著的不同?初始重量与猪的增加重量之间有无明显的关系?三、协方差举例水平观察值A1x1513111212161417y8583657680918490A2x1716181821221918y9790100951031069994A3x2224202325273032y89918395100102105110第29页,共154页,2023年,2月20日,星期三1、平方和2、回归关系的显著性检验协方差举例变异来源自由度平方和均方F值回归误差1201010.76227.6151010.7611.3888.8**第30页,共154页,2023年,2月20日,星期三3、纠正后的处理间方差分析4、用回归纠正每处理的平均增重协方差举例变异来源自由度平方和均方F值处理误差220707.218227.615353.60911.38131.07**总变异22934.833yi=μi+b(xi-x)ˉ第31页,共154页,2023年,2月20日,星期三1、统计资料应服从正态分布,否则要做适当的统计代换。2、做一般方差分析时处理间差异显著,而做协方差分析时,处理间差异反而不显著,说明所谓的差异是由于初始的试验条件造成的,并非处理间真正的差异。3、做一般方差分析时处理间差异不显著,而做协方差分析时,处理间差异反而显著,说明除去试验条件的影响后处理间有真正的差异。注意的问题第32页,共154页,2023年,2月20日,星期三重复测量设计的方差分析第33页,共154页,2023年,2月20日,星期三重复测量设计一、重复测量资料的数据特征当对同一受试对象在不同时间重复测量次数p≥3时,称为重复测量设计或重复测量数据。测量时间点受试者12…p1y11y12…y1p2y21y22…y2p:nyn1yn2…ynp第34页,共154页,2023年,2月20日,星期三图例第35页,共154页,2023年,2月20日,星期三重复测量资料是同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料,常用来分析该观察指标在不同时间点上的变化。有时是从同一个体的不同部位(或组织)上重复测量获得的指标的观测值。目的:就是比较不同时间点动态变化趋势的特征第36页,共154页,2023年,2月20日,星期三问题?想一想?同一观察单位具有多个观察值,而这些观察值来自同一受试对象的不同时点(部位等),这类数据间往往有相关性存在,违背了方差分析要求数据满足独立性基本条件。第37页,共154页,2023年,2月20日,星期三在这种情况下:若使用一般的方差分析,就不能充分揭示出内在的特点,有时甚至会得出错误结论。所以重复测量资料需要采用专门的统计分析方法,该方法是近代统计学研究的热点之一。第38页,共154页,2023年,2月20日,星期三实际中:重复测量资料比独立资料更多见。●临床研究中,需要观察病人在不同时间的某些生理、生化或病理指标的变化趋势,研究不同时间或疗程的治疗效果。●流行病学研究中,观察队列人群在不同时间上的发病情况。研究不同职业、性别人群实施某种控制后,不同时间的多次效果考察。●卫生学研究中,纵向观察儿童生长发育规律等,不同地区和环境营养状况。第39页,共154页,2023年,2月20日,星期三提醒大家重复测量数据在医学研究中十分常见,在医学类杂志上约占四分之一,而且统计表达和分析误用情况严重。第40页,共154页,2023年,2月20日,星期三主要优点减少样本含量控制个体变异非实验因素(干扰因素)第41页,共154页,2023年,2月20日,星期三●单变量重复测量方差分析1.单组重复测量指同一组内(或接受同一种处理)的多个受试者,在多个时间点上的反应变量所作的测量,又称为单变量重复测量。测量时间点受试者12…p1y11y12…y1p2y21y22…y2p:nyn1yn2…ynp第42页,共154页,2023年,2月20日,星期三2.多组重复测量(多组并不等于多因素)指将受试者按处理的不同水平分为几个组,对这些组内的每一受试者,都在不同时间点对他们的反应变量进行测量。表3.1(余松林)第43页,共154页,2023年,2月20日,星期三1.单组重复测量数据方差分析2.两组重复测量数据方差分析●单变量重复测量方差分析第44页,共154页,2023年,2月20日,星期三二、重复测量资料分析的前提条件和基本步骤1.前提条件:首先要求样本是随机的,除了满足一般方差分析条件外,特别强调满足协方差阵(covariancematrix)球形性。sphericity第45页,共154页,2023年,2月20日,星期三概念:协方差阵的球对称性是指该对角线元素(方差)相等、非主对角线元素(协方差)为零方差指在某一时点上测定值变异的大小,而协方差是指在两个不同时点上测定值相互变异的大小。如果在某个时点上的取值不影响其它时点上的取值。则协方差为0,相反,则不为0。由协方差构成的矩阵称为协方差阵。00第46页,共154页,2023年,2月20日,星期三若球对称性得不到满足,方差分析的F值是有偏的,会增大Ⅰ类错误的概率2.用Mauchly法检验协方差阵的球形性质如果P值大于α,说明协方差阵的球对称性质得到满足。否则,必须对与时间有关的F统计量的分子和分母自由度进行调整,减少Ⅰ类错误的概率。调整系数为:ε(读:epsilon)第47页,共154页,2023年,2月20日,星期三3.自由度常用调整方法①Greenhouse-Geisser法,简称:G-G法②Huynh-Feldt法,简称:H-F法③Lower-bound法,简称:L-B下界法以上前两种方法较复杂,采用软件计算。第48页,共154页,2023年,2月20日,星期三4.举例:单组重复测量数据的方差分析观察10名慢性乙型肝炎患者治疗前、治疗12周、24周、36周四个时间点上谷丙转氨酶(ALT)水平的变化趋势,结果见下表,试进行统计推断。第49页,共154页,2023年,2月20日,星期三分析:数据结构上与完全区组设计相似

但实质不同各观测点时间顺序是固定的,不能随机分配;不同观测点数据彼此不独立或不完全独立,存在一定的相关性。第50页,共154页,2023年,2月20日,星期三SAS结果中包括偏相关阵第51页,共154页,2023年,2月20日,星期三例题

1.建立假设,确定检验水准Α=0.012.进行球对称性检验球对称性通常采用

Mauchly’stest检验标准来判断第52页,共154页,2023年,2月20日,星期三3.调整时间点F值的自由度

调整原则:⑴当资料满足“球对称”(Sphericity)条件时(P>α),不作调整。⑵当资料不满足“球对称”条件时(P<α),时间点间F值的自由度需要调整。常用的调整方法第53页,共154页,2023年,2月20日,星期三时间点间误差4.计算F值第54页,共154页,2023年,2月20日,星期三球对称性通常采用

MAUCHLY’STEST检验来判断其结果按α=0.1水准检验,不满足球对称性,对系数ε进行校正,其结果如下:结果显示:治疗前与治疗后不同时间转氨酶平均水平不同。第55页,共154页,2023年,2月20日,星期三5.单组重复测量方差分析数据结构6.基本程序格式Nouni不打印输出单变量分析结果Printe产生Mauchly球性检验的统计量χ2、P值第56页,共154页,2023年,2月20日,星期三分析:单组重复测量数据分析的缺陷只能分析观察对象的观测值在不同时间点的差别。专业认为:不同时间点上的观测值变化可能是“处理”的作用,也可能是患者病情的自然变化,与“处理”无关,如果要分析“处理”效应,必须设立一个平行对照组,通过组间差别的大小说明“处理”组效应的大小。两独立样本重复测量设计是将N个受试对象随机地等分两组,一组作为实验组,另一组作为对照组。第57页,共154页,2023年,2月20日,星期三

为研究国产某药品与同类型进口药品对慢性乙型肝炎患者谷丙转氨酶(ALT)水平的影响,将20名慢性乙型肝炎患者随机分为两组,一组服用国产药作为实验组,一组服用进口药作为对照组。对每一患者在治疗前、治疗后12周、24周、36周重复4次测量ALT水平,实验结果见下表。问两种药物对慢性乙型肝炎患者的ALT水平影响是否不同?5.举例:两组重复测量数据方差分析第58页,共154页,2023年,2月20日,星期三表国产药进口药第59页,共154页,2023年,2月20日,星期三分析结果同一患者重复测量值就是组间差异患者之间的个体差异就是组内误差两样本重复测量数据方差分析结果第60页,共154页,2023年,2月20日,星期三程序如下两组重复测量数据结构第61页,共154页,2023年,2月20日,星期三相关分析结果球对称性检验结果第62页,共154页,2023年,2月20日,星期三方差分析结果第63页,共154页,2023年,2月20日,星期三结果显示汇总总结论为:不同药物对ALT水平未见不同,但两药物在不同时间点ALT有差别,药物与时间的交互作用无意义。第64页,共154页,2023年,2月20日,星期三问题?从以上分析可见:无论单组或两组分析,我们仅算出总的有差别,两两比较未知的?分析方法与一般方差分析不同。Contrast(1)产生不同水平间同括弧内指定的参考水平对比检验Summary

定义每个对比组生成方差分析表第65页,共154页,2023年,2月20日,星期三后多个重复测量时间点与前第1时间点比原程序如下:第66页,共154页,2023年,2月20日,星期三结果分析第67页,共154页,2023年,2月20日,星期三两组比较数据分析第68页,共154页,2023年,2月20日,星期三所关注的结果如下第69页,共154页,2023年,2月20日,星期三CONTRAST(1)结果比较结构第70页,共154页,2023年,2月20日,星期三有时试验仅对先后两个时间点的比较感兴趣,也希望比较水平1与2、2与3、3与4比

可用选择项PROFILE,程序如下:procglmdata=SASfeng.p178;modeltime0time12time24time36=A/nouni;repeatedtimeprofile/printmsummary;run;提示:显示不同水平比较时的结构第71页,共154页,2023年,2月20日,星期三显示不同水平比较时的结构第72页,共154页,2023年,2月20日,星期三当兴趣在于1个水平与以后的所有水平的比较时,可选HELMERT………….;repeatedtimehelmert/printmsummary;………….;第73页,共154页,2023年,2月20日,星期三小结:两两比较参数选择repeatedtime?

/?msummary;Contrast(1)表示2个时间点,其中第1个时间点为参考点Profile表示1与2比、2与3比、3与4比Helmert表示在1个水平后与所有的水平比较Printe产生Mauchly’s的χ2值和P值Printm产生不同水平比较结构阵产生对比组的方差分析表第74页,共154页,2023年,2月20日,星期三1.重复测量数据的主要特征是什么?2.重复测量SAS数据录入结构?3.球对称性检验?4.不同水平间与不同组间比较选项?5.推断结论?第75页,共154页,2023年,2月20日,星期三两组,一组给予曲明片十模拟曲明胶囊,另一组给予曲明胶囊十模拟曲明片。所有患者每天坚持服药,共服药6个月(24周),受试期间禁用任何影响体重的药物,而且受试对象行为、饮食及运动与服药前的平衡期均保持一致。分别于平衡期(0周)、服药后的8周、16周、24周测定肥胖患者的体重(kg)得表9-13的资料。例题为研究减肥新药盐酸西布曲明片和盐酸西布曲明胶囊的减肥效果是否不同,以及肥胖患者服药后不同时间的体重随时间的变化情况。采用双盲双模拟随机对照试验,将体重指数BMI>27的肥胖患者40名随机等分成第76页,共154页,2023年,2月20日,星期三表9-13第77页,共154页,2023年,2月20日,星期三可以看出重复测量资料中同一受试对象(看成区组)的数据高度相关无论哪位受试对象服用曲明片剂或是胶囊,其服药后8周、16周和24周的体重均和前面时间点(含服药前的0周)的体重相关。不同时点数据其相关性较强。第78页,共154页,2023年,2月20日,星期三重复测量资料方差分析的基本步骤分为三步:第79页,共154页,2023年,2月20日,星期三⑵计算检验统计量:使用统计软件进行计算结果如下:第80页,共154页,2023年,2月20日,星期三⑶确定P值,做出推断结论:

根据专业知识和假设检验,直接由计算机所给P值做出推断结论。按α=0.05水准,减肥药剂型k(片剂和胶囊),剂型k与时间i的交互效应ki均不拒绝H0,无统计学意义,还不能认为曲明不同剂型的减肥效果不同,也还不能认为剂型k与时间i间有交互效应。而时间因素i拒绝H0,接受H1,有统计学意义,可认为服用减肥药盐酸西市曲明前后不同时间(8周、16周和24周)的平均体重不全相同。第81页,共154页,2023年,2月20日,星期三重复测量资料方差分析的前提条件重复测量资料的方差分析,除了满足一般方差分析的条件外,还要满足协方差阵的球形性或复合对称性。若条件不能满足,F值有偏性,通常采用Mauchly检验来判断,通过软件选参数计算。第82页,共154页,2023年,2月20日,星期三校正后的结果:第83页,共154页,2023年,2月20日,星期三两组重复测量数据结构第84页,共154页,2023年,2月20日,星期三SAS程序显示该资料不满足球对称性,参看校正结果。第85页,共154页,2023年,2月20日,星期三结果表明经G-G和H-F调整后,按α=0.05检验水准,A(不同药物)和A与TIME(时间)无统计学意义,后者无交互作用,而时间因素间有统计学意义。第86页,共154页,2023年,2月20日,星期三例4

用丹参注射液治疗7例慢性肾功能衰竭患者,治疗前后不同时间各患者的血尿素氮(BUN)的变化,如表所示。试比较治疗前后不同时间各患者血尿素氮的变化是否不同?

表4-5丹参注射液治疗慢性肾衰患者不同时间的BUN(mg/dl)变化

治疗后不同患者治疗前第2周第4周第6周

160.741.034.536.2265.244.741.239.4366.342.440.537.7467.149.143.340.2562.838.540.135.8672.552.344.637.6758.035.038.637.2第87页,共154页,2023年,2月20日,星期三题意分析:本题要探讨治疗前后“不同时间”,又要研究“不同患者”的血尿素氮的变化,是属于按两因素分组的多个均数间比较的重复测量方差分析

首先在Insight中建立数据集,本题变量FL为不同治疗时间的分组变量,如治疗前为1,治疗后第2周为2,…,第6周为4。X为BUN的测定值。建好结构录入数据,格式如图4-17所示,数据集名为L2,存入SASUSER库中,备用。第88页,共154页,2023年,2月20日,星期三如图所示:第89页,共154页,2023年,2月20日,星期三生存分析SURVIVALANALYSIS

90第90页,共154页,2023年,2月20日,星期三何为生存分析91第91页,共154页,2023年,2月20日,星期三传统方法在分析随访资料时的困难时间和生存结局都成为了要关心的因素

•除了生存结局作为判定标准以外,只要能让病人存活时间延长,这种药物也应当是被认为有效的。即时间延长也认为有效

•如果将两者均作为应变量拟和多元模型,因为时间分布不明(一般不呈正态分布,在不同情况下的分布规律也不同),拟和多元模型极为困难92第92页,共154页,2023年,2月20日,星期三传统方法在分析随访资料时的困难存在大量失访的资料•失去联系(病人搬走,电话号码改变)•无法观察到结局(死于其他原因)•研究截止显然,将失访数据无论是算作死亡还是存活似乎都不大合理93第93页,共154页,2023年,2月20日,星期三第一节概述94第94页,共154页,2023年,2月20日,星期三一、基本概念

(一)生存时间(survivaltime):1.定义:广义的生存时间是指从某个起始事件开始到某个终点事件的发生(出现反应)所经历的时间。也称失效时间(failuretime)。2.特点:(1)分布类型不易确定。一般不服从正态分布,有时近似服从指数分布、Weibull分布、

Gompertz分布等,多数情况下往往不服从任何规则的分布类型。

95第95页,共154页,2023年,2月20日,星期三(2)生存时间的影响因素多而复杂且不易控制。(3)根据研究对象的结局,生存时间数据可分两种类型:①完全数据(completedata):观察对象在观察期内出现反应(终点事件),这时记录到的时间信息是完整的,这种生存时间数据称为完全数据。

②截尾数据(截尾值、删失数据,censoreddata):尚未观察到研究对象出现反应(终点事件)时,即由于某种原因停止了随访,这时记录到的时间信息是不完整的,这种生存时间数据称为不完全数据或截尾值。常用符号“+”表示。

96第96页,共154页,2023年,2月20日,星期三截尾值(CENSOREDVALUE)出现的原因截尾的原因主要有3种:①失访:生存但中途失访:包括拒绝访问、失去联系等。②退出:中途退出试验、改变治疗方案、死于其它与研究无关的原因:如肺癌患者死于心机梗塞、自杀或因车祸死亡,终止随访时间为死亡时间。③终止:指观察期结束时仍未出现结局。97第97页,共154页,2023年,2月20日,星期三关于截尾或删失随访开始事件失访失访研究截止时仍存活研究截止时点患者进入期间删失的模式图98第98页,共154页,2023年,2月20日,星期三99第99页,共154页,2023年,2月20日,星期三100第100页,共154页,2023年,2月20日,星期三101第101页,共154页,2023年,2月20日,星期三102第102页,共154页,2023年,2月20日,星期三103第103页,共154页,2023年,2月20日,星期三104第104页,共154页,2023年,2月20日,星期三105第105页,共154页,2023年,2月20日,星期三风险函数与生存函数的关系106第106页,共154页,2023年,2月20日,星期三107第107页,共154页,2023年,2月20日,星期三108第108页,共154页,2023年,2月20日,星期三109第109页,共154页,2023年,2月20日,星期三第二节生存率估计的非参数法

110第110页,共154页,2023年,2月20日,星期三111第111页,共154页,2023年,2月20日,星期三112第112页,共154页,2023年,2月20日,星期三113第113页,共154页,2023年,2月20日,星期三图16-2两种疗法治疗后白血病患者的生存率曲线10.900.7930.68670.56110.42130.21114第114页,共154页,2023年,2月20日,星期三115第115页,共154页,2023年,2月20日,星期三116第116页,共154页,2023年,2月20日,星期三117第117页,共154页,2023年,2月20日,星期三118第118页,共154页,2023年,2月20日,星期三119第119页,共154页,2023年,2月20日,星期三120第120页,共154页,2023年,2月20日,星期三121第121页,共154页,2023年,2月20日,星期三122第122页,共154页,2023年,2月20日,星期三123第123页,共154页,2023年,2月20日,星期三第三节生存率的比较

生存率比较的假设检验方法有参数法、半参数法和非参数法,因医学研究中的生存时间资料大多为不规则分布或者分布未知,常采用非参数法进行假设检验。非参数法是将生存率曲线作为整体进行曲线与曲线之间的比较,其零假设为各总体生存率曲线相同。常用的非参数检验方法有log-rank检验(时序检验)、Gehan比分检验和Breslow检验等。124第124页,共154页,2023年,2月20日,星期三125第125页,共154页,2023年,2月20日,星期三126第126页,共154页,2023年,2月20日,星期三127第127页,共154页,2023年,2月20日,星期三128第128页,共154页,2023年,2月20日,星期三129第129页,共154页,2023年,2月20日,星期三续表130第130页,共154页,2023年,2月20日,星期三131第131页,共154页,2023年,2月20日,星期三132第132页,共154页,2023年,2月20日,星期三对于大样本资料生存率的比较,可以将其整理成频数表形式,采用寿命表法计算生存率然后进行比较,其基本原理与上述方法相同。133第133页,共154页,2023年,2月20日,星期三第四节COX比例风险回归模型

134第134页,共154页,2023年,2月20日,星期三135第135页,共154页,2023年,2月20日,星期三一、COX比例风险回归模型的基本形式

看下面例子136第136页,共154页,2023年,2月20日,星期三如果分析x1-x6这6个因素对生存时间t的影响,能否用线性回归分析建立时间t与影响因素间的线性回归方程?或建立生存函数S(t)与影响因素间的线性回归方程?

t=b0+b1x1+b2x2+┅+b6x6?S(t)=b0+b1x1+b2x2+┅+b6x6?1、生存时间t一般不服从正态分布;2、生存时间t中含有截尾值。137第137页,共154页,2023年,2月20日,星期三利用生存率函数S(t,X)与风险函数h(t,X)的关系可导出较好的解决截尾值的问题反映了协变量X与生存函数的关系Cox模型的基本形式138第138页,共154页,2023年,2月20日,星期三所有危险因素为0时的基础风险率,它是未知的,但假定它与h(t,X)是呈比例的。右侧可分为两部分:h0(t)没有明确的定义,分布无明确的假定,参数无法估计,为非参数部分;另一部分是参数部分,其参数可以通过样本的实际观察值来估计的,正因为Cox模型有非参数和参数两部分组成,故又称为半参数模型。139第139页,共154页,2023年,2月20日,星期三140第140页,共154页,2023年,2月20日,星期三141第141页,共154页,2023年,2月20日,星期三142第142页,共154页,2023年,2月20日,星期三143第143页,共154页,2023年,2月20日,星期三144第144页,共154页,2023年,2月20日,星期三二、COX回归分析的步骤:

确定自变量和因变量参数估计,拟和模型对模型的假设检验模型的解释及应用

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论