医学统计学历年考题及答案.doc_第1页
医学统计学历年考题及答案.doc_第2页
医学统计学历年考题及答案.doc_第3页
医学统计学历年考题及答案.doc_第4页
医学统计学历年考题及答案.doc_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

试题】2010-01-05/山东大学/医学院/2009级/研究生/医学统计简答1 给了一张表,计算患病率,发病率,病死率,以及患者哪个年龄段最多,是多少,发病率哪个年龄段最多,是多少等等2 一个单向有序资料(分组变量无序,指标变量有序),用了卡方检验,问你对不对?为什么?如果是你,用什么?3 假设检验的基本思想和原则4 给了多元线性回归的资料(列出了几个方程的校正决定系数,决定系数,剩余标准差等的数值),判断哪个方程回归效果最好,为什么?5 给了甲流的例子,用某药治疗,用了自身对照(用药前后抗体浓度变化为指标),得出了药物有效。问你合不合理,为什么?你的设计是什么?6一型错误和二型错误的区别和联系7什么是抽样误差?举例说明分类资料和数量资料的抽样误差计算1 给了健康人的白天和晚上血压的相关数值(x和y各自的平均数,和,平方和,以及两者差值的均数等)注:计算时直接带入公式的相关数值(1)比较白天晚上血压有无差别(配对t检验计算)(2)白天和晚上血压有无相关(相关分析)(3)如何用白天血压估计晚上血压(回归分析)2 多个平均值进行总体假设检验。类如几种药的作用效果是否相同(方差分析)(也有人说:一个大题,3问,第一问是配对t检验计算,第二问相关分析,第三问,回归分析,都是计算题15分)3 样本率与总体率的比较 (u检验)(也有人说:配伍组方差分析)20081. 列出样本标准误的估计值的公式,至少五个(包括两样本差值的标准误,两样本率差值的标准误等)2. 医学统计中,将正态分布视为近似正态分布有哪几种情况?列出应用条件和公式3. 数值资料的统计描述指标?公式?4. 多元回归模型的基本形式?参数含义?回归效果的评价?5. 什么叫截尾值?产生原因?举例说明6. 一同学两样本率的比较 用了卡方检验,你有什么建议?若不符合卡方检验的应用条件,你又有什么建议?他再比较三个样本率是否来自同一总体,也用了卡方检验,你又有什么建议?7. 一个三因素的2X2X2的析因设计的实验设计及分析思路8. 给了一个数值资料:小鼠的饮食量X1,X2,X3,X4,X5,X6,X7,X8,X9共十个数值小鼠的体重增加量也有十个值(1) 对体重增加量资料进行统计描述(2) 求饮食量和体重增加量的关系(3) 由体重增加量的样本估计其代表总体均数的可信区间(4) 求小鼠体重增加量为X5(就是从体重增加量的那十个値里取了一个)的95%的置信区间(5) (3)和(4)中的可信区间有什么差别?20061直线回归中的b与多元线性回归中的B有什么区别?多元线性回归中,是否可以用B来表示各自变量对因变量的影响?为什么?2数值变量的完全随机设计的样本与总体的比较,配对设计的两样本的比较,成组设计两样本比较的统计分析思路3统计分析中P.a,B以及1-B的意义4给了一个单向有序资料,统计效应是有序的,他用了t检验,问你对不对,为什么?应该用什么统计方法,并写出统计思路5有一个两样本的秩和检验的应用题,写思路,不要求计算6生存分析中,有哪些非参数检验的方法?两个生存率的比较用什么检验?7给了一个实验,测量抗体.样本序列 抗体滴度 效应 是否有效1 1:40 + 是2 1:160 + 是.就是几个表格,让你给每个列个表,并且应该用哪些指标来描述.8正态分布,二项分布,poisson分布的可信区间 9有两个变量,让你说出分析它们相关的统计分析思路10有个析因设计的题,让你写出检验的思路,好象是还要写出公式.2005(研究生)1. 举例说明变量及变量类型。(10分)答案:变量:在搜集资料时,首先要根据研究目的确定同质观察单位,再对每个观察单位的某项特征进行测量或观察,该特征称为变量。如身高、体重、疗效等变量按其性质可分为两种类型:(1)数值变量:其变量值是定量的,表现为数值的大小,通常是使用仪器或某种尺度测定出来的,多有度量衡单位。如身高(cm)、体重(kg)、心律(次/min)、血压(mmHg)等。(2)分类变量:表现为互不相容的类别或属性,它又分为无序与有序两类:a.无序分类变量:是指所分类别或属性之间无程度或顺序上的差别,如:性别(男、女)血型(A、B、O、AB)等。b.有序分类变量:是指所分类别或属性之间有程度或顺序上的差别。如尿糖化验结果按-、+-、+、+、+分类,疗效按治愈、好转、无效、恶化分组。2. 在假设检验过程中,若设定a为0.05,算得统计量后,得p值为0.015,按a=0.05的检验水准拒绝无效假设。请对这一结论做出适当的评论,并为此写例假设检验中p值的含义,以及p与a的关系。(10分)答案:P值为0.015小于检验水准a(0.05),依据“小概率事件在一次随机试验中认为不可能发生”的定理,拒绝H0,接受H1,尚可以认为现有样本所代表的总体与已知总体不相等。P值的含义是指从H0所规定的总体中随机抽样时,获得等于及大于(负值为等于及小于)现有样本统计量的概率。若pa,按a检验水准不拒绝H0,可认为现有样本所代表的总体与已知总体的差别是由抽样误差造成的。若p100),t分布逼近u分布:3)已知:2、二项分布:当样本含量n足够大,且样本率p或1-p均不太小,如np与n(1-p)均大于5时,样本率p的抽样分布近似正态分布,总体率的可信区间:3、Poisson分布:当样本阳性数X50时,可按正态近似原理先求总体平均数的95%或99%可信区间:四、方差分析的应用条件:1)各样本是相互独立的随机样本;2)个样本来自正态分布总体;3)各总体方差相等,即方差齐。应用:1)两个或多个样本的均数间的比较;2)分析两个或多个因素间的交互作用;3)回归方程的线性假设检验;4)多元线性回归分析中偏回归系数的假设检验等。五、该设计是2*4析因设计设计方案如下,如图所示,可将八个样品随机分为下面的八组:A1A2A3A4B1A1B1A2B1A3B1A4B1B2A1B2A2B2A3B2A4B2先为八个样品按取样先后标上1、2、3、4、5、6、7、8,再用随机数字表将其标上随机数字,(随机数字表略去)将随机数字排秩,按秩次的1到8,分别取从A1B1、。进行实验。六、先将受试对象编号,再利用随机列表或随机数字表或计算机软件产生的随机数字,按某一行将受试对象编上随机数字,然后将其随机数字编秩,秩次为奇数的分为一组,秩次为偶数的分为一组进行实验。这就是完全随机设计两样本比较的分析思路。其检验统计量值是:,七、非条件logisti回归模型:,其中是常数项,为偏回归系数。2002级临床医学七年制医学统计学期末考试题(A卷)一、试述标准差与标准误的联系与区别。二、请以完全随机设计资料为例说明方差分析的基本思想。三、在某次假设检验中, 0.05,所得的概率为0.001,请就本例分别说明和的意义?四、研究人员调查了2005年某社区全部居民的全死因死亡及恶性肿瘤死亡人数(见表1),根据该资料可以得出哪些统计信息? (10分)表1 某社区居民2005年死亡人口调查年龄人口数全死因死亡人数恶性肿瘤死亡人数08292013842046639631240281611724260937034232合计16709071590五、请解释多元线性回归分析中R2和的统计学意义。六、什么是随访资料中的截尾值?出现截尾值的原因有哪些?七、中国人民解放军总后卫生部军需装备研究所研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉(用评分表示),且需要进行全搭配实验,应采用何种设计?需安排几个实验组?请写出设计方案。八、今测得101名3049岁的正常成年男子的血清总胆固醇(表2)。试根据此资料进行全面的统计分析。(10分)血清胆固醇(mmol/L)频数2.5 13.0 83.5 94.0 234.5 255.0 175.5 96.0 66.5 2 7.07.5 1合 计101九、为了比较工人和农民的高血压患病率,随机调查了5059岁的男性工人1281人,其中高血压患者386人;又随机调查了5059岁的男性农民387人,其中高血压患者65人。问工人与农民的高血压患病率是否相同?十、今测得10名男20岁男青年的身高与前臂长(表3),问二者有无线性相关关系,若有相关关系,其相关关系的密切程度及方向如何。(10分)表3 10名男20岁男青年的身高与前臂长编号 1 2 3 4 5 6 7 8 9 10身高(cm)170173160155173188178183180165前臂长(cm) 45 42 44 41 47 50 47 46 49 43可能用到的界值: , , 。2002级临床医学七年制医学统计学期末考试试题(A)参考答案一、试述标准差与标准误的区别和联系答:区别: 意义:标准差是描述数据分布离散程度的指标;标准误是样本统计量的标准差。 公式:; (2分) 用途:标准差用于表示数据离散程度的大小;也可用于计算变异系数、估计频数分布、制定参考值范围、进行质量控制;很多统计处理方法中要用到标准差。 标准误用于反映抽样误差的大小;计算总体均数的可信区间;统计处理方法的基础,如t检验。联系:标准误与标准差成正比;若标准差固定不变,可通过增加样本含量来减少抽样误差。二、请以完全随机设计为例说明方差分析的基本思想答:方差分析的基本思想就是把全部观察值间的变异-总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小。在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组内变异:分解为和;分解为和,得组间变异和组内变异分别为=和=,若各组的来自同一总体,则各组间的变异与组内变异一样,均由随机误差所致,=,F值()服从F分布,查F界值表得到相应的P值,然后根据所取的检验水准做出推断结论。答案难以统一,只要基本意思表达正确,均应给分,阅卷时需灵活掌握,注意把握尺度。三、在某次假设检验中,检验水准为0.05,所得的概率为0.001,请就本例分别说明和的意义? 答:称检验水准,是预先给定的概率值,它确定了小概率事件的标准;P的含义是指从规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率,即抽样误差的概率。将获得的概率P与检验水准进行比较可得出结论。本例0.05,0.0010.05,拒绝,接受,结论具有统计学意义,可以认为不同或不等。四、研究人员调查了2005年某社区全部居民的全死因死亡及恶性肿瘤死亡人数(见表1),根据该资料可以得出哪些统计信息? 答:可以得到以下统计信息:各年龄组人口构成比、各年龄组全死因构成比、恶性肿瘤死因构成比和各年龄组恶性肿瘤死亡构成比、粗死亡率和年龄别死亡率、恶性肿瘤死亡率和年龄别恶性肿瘤死亡率。(不要求:肿瘤后的死亡人数占全死因死亡人数的比例、全死因寿命表死亡概率、全死因寿命表生存概率、去肿瘤死亡后的生存概率、去肿瘤死亡后的尚存人数、去肿瘤死亡后的死亡人数、去肿瘤死亡后的生存人年数、去肿瘤死亡后的生存总人年数、去肿瘤死亡后各年龄尚存者的平均预期寿命。)五、请解释多元线性回归分析中R2和的统计学意义。答:R2为决定系数,其意义是回归平方和占总离均差平方和的比例,用R2可定量评价在的总变异中,由变量组建立的线性回归方程所能解释的比例。为剩余标准差,可以说明估计值的精确度,剩余标准差越小,表示回归方程的估计精度越高。六、什么是随访资料中的截尾值?出现的原因有哪些?答:由于某种原因使得部分病人不能随访到底,称之为截尾,从起点至截尾点所经历的时间称为截尾值。出现截尾值的原因主要有随访对象失访、治疗措施改变、研究工作结束时事件尚未发生等情况。七、研究五种类型的军装在两种环境、两种活动状态下着装战士的主观热感觉(用评分表示),且需要进行全搭配实验,应采用何种设计?需安排几个实验组?请写出设计方案。答:应采用22析因设计,需安排4个实验组。具体设计方案如下:状态1状态2环境11 2 3 4 51 2 3 4 5环境21 2 3 4 51 2 3 4 5八、今测得101名3049岁正常成年男子的血清总胆固醇(表2)。据此资料进行全面的统计分析。(10分)答:由频数表可看出,资料近似服从正态分布,可用均数和标准差描述其集中趋势和离散趋势。,制定95%参考值范围: 估计总体均数的可信区间:n=10150九、为了比较工人和农民的高血压患病率,随机调查了5059岁的男性工人1281人,其中高血压患者386人;又随机调查了5059岁的男性农民387人,其中高血压患者65人。问工人与农民的高血压患病率是否相同?答:首先将资料整理成下表形式:是否患高血压是否合计工人3868951281农民65322387合计451121716681建立检验假设,确定检验水准工人与农民的高血压患病率相同工人与农民的高血压患病率不同2选定检验方法,计算检验统计量(可选用下列两种方法之一):(1)检验: (2)u检验:确定P值,作出推断结论,(或),所以P0.05。拒绝,接受,可以认为工人和农民的高血压患病率不同。十、今测得10名男20岁男青年的身高与前臂长(表3),问二者有无线性相关关系,若有相关关系,其相关关系的密切程度及方向如何。(10分)作散点图(略)求相关系数, , 相关系数的假设检验两变量间无线性相关关系两变量间有线性相关关系 所以P 0.05,拒绝,接受,可以认为两变量间存在线性相关关系,并且呈正相关,即身高越长,前臂长越长。2002级临床医学七年制医学统计学期末考试题(B卷)一、 试述t分布与u分布的联系与区别。二、 请以完全随机设计资料为例说明方差分析的基本思想。三、 什么是假设检验的检验效能?其大小与哪些因素有关系?四、某医师对一组高血压病人在治疗过程中作追踪观察,记录其死因,并与未作治疗的高血压病人组作比较,两组死因构成比见表1。有人据此提出:“高血压患者经过治疗虽然可以降低充血性心力衰竭等的病死率,但却使因冠状动脉硬化性心脏病和心脏病猝死的死亡危险性增加了。”这样的认识是否正确,为什么?死 亡 原 因治疗组未治疗组充血性心力衰竭4.323.2脑血管病23.239.6尿毒症9.812.2冠状动脉病和心脏病猝死48.717.1其它原因14.07.9合 计100.0100.0五、请分别解释Logistic回归模型和Cox回归模型中偏回归系数的意义。六、生存时间资料有哪些特点?生存分析常用的分析方法有哪些?七、某研究室人员为研究5个不同剂量的甲状腺提取液对豚鼠甲状腺重的影响,考虑到豚鼠的种系和体重对观测指标可能有一定的影响,选用5个种系的豚鼠作实验,并按5个不同的体重标准选择受试对象,根据专业知识得知,药液、豚鼠种系、体重之间不存在交互作用。本研究应采用何种设计类型?共需多少只豚鼠?请写出实验设计方案。八、今测得101名3049岁的正常成年男子的血清总胆固醇(表2)。试根据此资料进行全面的统计分析。(10分)血清胆固醇(mmol/L)频数2.5 13.0 83.5 94.0 234.5 255.0 175.5 96.0 66.5 2 7.07.5 1合 计101九、某医院收集了305例手术患者的资料,其中手术时间5小时者242人,感染者13人;手术时间5小时者63人,感染者7人。试据此分析手术时间长短对患者切口感染是否有影响?十、某地10名一年级女大学生的胸围(cm)与肺活量(L)数据如表3所示,试进行直线回归分析。(10分)学生编号12345678910胸围X72.583.978.388.477.181.778.374.873.779.4肺活量Y2.513.111.913.282.832.863.161.912.983.28可能有用到的界值: , , 。方差分析用F界值: 2002级临床医学七年制医学统计学期末考试试题参考答案(B卷)一、试述t分布与u分布的异同与联系 (10分)答:相同点: t分布与u分布均为以0为中心的单峰对称分布。 不同点:(1)t分布是一个分布族,t曲线的形状与自由度有关,自由度越小,t值越分散,曲线越低平;自由度越大,t值越往中间集中,曲线峰值越高。而u分布即标准正态分布的图形,是唯一的一条曲线。 (2)特定自由度的t分布曲线与u分布曲线相比,峰值低而尾部高翘,相应区间内曲线下的面积小于u分布。 联系:t分布的极限形式是u分布。随着自由度的增加,t分布逐渐接近u分布,当自由度n时,t分布u分布。二、请以完全随机设计为例说明方差分析的基本思想 答:方差分析的基本思想就是把全部观察值间的变异-总变异按设计和需要分解成两个或多个组成部分,产生每部分变异的来源可能不同,比较各部分变异的大小。在完全随机设计资料的方差分析中,是把总变异分解为组间变异和和组内变异:分解为和;分解为和,得组间变异和组内变异分别为=和=,若各组的来自同一总体,则各组间的变异与组内变异一样,均由随机误差所致,=,F值()服从F分布,查F界值表得到相应的P值,然后根据所取的检验水准做出推断结论。三、什么是检验效能?其大小与哪些因素有关? (10分)答:检验效能是指,在假设检验中,当无效假设H0不正确时,用现有统计方法能够检验出其错误的能力,其概率用1-b表示。其中b为犯第二类错误即当H0不正确但不拒绝H0的概率。检验效能的大小与设定的检验水准a、样本含量n、两总体参数的差值d 有关。其它条件一定时,a越大,检验效能越高;样本量n越大,检验效能越高;两总体参数的差值d 越大,检验效能越高。反之,检验效能越低。五、请分别解释Logistic回归模型和Cox回归模型中偏回归系数的意义。答:Logistic 回归模型中的偏回归系数bi的意义为,当其它协变量均不变时,xi每变化一个单位或一个等级时, 比数比的自然对数(lnORi) 平均变化bi 个单位,可以反映xi对结局事件的作用强度。Cox 回归模型

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论