特殊儿童测验的信度与效度分析-信度检测_第1页
特殊儿童测验的信度与效度分析-信度检测_第2页
特殊儿童测验的信度与效度分析-信度检测_第3页
特殊儿童测验的信度与效度分析-信度检测_第4页
特殊儿童测验的信度与效度分析-信度检测_第5页
已阅读5页,还剩100页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

测量的信度信度(reliability):测量结果的稳定性程度。定义1:一组测量分数的真分数的变异数与实得分数得变异数的比率定义2:一组测量分数的真分数的变异数与实得分数相关系数的平方定义3:一个测验与任一个平行测验的相关系数信度的作用1、评价测验的好坏,反映随机误差的大小。注:系统误差与信度无关。2、解释个人测验的分数,X–1.96SE≤T≤X+1.96SE,标准误SE=,Sx:所得分数标准差,rxx:测验信度。3、比较两种测验,差异的标准误SEd=S:相同尺度标准分数的标准差,rxx,rYY:两个测验的信度。信度系数的估计重测信度:同一个测验对同一组被试施测两次,两次测验分数的相关系数。前提:测量的心理特质必须稳定,遗忘与练习效果基本抵消,两次施测间隔期间被试没有更多的学习或训练。优缺点:能提供测验结果是否随时间变化,预测被试将来行为的依据。容易受练习、记忆的影响。副本信度:同一组被试在两个平行测验上得分的相关系数。同时施测:等值性系数前后施测:稳定性与等值性系数前提:两份测验在题目内容、数量、形式、难度、区分度、指导语、完成时间等相似。在时间、成本上要有条件做两个测验。优缺点:只能减少而不能完全排除练习、记忆的影响。平行测验难找。分半信度:将一个测验分成相等的两半,被试在这两半测验得分的相关系数。计算时注意校正:两半方差同质:斯皮尔曼-布朗公式:r=2rhh/(1+rhh),rhh:两半分数间的相关系数。两半方差不同质:弗朗那根(Flanagan)公式:卢仑(Rulon)公式:Sa2、Sb2:两半测验的方差,Sd2:两测验分数差的方差前提:一次施测,没有副本,测验可分成两半。特点:同一测验可以有多个分半信度值。同质性信度:测验内部所有题目的一致性程度。评分者信度:多个评分者给同一批被试评分的一致性程度。肯德尔和谐系数信度的影响因素被试越异质,信度越高rn=ro:原被试信度,So2:原被试方差,Sn2:新被试方差

信度的影响因素条目数适当增加,信度提高rkk=K:测验改变后长度与原长度之比,rxx:原测验信度,rkk:新测验信度团体平均水平太高或太低,信度降低主试不按规定施测,评分标准不一,信度降低测试情境测验条目越多,信度越高,时间过长,信度降低,难度过大或过易,信度降低两次测验间隔时间越短,信度越高信度改进适当增加测验长度难度接近正态分布,控制在中等水平提高项目区分度选取恰当的被试团体主试、评分者、场地历年真题(华东师大2002)某测验的被试为2—5年级的小学生,已知信度是0.85,标准差为10,现欲知道仅用于4年级时信度是多少,4年级的标准差是5。历年真题(华南师大2001)已知某量表的分半信度为0.63,请算出原长度的信度系数。 解:rkk==1.26/1.63=0.77历年真题将测验对等分半后,两半测验得分的相关系数为0.60,校正后该测验的分半信度是(B)(2007,全国统考) A.0.70B.0.75C.0.80D.0.85什么是测验的信度?影响信度的主要因素有哪些?(2007,全国统考) 答:(1)信度是测量结果的稳定性或一致性程度。 (2)影响因素:被试、主试、施测情境、测量工具、施测时间间隔、评分计分测量的信度与效度本章提要:信度的概念与估计方法提高信度的方法效度及其与信度的关系效度的种类与估计方法提高效度的方法第一节测量信度一、什么是信度1.信度的描述定义信度(reliability)是指测量结果的稳定性和可靠性程度。2.信度的测量学定义(操作性定义)3.误差方差与信度的关系二、信度的估计方法(一)重测信度(test-retestreliability)1.含义与计算重测信度是指用同一量表对同一组被试测试两次所得结果的一致程度,其大小等于同一组被试在两次测验上所得分数的积差相关系数。即:2.重测信度使用的条件(1)所测量的心理特质必须是稳定的(2)遗忘和练习的效果基本上相互抵消(3)在两次测试时间间隔内,被试在所要测查的心理特质方面没有其他的学习和练习3.计算重测信度应注意的问题(1)两次测验时间间隔要适当(2)应提高被试的积极性(3)适宜于人格测验与速度测验,不适合于智力等难度测验(二)复本信度(Alternate-formreliability)1.含义与计算是指两个平行测验测量同一批被试所得结果的一致程度,其大小等于同一组被试在两个复本测验上所得分数的积差相关系数。计算公式同重测信度。两个复本测验实施的时间不同,复本信度所表达的含义略有不同。(1)等值性系数如果两个复本测验是同时连续测试的,则称这种复本信度为等值性系数。等值性系数的大小主要反映着两个复本测验的题目差别带来的变异情况。(2)稳定性与等值性系数如果两个复本测验是相距一段时间分两次测试,则称这种复本信度为稳定性与等值性系数。此时两个题目间的差别、两次施测情境、被试特质水平等方面的差别都会成为测验结果不一致的原因。2.复本信度使用的条件(1)两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似。(2)两次测验的时间间隔要适当。局限:(1)复本法只能减少而不能排除练习和记忆效应。(2)对于许多测验来说要建立复本是非常困难的。(三)分半信度(Split-halfreliability)1.含义与计算是指将一个测验分成对等的两半后,所有被试在这两半上得分的一致性。分半信度信度与等值性系数的解释一样,即可以把对等的两半测验看成是最短时距内施测的两个平行测验。分半信度描述的是两半题目间的一致性,所以也叫内部一致性系数。注意题目分半的方法:按题号奇偶性分半、按题目难度分半、按题目内容分半等。计算方法与复本信度类似,但被试在两半测验上得分的相关系数只是半个测验的信度,所以必须用斯皮尔曼—布朗公式加以校正:2.使用的前提条件和范围分半信度通常是在只能施测一次或没有复本的情况下使用。其中使用斯皮尔曼—布朗公式时要求全体被试在两半测验分数的变异数相等。当测验无法分成对等的两半时,无法使用。(四)同质性信度(Homogeneityreliability)1.含义同质性信度也叫内部一致性系数,它是测验内部所有题目间的一致性程度。这里的一致性有两种含义:一是所有题目都测的是同一种心理特质,二是所有题目得分之间都具有较高的正相关。同质性信度就是一个测验所测内容或特质的相同程度。实际上α系数是所有可能分半信度的平均值,但它是测验信度的一个下界值,即α系数值大,测量信度必然高,但α系数值小,却不能判断测量信度不高。例题:某态度量表共7道题目,100个被试在各题上得分的方差分别是0.81,0.82,0.80,0.86,0.88,0.79,0.89,测验总分的方差是26.00,计算该测量的信度。(五)评分者信度(Scorerreliability)1.含义与计算评分者信度指的是多个评分者给同一批人的答卷进行评分的一致性程度。对于主观试题,不同的评分者给出的分数是不等的,这样会造成误差,如何降低评分者信度是心理测量的重要任务之一。当评分者人数为2时,评分者信度等于两个评分者给同一批被试答卷所给分数的相关系数。如果是多个评分者,评分者信度采用肯德尔和谐系数进行估计。三、信度的作用(一)评价测验信度是测量过程中所存在的随机误差大小的反映。信度低,测量随机误差大,测量结果就会与真分数发生较大偏离。信度是衡量一个测验好坏的重要指标之一,测验的信度达到多少才可以接受呢?一般来讲,能力与成就测验的信度应该在0.90以上,人格测量信度系数应该在0.80以上。测量中的系统误差与信度无关。(二)解释分数1.解释个人测验分数的意义从理论上讲,一个人的真分数本来是用同一测验对他反复施测所得的平均值,其误差则是这些实测值的标准差。但实际上,这是做不到的。实际的做法是用一个团体(人数足够多)两次施测得结果来代替对同一个人的反复施测,以估计测量误差的变异数。此时每个人两次测量的分数之差构成一个新的分布,这个分布的标准差就是测量的标准误,它是此次测量中误差大小的客观指标,有了这一指标,就可以对团体中任何一个人的测验成绩做出恰当的解释。2.不同测验分数的比较四、影响测量信度的主要因素测量信度是测量过程中随机误差大小的反映,随机误差大,信度就低,随机误差小,信度就高。因此,在测量过程中凡是能引起测量随机误差的因素都会影响测量信度。影响信度的几种主要因素为:(一)被试方面就单个被试而言,其身心健康状况、应试动机、注意水平、作答态度等会影响测量信度。就团体而言,团体的异质程度与分数的分布密切相关,一个团体越是异质,其分数分布范围越大,计算出来的信度系数值越高,这样会高估真正的信度值。当团体内部水平相差不大(同质)时,其得分分布必然会狭窄,以相关为基础计算出来的信度值必然小,可能会低估真正的信度值。此外若团体的平均数太高或太低,同样使测验的总分分布变窄,低估测验的真正信度。(二)主试者方面就主试者而言,若不按指导手册中的规定施测,或故意制造紧张气氛,或给考生一定的暗示、协助等,测量信度会大大降低。就阅卷评分者而言,若评分标准掌握不一,或前后标准不统一,甚至随心所欲,则也会降低测量信度。(三)施测情境方面实施测验时,环境是否安静,光线和通风状况是否良好,所需设备是否齐全,桌面是否合乎要求等都可能影响到测量信度。(四)测量工具方面测量的取样、测验的长度、难度等是影响测量信度的主要因素或关键因素。一般来说,测验越长,信度值越高。这是因为:测验加长,能够改进项目取样的代表性,从而能够更好地反映受测者的真实水平。测验的项目越多,每个项目上得随机误差会相互抵消。测验太难或太容易,都会降低测验的信度。(五)两次施测之间的时间间隔计算重测信度、稳定性与等值性系数时,两次测验相隔时间越短,其信度值可能会越大;两次测验相隔时间越长,其信度值可能会越小。五、提高测量信度的常用方法(一)适当增加测验的长度增加新项目必须与原试卷中的所有项目同质,新增项目必须适度。(二)使测验中题目的难度接近正态分布,并控制在中等难度(三)努力提高测验试题的区分度(四)选取适当的被试团体(五)主试者严格按照要求去做同学好!仔细思考这些问题帮助我们更好理解本次课的内容。为什么我们对特殊儿童测量的结果有差异?为什么我们不能每次对特殊儿童测量精确?为什么我们用不同的量表就有不同的结果?为什么有时间测量的结果与实际情况不符?为什么我们需要规定所有测验的都标准化?为什么我们规定给定测量结果一个区间值?误差是由测量中与目的无关的因素引起的不准确或不一致的效应。由于各种原因,使我们对特殊儿童进行测量时产生了测量误差,使我们不能准确地、稳定地、全面地反映该特殊的本质心理特征。

这种情况是无法完全避免的,只能采用数学的方法把它消去。

这种无法去除的东西,我们称之为“误差”。测验中随机误差、系统误差、过失误差总是错综复杂地存在着,因而造成了测验数据的波动性或变异性,使我们不能准确测量。测量误差可分为三类:随机误差是由于测验中的一些偶然因素引起,而又不容易控制的误差。系统误差就是观测过程中服从确定规律性的误差。由于测验条件不同,造成不同的有一定规律性的误差。过失误差。明显歪曲实验结果的误差成为过失误差,它是由于实验观测过程中的过失造成的。为控制各种误差,为此必须要了解误差的来源。测量的误差来源:测验内部测验内部的误差主要来源于题目取样。施测过程物理环境主试者方面、意外干扰评分计分。受测者本身应试动机测验焦虑学习、发展与教育测验经验练习效应反应方式生理变化真分数是一个非常重要的概念。测验真分数:真分数的操作定义是:经过无数次测量所得的平均值。用公式表示:X=T+EX为实得分数或观测分数,T是假设的真分数,E是测量误差。这是在一个特定人身上实得分数、真分数和测量误差之间的关系。测量误差的性质:1.误差可能是正的,也可能是负的。2.如果对一个人测量无数次,其平均误差为0;3.真分数和测量误差是相互独立的;4.误差分数和实得分数的相关为0。一组测验分数之间的变异性是由与测量目的有关的变异数、稳定的但是出自无关来源的变异数和测量误差变异数所决定的。在一个团体中,由于每个人的误差都是随机的,方向不同,只要团体足够大,其误差便会相互抵消。==一个团体的平均真分数该团体中所有被试实得分数的平均值测验的信度与效度分析——测验的信度同学好!上课前我们来思考几个问题。如何减少对特殊儿童检测的误差?在检测中误差有什么明显的特征?检测结果分数变化太大怎么处理?检测结果与实际情况有差距怎办?信度:指测量工具的稳定性、一致性。不要理解成可信程度。测验的信度:定义指的是测量结果的稳定性程度(或叫可靠性)。也指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。理论定义传统的信度理论认为,每一个测验的实得分数(X)总是由真实分数(T)和误差(E)两个部份构成的。公式为:X=T+E操作定义一组测量分数的真分数变异数(方差ST2)与总变异数(总方差、实得分数的方差SX2)的比率,或者是真实分数方差占总方差的的百分比。rxx=ST2/SX2你理解了三者之间的关系了吗。信度的指标:信度系数真分数方差与实得分数的方差的比值,公式是:rxx=ST/SX=ptx2信度指数真分数标准差与实得分数的标准差的比值。信度指数的平方就是信度系数。标准误个人测验分数的变异量。测量的标准误与信度之间呈反比关系。用一组被试两次测量结果来代替同一个人反复实测。共有4种解释,都非常重要。信度与测验分数的解释:解释真实分数与实得分数的相关比较信度可以接受的水平解释个人分数的意义比较不同测验分数的差异信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。一般的能力测验和成就测验的信度系数都在0.90以上;人格测验、兴趣、态度、价值观等测验的信度一般在0.80-0.85。一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。评价两个不同测验的分数是否有明显差异。比较包括两个人不同分数的差别和同一被试在两个测验上的差别。这个例题是估计真实分数的范围!例题一:假设在一个智力测验中某个被试的IQ为100,这是否反映了他的真实水平?如果再测一次他的分数将改变多少?已知该智力测验的标准差是15,信度系数为0.89,则其IQ的测量标准误和可能范围分别是多少?题解:SE=15=5.0Q=100±1.96x5=100±9.8≈90~110我们可以说这个被试的真实IQ有95%的可能性落在90与110之间。即若再测一次,他的智商低于90、高于110的可能性不超过5%。这个例题是评价两个不同测验的分数是否有明显差异!例题二:某被试在韦氏成人智力测验中言语智商为102,操作智商为108。已知两个分数都是以100为平均数,15为标准差的标准分数。假设言语测验和操作测验的分半信度分别为0.97和0.93。问其操作智商是否显著高于言语智商呢?题解:首先计算出差异分数的标准误:在统计上,经常要求两个分数的差异程度达到0.05的显著水平,才能承认不是误差的影响。因此,将差异标准误(4.74)乘以1.96,结果为9.29,这表明个体在韦氏测验两个得分的差异高于大约10分,才能达到0.05显著水平。上述被试的分数差异(108-102=6<10)是不显著的。下课了!请您及时复习。特殊儿童检测信度信度(reliability)一、什么是信度定义:指的是测量结果的稳定性程度(或叫可靠性)。也指同一被试在不同时间内用同一测验(或用另一套相等的测验)重复测量,所得结果的一致程度。1、理论定义:传统的信度理论认为,每一个测验的实得分数(X)总是由真实分数(T)和误差(E)两个部份构成的,公式为:X=T+E讨论一组测验分数的特性时,可用方差导出具体分数,公式:(测验实得分数的方差)=(测验真分数的方差)+(测验误差的方差)信度与测验分数的解释(一)解释真实分数与实得分数的相关:信度系数可以解释为总的方差中有多少比例是由真实分数的方差决定的,也就是测验的总变异中真分数造成的变异占百分之几。(二)比较信度可以接受的水平:一般的能力测验和成就测验的信度系数都在0.90以上;人格测验、兴趣、态度、价值观等测验的信度一般在0.80-0.85。一般原则是:当<0.70时,测验不能用于对个人作出评价或预测,而且不能作团体比较;当0.70≤<0.85时,可用于团体比较;当≥0.85时,才能用来鉴别或预测个人成绩或作为。(三)解释个人分数的意义:从信度可以解释个人分数的意义,这是测量标准误的应用。它有两个作用:一是估计真实分数的范围;二是了解实得分数再测时可能的变化情形。(四)比较不同测验分数的差异:测量标准误和测验信度在评价两个不同测验的分数是否有明显差异时也非常重要。这种比较包括两个人不同分数的差别和同一被试在两个测验上的差别。信度的类型及估计方法(一)重测信度(再测信度)(test-retestreliabity)1、含义与计算:又称稳定性系数。他的计算方法是采用重测法,即使用同一测验,在同样条件下对同一组被试前后施测两次测验,求两次得分间的相关系数。(二)复本信度

(Alternate-formreliability)1、含义与计算:含义:又称等值性系数。它是以两个平行或复本的测验(等值但题目不同)来测量同一群体,然后求得被试在两个测验上得分的相关系数,这个相关系数就代表了复本信度的高低。复本信度反映的是测验在内容上的等值性,故称等值性系数。复本信度的高低关键取决于复本测验的选择。(三)分半信度(split-halfreliability)1、含义与计算指采用分半法估计所得的信度系数。这种方法估计信度系数只需一种测验形式,实施一次测验。通常是在测验实施后将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。常见的是将测题按其序列号的奇偶分,这种分法的前提是:测题并非随机排列,而是按某种顺序(如难度)排列;如果随机排列的题目,则必须是所有题目平等的(要么难度相等,要么性质一样);如果测验有多个分量表,应该在分量表内部排好顺序,再把各分量表分两半组合起来求相关。2、计算(1)两半测验分数的变异数相等(方差齐性)先计算两半测验的积差相关系数,再进行校正。常用的修正公式是:斯皮尔曼-布朗公式:(2)两半测验分数的变异数不等(方差不齐),可采用:弗朗那根公式或卢伦公式中的任一一个。(四)同质性信度

(homogeneityreliability)1、含义:指测验内部所有题目间的一致性。题目的一致性有两层含义:其一是指所有题目都测的是同一种心理特质;其二是指所有题目之间都具有较高的正相关。总之,同质性信度就是一个测验所测内容或特质的相同程度。2、测量同质性的基本公式:3、库德-理查逊公式:

适用于客观性试题(0、1记分)3、克伦巴赫系数(多重记分测验)(五)评分者信度(scorerreliability)1、含义与计算:指的是多个评分者给同一批人的答卷进行评分的一致性程度。是用于测量不同评分者之间所产生的误差。式中W为和谐系数,K为评分者的人数,N为被评对象数,RI为每一对象被评的等级总和。这是一个统计表,记住之后就能有效控制误差!一.各种信度系数相应误差方差的来源内容取样时间和内容取样内容取样内容的异质性评分者之间的差异复本信度(连续施测)

复本信度(间隔施测)分半信度同质性信度评分者信度时间取样重测信度信度系数类型误差方差来源样本团体的特征对测验结果的影响很大!二.影响信度的因素(一)样本团体的特征分数分布当分布范围增大时,其信度估计就较高;当分布范围减小时,相关系数随之下降,信度值则较低。异质性若获得信度的取样团体较为异质的话,往往会高估测验的信度,相反则会低估测验的信度。平均水平对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度。所以我们应该选择测验长度比较大的测验!二.影响信度的因素(二)测验的长度代表性测验越长,测验的测题取样或内容取样越有代表性。猜测性测验越长,被试的猜测因素影响就越小。随机性测验的项目越多,在每个项目上的随机误差就可以相互抵消。所以我们应该选择测验长度比较大的测验!二.影响信度的因素(三)测验的难度难度对信度的影响只存在于某些测验中,如智力测验、成就测验、

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论