自考05616心理测量与评估华南师范大学常考重点.docx_第1页
自考05616心理测量与评估华南师范大学常考重点.docx_第2页
自考05616心理测量与评估华南师范大学常考重点.docx_第3页
自考05616心理测量与评估华南师范大学常考重点.docx_第4页
自考05616心理测量与评估华南师范大学常考重点.docx_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

自考05616 心理测量与评估 华南师范大学 常考重点第一章 绪论S1 测量和测量量化水平1、测量的科学定义名词解释:测量(识记)是按一定规则给所考察对象在某种性质的量度系统上指定值的活动。简而言之,测量就是使对象特点予以量化的活动。测量的要素:一是测量的参照点;二是测量单位2、性质不同的量度系统(精确度水平由低到高)选择或简答 “名义量表”,其上的值量化水平最低,只有类别标志的含义,不能施行任何运算(车牌号码) “顺序量表”,其上的值量化水平略高,只有顺序的含义而不等距,既无可加性更无可除性,只可施行顺序递推的逻辑运算(品德评定 心理测量) “等距量表”,其上的值不但有顺序含义,还是等距的,即单位相等,所以量化水平更高,没有绝对零点,只有可加性而无可除性,故只可施行加减运算不可做乘除运算(温度)“比例量表”,其上的值不但有顺序性,还等距、等单位、有绝对零点,既有可加性又有可除性,量化水平最高(身高 体重)3、心理测量及其特点心理测量:是按规则给所考察对象的心理特质,在一定性质的量度系统上,即量表上指定值的活动。 心理测量的特点(与物理测量的区别跟物理测量比,有其显著不同的突出特点;即心理测量的性质具有:间接性、相对性和主体间交往性的突出特点:心理测量的间接性 (心理的相对性和稳定性)a被测对象的心理活动,无论是他的感觉知觉,还是他的情感态度等,都不是测量活动的主持者、施测者所能直接观察与了解的b人的心理是世界物质发展到最高阶段的产物,个体的心理特性既是相对稳定的,又是对人的行为活动起支配决定作用的,因而会在人的行为的各个方面不断表现出来心理测量的相对性(测量结果的函数关系、测量结果取值)a内部心理特性与外显行为间不存在确定性函数关系,测量结果只有相对意义b按心理测量对象本身的特性,测量结果大都只能在顺序量表上取值,具有相对性;即使放宽某些要求,最多也只能在等距量表上取值心理测量的主体间的交往性a作为心理测量活动对象的受测者并非静止消极的,只单纯接受施测;相反他要积极作用于测量活动本身b测量活动所测的对象是受测主体的心理特性,而主体具有能动性,所以一定要重视受测者在测量过程中的学习和迁移能力c由于施受双方都是能动主体,处在同一发展层级上,因而有时其施受地位也可以互换,并非绝对固定4、心理测验心理测验的定义(识记)名词解释心理测验是心理测量的一种,是更加符合实证科学精神与要求的心理测量中特别的一种。其定义一般认为是行为样本的客观而标准化测量行为样本的意思(领会)多选测验所直接测察的是:个体的外部行为这些外部行为应是:所要测察的内部心理结构的代表性“行为样本” 所测行为是否能构成代表性“行为样本”,要经实际检验由客观事实资料来确证心理测验标准化(领会)(S3所谓标准化就是指测验内容、施测、评分以及分数解释规划化、一致性与科学性)多选:标准化是所有测量活动走向科学的共同要求,包括:测验编制 即测量工具的标准化 测验实施与评分的标准化 分数解释的标准化心理测验客观性:(实操)测验的实施、评分与测验结果的解释应用都要严格按测验指导书的统一规定办,不能任意来确定;(编制与修改)测验开发编制过程中,测验项目难度及测试性能如何,应该依据客观事实来得出;筛选项目应通过调查研究根据事实资料来确定;(效果评估)标准化测验的实际质量如何更要通过实证检验来确定常模:打算要测的被试群体在所测特性上的一般水平与水平分布状态(S4测验常模(识记)简称常模,理论上是指所有应测被试在测验所测特质上的实有水平的分布状况或分布形态;实际操作中是指代表性被试样组在测验上得分的分布状况或分布形态)5、心理评估(识记)就是使用测验、行为观察、晤谈、个案资料研究和其他测评程序(评定量表、问卷),为达到对个体作出深入的心理评价,从而进行收集和整合资料的活动。是临床心理工作的重要组成部分。途径:测验、行为观察、晤谈、个案资料研究、评定量表6、心理评估过程的特点与作用(领会)心理评估是针对特定个体或少数个体的某种心理问题,连续不断地提出假设和检验假设的过程。心理评估的目的在于为决策服务;即为诊断决策,为职业选择、治疗建议、教育计划的决策,乃至为司法决策等服务。7、心理评估与心理测量及测验的区别(简单应用)心理评估是通过多种途径、工具与方法来收集和整合资料的,而心理测量是只通过量化的方法常在严格条件下使用标准化工具来收集资料的(心理评估包括了测量与测验在内但不限于测量和测验,它强调多种方法的综合运用,并强调不把任何一种方法收集到的资料绝对化)心理评估要完成的根本任务是要“作出深入的心理评价”。评估中不但要收集量化资料还要收集质性资料,不但作出事实判断还要作出价值判断。S2 心理测样的发展1、中国古代的心理测量思想和实践探索(识记):汉代推行察举制 三国时代魏人刘劭著有人物志一书,他奉行“中庸至德” 的儒家教义,对人的形质、人性、才具以及志业的“考课核实”做了深入的研究。著名的心理学家伍德沃斯将九连环称为“中国式的迷津”,七巧板则被称为唐图2、科学心理测验的诞生:高尔顿:重视个体差异和提倡心理测量(心理测量运动的重要任务) 等级评定量表、问卷法及自由联想法的先驱;卡特尔:首次提出了“心理测验”一词; 1905年比纳西蒙量表的编制发行,标志了人类历史上科学的标准化心理测验的诞生。19世纪80年代是高尔顿的十年,90年代则是卡特尔的十年,进入20世纪的头十年就属于比纳3、各种类型心理测验的发展(识记)智力和能力测验的发展:1916年美国斯坦福大学修订了比纳西蒙量表,推出了斯坦福比纳智力量表作为标准化测量工具,首次采用了“智力商数(IQ)”来描述个体的智力水平。此后智商成为一个广为流传的概念。1918年美国参加第一次世界大战,编织成了“军队甲种测验”“军队乙种测验”,前者为一般常规的言语测验,后者为非言语测验学业成就测验的发展:1908年桑代克发表了书法量表,1923年斯坦福成绩测验发表,产生了第一个学业成就成套测验人格测验的发展:早期的人格测验起源于对精神病人的关爱,先驱是克雷佩林,他1892年对精神病患者实施自由联想测验。心理测验的另一领域涉及情感行为或非智力行为,适于这一目的测验一般称为人格测验;人格测验的三种技术:人格问卷的原型即自陈问卷 表现型技术或情境测验方法; 投射技术。心理卫生评定量表等的发展:上世纪50年代以来,心理卫生评定量表有了很大的发展。严格地说,心理卫生评定量表并不属于心理测验的范畴,当然二者也不是截然分开的4、心理测验的种类和功能多选按测验所测心理特性分类:能力测验;学业成就测验;人格测验;神经心理测验;心理卫生评定量表按接受对象规模分类:个别测验; 团体测验按施测方式分类:文字测验; 非文字测验; 情境测验; 计算机化测验;按测验对作答行为要求分类最高成就测验; 典型行为测验按测验分数解释参照体系分类常模参照测验;标准参照测验常模参照测验:参照体系是常模,即所测被试团体在所测特性上的实有水平分布。标准参照测验:参照体系是社会应有要求,即所设置的标准;这类测验上被试的表现,要跟社会设定的要求去作比较,看其是否达标,掌握的程度如何,这样来解释测验分数的意义按测验刺激性质(按测验任务)分类:结构化测验 投射测验按测验目的分类:描述性测验 诊断性测验 预测性测验按测验的应用领域分类: 教育测验; 职业测验 临床测验 临床测验:广义上是指所有为临床工作之用的心理测验,包括智力、人格测验;狭义是指专为医学临床应用的或者某种心理咨询和辅导而设计应用的测验,包括神经心理测验、儿童心智缺陷测验、心理卫生评定量表等5、心理测验的基本功能(鉴定个别差异最基本功能、描述、诊断、预测和评价功能):认识和鉴定 清楚人的心理特征、结构、发展水平的实际状况及潜力如何,跟他人的差别何,并用量化的方式准确表示出来;以据此给出有针对性建议。描述、诊断和预测的功能从鉴定个体差异中派生出来,并进一步派生出评价功能。这些都是心理测验的基本功能6、理测验的应用领域:当心理测验应用在教育、职业、人事、心理咨询与辅导、以及科学研究当中时,会产生出其他的功能。在职业与人事领域,会发挥出应选、安置和分类功能;在心理咨询和辅导领域,会发挥出搜集资料、做出评估与诊断、协助决策、对干预措施或指导建议做评价等功能;在教育领域会用于学生、教师、管理者的评价,包括学生的学习和发展、教师和管理者的评价,在科研领域,可用于搜集资料、实验分组和提出与检验实验假设等S3正确对待和使用心理测验1、心理测验在我国的发展历史2、正确对待和使用心理测验测验的错误观:测验万能论:测验解决一切问题,分数绝对化; 测验无用论:测验侵犯个人隐私、违背民主原则。为宿命论和种族歧视提供依据测验的正确观: 一是认识到心理测验是心理学重要的研究方法,是决策的辅助工具; 二是认识到测验作为研究方法和测量工具尚不完善第二章 心理测量中的统计技术1、数据和变量的种类: 变量种类:称名变量、顺序变量、等距变量、比率变量(名义、顺序、等距、比例量表);按照是否有连续性分为:离散性变量、连续性变量 离散性变量: 称名变量,如球衣号 顺序变量,如成绩名次连续性变量: 等距变量,如温度 比率变量,如考试成绩分数、能力/智力测验分数2、总体 样本和取样 (理解)总体是具有某种特征的一类事物的全体;总体中的每个基本单元但与称为个体;从总体抽取的一部分个体,称为总体的一个样本,这样的行动叫取样;而样本所含的每一个体,有时有被称为元素或样品个体数目超过30的样本称为大样本,等于或小于30的样本称为小样本,一般来说,样本越大,对总体的代表性就越强。S1次数分布与集中量数 1、测验分数的次数分布表与图次数(识记)即现象出现的频数,一般用符号f表示次数分布表的编制次数分布,指的是一批数据中各个不同数值所出现次数多少的情况,或者是这批数据在轴上各个区间所出现次数多少的情况。次数分布表可分为简单次数分布表、相对次数分布表和累积次数分布表(以下累积递减、以上累积递增)全距是最大数值和最小数值之差,又名两级差,用符号R表示,R=Xmax-Xmin 相对次数分布编制:将简单次数分布中各组的实际次数除以总次数(f/N)表2-5次数直方图与多边图:次数分布图有次数直方图和次数多边图 表2-1 表2-2累积次数分布图 表2-3测验分数的正态与偏态分布多选,或者考图正态分布曲线:一条单峰对称的曲线,如果这种形状的曲线还符合统计数学的某些要求就可称为正态分布曲线正偏态分布曲线:高峰偏向数量小的方向的曲线,即曲线尾巴指向正无穷大 表明一笔数据中数值小的数居多,难度小,测量集中在大部分人去负偏态分布曲线:高峰偏向数量大方向的曲线,即曲线尾巴指向负无穷大,表明一批数据中数值大的数据居多,难度大,测量分数比较低2、集中量数:指用来描述数据的集中趋势的特征量数包括算术平均数、中数、众数等3、中数和众数中数:按大小顺序排列的一组数据中,位置居中的那个数称为中位数,简称中数众数有粗略众数和理论众数两类,粗略众数是指一组数据中频数出现最多的那个数,可通过观察法直接求得S2 差异量数与标准分数1、差异量数:是用来描述数据离散程度的特征量数,包括平均差、方差、标准差平均差:即全组数据与其平均数的离差的绝对值的平均数,用符号AD表示方差与标准差:方差S2指的是这组数据的离均平方数的算术平均数。方差的算术平方根叫标准差,用符号S表示集中量数的差异量数对数据分布形态的影响简答论述集中量数影响着数据分布的位置:集中量数越小,则数据在数轴上的分布越靠左,集中量数越大,则数据在数轴分布越靠右。差异量数影响到数据分布曲线的“展形”或“胖瘦”:差异量数越小,则数据分布曲线越高瘦,分布的覆盖范围越窄;差异量数越大,则数据分布曲线越矮胖,覆盖范围越宽。2、正态分布的性质:简答 正态分布曲线是单峰对称的,以过平均数点的垂线为对称轴; 正态分布曲线上平均数对应点最高,然后向两侧逐渐下降,不断地靠近基线无限延伸,但始终不和基线相交; 正态分布曲线下的总面积为1,过平均数点的垂线将正态分布曲线下的面积划分为各是0.5的相等两个部分; 正态分布曲线,根据平均数、标准差的不同有不同的分布形态。平均数决定曲线的位置,标准差决定曲线的展形; 正态分布曲线下,随机变量离平均数多少个标差距离内取值的概率,有一定规律。正负一个标准差之间取值的概率为68.26%;正负两个标准差之间取值的概率为95.44%;正负三个标准差之间取值的概率为99.72%。所以服从正态分布的随机变量几乎所有取值都处于正负三个标准差之内3、标准分数地位量数与标准分数地位量数:指反映次数分布中各数据所处地位的量标准分数(识记)又称Z分数,是原始分数以本组标准差为单位时对本组平均数的距离;其值就是该分数与平均数之差除以标准差后所得之商标准分数的性质简答 标准分数的平均数为0,标准差为1(即转换成Z分数后,以1为单位,以0为参照点); 标准分数是原始分数线性转换的结果,其分布形态和原始分数分布形态完全相似; 标准分数有正、负号与绝对值;正负号表示原始分数是大于还是小与平均分数,绝对值表示原始分数对平均分数的距离; 如果原始分数呈正态分布或近似正态分布,查正态分布表可知,在正负3个标准差之间的取值范围即可能为99.73%,这就意味着原始分数的绝大多数取值都在正负3个标准差之间。由标准分数的求法和性质可知,把原始分数转换成标准分数的实质,就是把单位不等距和缺乏明确参照点的分数,转换成为以标准差为单位,以平均数为参照点的量表分数。可以证明,任何一组数据的标准分数的平均数为0,标准差为1.标准分数的应用简答A明确每个原始分数在分布中的相对位置;B比较两种测验成绩的优劣;C计算被试接受不同测验之后的总分和平均分S3相关与回归1、 相关 (事物或现象之间的相互关系有两种类型:函数关系、相关关系)变量间的关系相关关系:是指两个事物或现象之间存在不十分严格的依存关系,其特征是现象与现象之间存在一定的数量关系,但又不象函数关系那样能以一个变量的数值精确地求出另一个变量的数值。(回归分析)相关关系的分类:选择按照变量关系的表现形态,相关可分为直线相关和曲线相关。图2-11按照数值变化的总趋势,相关关系又可分为正相关和负相关;图2-10按照两个变量联系的紧密程度,相关关系还可以分为:完全相关、高度相关、低度相关、零相关相关关系的性质 在相关分析中,有相关系数来描述变量之间的相关方向和程度。相关系数取值范围-1和+1之间,相关系数的正负号表示相关的方向,正号表示为正相关,负号表示负相关。相关系数的绝对值表示相关程度,绝对值越大,表示相关越强,绝对值越小,表示相关程度越弱。相关系数等于0时为零相关(即两个变量不存在相关关系,彼此独立),等于为完全相关。需要特别注意的是,事物间有相关关系并不能说明就存在有因果关系。积差相关系数是心理学研究中常用的相关系数之一。积差相关又称积矩相关,皮尔逊提出的一种计算变量间的积差相关系数,因而有称为皮尔逊相关当两列变量符合以下条件时,可以计算变量间的积差相关系数 多选简答两列的变量均为连续变量; 两列的变量的数据一一对应; 两列的变量所来自的总体服从正态分布 2、回归名解 回归分析:通过变量间不确定的关系,去发现变量内在的、隐藏的数量关系规律性的统计学方法选择回归方程y值计算(a 是回归线在Y轴的截距,b是回归线的斜率,称回归系数): 名解决定性系数:在回归分析中,用决定性系数来表达回归方程式的有效性程度,决定性系数就是相关系数的平方r2回归线有两个特征,一是截距,另一是斜率。截距是指自变量取值为0时因变量的取值。斜率表明自变量对因变量所具有的影响程度。第三章 测验的编制、实施与评分S1 测验的编制1、测验编制的一般程序:确定测验目的; 拟定编制计划; 开发测验项目; 预测和项目分析; 合成测验; 测验的标准化; 测验的质量检验(收集信度、效度资料); 编制测验手册;确定测验目的测验对象:测验要测的人,或者说测验编成后要施用于何种群体测验目标:所编测验是用来测量的是人的什么心理特质; 测验用途:测验在社会生活、教育过程、心理咨询辅导与科研工作中的具体功用。拟定编制计划(使用双向细目表)理解工作内容:确定测验所包含的内容和各种技能,以及每一种内容或技能在测验中的地位.用 途:一是:明确了应该编哪方面的测验项目以及多少测验题目,结束后可比照核对测验项目是否反映了所要测量的领域;二是:记分时可按计划中百分比确定每类测验项目的分数标准。开发测验项目:测验编制资料,遵循以下原则: a资料要有丰富性; b资料要有普遍性;选择项目的形式,项目确定的重要原则 :a使受测者容易明了测验的方法; b使受测者在完成时不会因为项目形式不当而出错; c测验过程省时; d计分省时神力; e经济编写测验项目:a项目来源:I直接选用国内外优秀的相关测验项目;II修改前人测验中的有关项目;III 自己独立编b 编写项目的要注意的问题:I测验项目的取样应该具有代表性;II项目的范围与测验计划相一致;III测验项目的难度应有一定分布空间; IV初编项目数量要比所需数目多一倍至几倍,以备筛选;V用语力求精炼简短,浅显明了;VI作答说明必须简明c初步检查的方面:1测验项目编制的技术性问题2初步确定测验项目是否具有必要的有效性与可信度预测和项目分析预测,预测要注意的问题:a对象取自正式测验准备应用的群体; b样本应有充分代表; c实施的情境与过程应与正式测验相同;d时间充裕,可适当延长时间,使被试将题目完成从而获得充分的反应资料 e测验过程中,随时记录被试的反应项目分析,项目分析的内容包括 :质的分析和量的分析。一是要从内容上检查取样的适当性,文字表达是否清晰;二是要对预测的数据结果进行统计分析,确定难度、区分度及备选答案的适宜性合成测验:包括三部分内容:测验项目的选择; 测验项目的编排 测验复本的编制测验项目的选择,标准由三个:一是能否符合测验目的与性质;b二是项目难度要恰当;c三是项目区分度要高; 测验项目的编排,题目编排一般有一下两种方式:a逐类直进式(韦克斯勒量表,同一分测验内由易到难);b混合螺旋式(比纳西蒙智力量表) 测验复本的编制,编制复本的关键是等值,所谓等值需要符合下列条件(如何编制复本):A复本和原本所测量的是同一心理特质;B复本和原本必须具有相同的内容和项目类型;C复本和原本不能有相同的项目;D复本和复本的项目数量必须等同,并且有大体相同的难度和区分度;E在测量同一团体时,复本和原本的分数分布大致相同;测验的标准化:所谓标准化就是指测验内容、施测、评分以及分数解释规划化、一致性与科学性测验内容(工具)标准化;施测过程标准化;测验评分标准化;分数解释标准化测验的质量检验(收集信度、效度资料);编制测验手册包括以下内容: 测验的目的和功用;编制测验的理论背景及开发测验项目的依据;测验的实施方法、时限及注意事项;测验的标准答案和评分方法;常模资料;测验的信度与效度资料2、测验项目的编制技术命题的一般原则:(理解)1测题要符合测验目的;2内容取样要有代表性;3题目格式不要让被试产生误解;4文句要简明扼要,排除无关因素;5应有不致引起争论的确定答案(创造力和人格测验除外);6各个试题必须彼此独立,不可相互牵连;7题目不可含有暗示本题或其它答案的线索;8题目内容不要超过受测团体的知识能力;9所提出问题应避免涉及社会禁忌和个人隐私;10施测与评分省时.几种主要的测验项目类型:1论文题2选择型项目3判断型项目4匹配型项目5填空型项目6简答题7操作题8联想题和投射题罗夏墨迹测验:是以墨迹图来引起被试者的联想,探测被试的人格特征S2 测验的实施1、主试的资格(测验的主持和实施者在心理测量中被称为主试;只有训练有素、资质合格的心理测试工作者才能胜任)满足三方面要求:心理学基础知识;心理测验的理论知识 心理测验的专业技能 测验工作者的职业道德很能体现心理测验工作者的职业道德的表现之一就是对测验的保密2、测验的选择(临考前看书)P46-47根据测验目的来选择测验:测验的目的是我们选择测验的首要考虑问题。由于每个测验的用途和使用范围都是不一样的,所以研究者在使用测验之前都要研究测验的功用,优缺点;在实际工作中,不能通过测验的名称盲目选择测验,必须了解该测验真正测的什么心理特这及使用范围和功效,否则会造成测验使用不当。根据被试的情况来选择测验 :被试的特点和具备的条件也是选择测验的重要依据。因为每个测验都有一个使用的年龄和年纪范围,不在此范围的被试是不能使用这一测验。根据测验的质量来选择测验:测验的技术参数是一个测验编制好坏的重要指标,测验的信度、效度和常模的优劣常被用来选择的依据;另外还要考虑测验的时效性,这包括项目内容时效和常模资料时效两个方面。3、测验的准备预告测验 准备好测验材料 熟悉测验的具体程序 确保满意合适的测验情境 协助被试做好准备主试应协助被试做好哪方面的准备:时间准备 生理准备 心理准备4、测验的实施:指导语和时限 做记录 如何对待被试的要求 测验中主试的职责指导语和时限:指导语一般包括针对主试和针对被试两部分。针对主试的指导语通常单独印在另外一张纸上,主要是对测验的细节的进步一步说明及注意事项。做记录 记录要隐蔽 记录要忠实 如何对待被试的要求 测验中主试的职责 遵从指导语; 测验前不讲无关的话; 主试在测验时应集中注意,认真观察被试的所有反应行为; 在任何情况下,主试都不能对被试的回答有所暗示; 在测验中也可适当强化被试的行为,以此鼓励被试继续集中注意力在测验上; 鼓励被试回答; 对特殊问题有所准备; 与被试建立良好的协调合作关系 5、影响被试作答反应的因素:测验技巧 练习效应 教练测验 应试动机 测验焦虑 反应定势测验技巧:被试的测验经验和测验技巧会影响测验分数 练习效应:任何一个测验在第二次应用时,都会有练习效应而使得成绩有所提高教练测验:是针对着测验内容与形式进行专门的教学和辅导应试动机测验焦虑:是指被试因接受测验而产生的一种忧虑和紧张情绪,它会影响测验结果的真实性反应定势:也称反应的方式或反应风格,是指独立于测验内容的反应倾向;即由于每个人回答问题习惯的不同而使有相同能力的被试获得不同的分数(S7反应定势 :反应定势与测验内容有关,指被试有意或无意地掩盖其真实情况按自己或别人所希望表现的形象进行作答。如应聘工作。常见的反应定势:社会称许性:指被试在测验上有依附社会所期望的行为方式作答的倾向)。不用的反应定势对测验分数影响如下:“精确速度”反应定势; 肯定(否定)反应定势; 偏好特殊位置反应定势; 偏好较长选项反应定势; 猜测反应定势 S3测验的评分与解释1、测验的评分:评分是整个测验施测过程的最后步骤,也是为测验结果的解释报告做好准备的关键环节原始分数:根据被试的实际作答,按测验的评分程序与标准,对每个测验项目及整个测验上所作反应评出的分数。原始分数的转化2、测验分数的解释如何看待测验分数的意义:解释分数的原则a主试应充分了解测验的性质与功能b对导致测验结果的原因、解释应慎重,谨防片面极端c必须充分考察测验的效度和局限d解释分数应参考其他相关资料e对测验分数应以“一个区间分数”来对待,不应以“特定的数值”来解释f对来自不同测验的分数不能直接比较如何向被试和有关人员报告测验分数,报告分数的原则a使用当事人所理解的语言b要保证当事人知道这个测验测量或预测了什么c如果分数是以常模为参照的,就要使被试知道他和什么团体进行比较d要使当事人认识到分数只是一个估计e要使被试知道分数将被如何运用f要考虑测验分数将给被试带来什么心理影响g测验结果应向无关人员保密h对低分者的解释应谨慎小心I报告测验分数时应设法了解被试的心理感受并采取适当的措施加以引导第四章 项目分析与常模S1项目分析 名解项目分析:就是对测验中每个项目的质量,都进行质和量的分析评价,从而为筛选修改项目提供依据,确保和改进整个测验质量(主要包括难度和区分度)(S3项目分析,项目分析的内容包括 :质的分析和量的分析。一是要从内容上检查取样的适当性,文字表达是否清晰;二是要对预测的数据结果进行统计分析,确定难度、区分度及备选答案的适宜性) 1、项目难度 项目难度(识记)是用来表示测验项目难易程度的指标。用被试通过率P来表示,如果大部分被试能答对就认为该项目难度小,反之难度大难度的计算:二值计分制的难度(评分规则只有对或错,采用“全或无”办法计分,一般记为1分或0分的测验项目),a通过率: P=R/N,R:答对人数;N:总人数(P通过率越大,难度越小)b高-低分分组法(极端分组法):P=(PH+ P L)/2 *分数从高到低排列,分成高分组合低分组,各取27%,分别计算通过率。求两组通过率的算术平均数非二值计分制的难度(论述题和简答题都是非二值计分制)P=X/XMAX (X为平均分,XMAX为该题的满分)项目难度对测验的影响(领会)难度过大或过小都会造成测验分数偏离正态分布,因此测验难度适中一般来说是比较理想的情况同时测验难度也会影响测验的信度测验难度对测验的鉴别力也有一定影响项目难度的等距量表(等距量尺):按照项目难度的本来含义把它表达在被试能力水平量表上,即直接在横轴上来指定为Z值时,难度就会有相等单位了,就表达在等距量表上了等距量表上的项目难度被称为绝对难度。项目难度(绝对难度)转换:=13+4Z,(:项目难度或绝对难度;Z:由P值转换而来的标准分数)2、项目区分度名解区分度(识记)又称项目鉴别力指数,一般用D表示。是指项目得分对被试心理特质水平高低的区分鉴别性能,也即项目得分的高低与被试实际能力或特质水平高低的一致性程度。项目鉴别力指数的取值范围介于-1.00+1.00之间,D为正值称作积极区分,为负值称为消极区分(负鉴别力),D为0称无区分作用。D0(在积极区分区域)时,D值越大,项目鉴别力约好。项目区分度的计算:高-低分组法(二值积分法)D= PH - P L连续变量的分数从高到低排列,分成高分组合低分组,各取27%l 当D=1.00表示高分组被试全部通过,低分组被试全部失败;相反,如果低分组的被试全部通过,高分组的被试全部失败,则D=-1.00,如果两组通过率相等,D=0l 相关系数指标:项目与总分相关;计算 项目的区分度,一般是用项目得分与测验总分的积差相关系数来求取。多值计分法:D=(XH-XL)/W=XH/ XMAX -XL/ XMAXXH:高分组的平均分 XL:低分组的平均分 W:该题目的满分求项目与总分的相关系数法:皮尔逊积差相关系数法:看笔记,不考名解项目区分度与难度的关系:项目难度会影响项目区分度,对于一份测验来讲,题目的平均难度越接近0.50,不同得分被试间相互比较的次数就越多,测验的区分鉴别力就越高测验项目的筛选评价 根据难度来筛选项目:一般要求测验项目的难度可位于0.20.8或0.30.7之间;同时所有项目的平均难度则要求在0.5之间。 根据区分度来筛选项目:a区分度的提高会显著地提高测验的信度和效度 b根据下表,区分度在0.3以上就比较理想,但有些区分度在0.20.3之间的项目,如果能很好地体现测验目的,也应酌情予以保留S2 常模与发展常模1、常模及常模在测验分数解释中的作用当前常用的心理测验都是常模参照测验,常模是这类心理测验的解释分数含义的参照体系。按照参照的是以达到的发展水平还是某团体中的相对位置,常模可以划分发展常模和团体常模测验常模(识记)简称常模,理论上是指所有应测被试在测验所测特质上的实有水平的分布状况或分布形态;实际操作中是指代表性被试样组在测验上得分的分布状况或分布形态为了能参照着常模来对分数做出解释,原始分数就应该转换成导出分数。导出分数是从原始分数转换而来的,具有一定的参照点和单位的,测验量表上的数值。理解常模概念时需清楚 1.常模是测验分数的总体分布形态,一般用测验分数的平均数和标准差来表示,它能对个体的分数加以解释。 2.常模就是各种导出分数,由于这些导出分数具有相等的单位,所以它能比较各种不同的分数。 3.常模具有相对性,只能用来解释一个测验范围内的情况。 2、常模的求取过程:取样测试数据分析确定有关的测试团体,并从中抽取有代表性的被试样组对代表性被试样组进行合于标准化要求的测试,获得该被试团体成员在所测特质上足够而真实可靠的数据与测验分数把原始分数转化为某种形式的导出分数,制作常模表并给出使用说明3、发展常模的种类(识记):年龄常模、年级常模、顺序常模年龄常模(理解):比纳智力量表首先寻找和设计出可区分各年龄儿童智力的项目,然后将每个项目都放到合适的年龄水平中去。当每个年龄水平都有了适量的恰当项目后就可以得到一个可评价儿童智力发展水平的年龄常模量表。一个儿童在此量表上所得分数就是最能代表其智力水平的年龄。这种分数叫做智力年龄(或心理年龄),简称智龄年龄常模的三个基本要素:第一、一个能区分不能年龄组的项目;第二、一个由各个年龄的被试所组成的代表性常模样组;第三、一个表明答对多少项目或得多少分,及该归入那个年龄的常模表年级常模(理解):在学业成就测验中通常建立年级常模,如识字测验、阅读测验、算术测验的年级常模等。就是常说的学业成就发展水平常模。它是用某年级学生在某一测验上的平均分数和相应的年级当量之间的对应关系来进行描述的测验常模。年级当量通常用两位数表示,第一位为年,第二位为月。年纪常模使用中注意事项:首先,年级常模仅仅适用于各个年级都开设的科目;其次,年级当量解释比较困难;另外,年级常模不能被误认为成绩标准;顺序常模4、格赛尔的儿童动作发展顺序量表:格赛尔认为儿童行为模式出现是有一定程序的,出生后4周、16周、28周、40周、52周、18个月、24个月、36个月都是行为发展的关键年龄,这些年龄阶段出现的行为可作为测查项目和诊断标准。测查包括:动作能、应物能、应人能、言语能。他对儿童这8个年龄阶段的典型行为作了考察,按月份显示了儿童在动作、适应性、语言、社会性等4中主要行为领域中所达到的大致发展水平,从而建立了儿童早期行为发展的顺序模式,即格赛尔儿童动作发展顺序量表。格赛尔认为,儿童动作各发展阶段遵循一定的顺序前进,每一阶段掌握前一阶段的必要行为特征为前提。5、发展常模的评价:(优点)发展常模用来表示个体在正常发展途径上处于怎样的水平。它以年龄或年级作为单位,容易为人所接受理解;也可以与同等团体做直接比较,并且为个人内比较与纵向比较提供了基础。(缺点)同时也有一些不足之处,一方面由于它只适用于所测特质随年龄或年级而发生系统变化的状况,因此常只适用于年龄较小的儿童;另一方面由于人的行为发展受教育与经验的影响,发展常模只适用于典型环境下的儿童S3团体内常模及其应用1、名解团体内常模的含义:团体常模也称作组内常模,通常是根据标准化被试样组的测验分数、经过统计处理而建立起来的具有参照点和单位的测验量表2、团体内常模的种类:百分等级常模、标准分数常模、其他导出分数常模百分等级常模(识记)它从应测试的被试团体中,抽取一个有代表性的被试样组,并把这个被试样组所有个体在某一心理测验上的原始分数,按大小顺序分为100个等级,并建立起原始分数与百分等级的一一对应关系。A百分等级:一个原始分数的百分等级是指在常模样本中低于该分数人数的百分比。百分等级是应用最广的测验分数表示方法。 B百分等级是对原始分数的非线性转换;C百分量表是一个顺序量表,数据只具有区分性和顺序性。D百分等级是相对于特定的被试团体而言的,所以解释时不能离开特定的参照团体。名解标准分数常模(识记):就是用被试所得测验分数转换成标准分数来揭示其在常模团体中的相对地位的组内常模。Z分数常有带有小数和出现负值,这会给使用过程带来不便。所以我们通常对Z分数做线性转化,使负号和小数消失,全部变为正数。线性转换公式为:T=a+bz T分数:表示线性转化后的导出分数,a变换分数的平均分数,b表示变换分数的标注差,Z表示标准分数;其实就是Z分数的变式。T分数:平均数为50,标准差为10的分数。这一词最早由麦柯尔于1939年提出l 韦氏智力量表各分测验的量表分:T=10+3Zl 韦氏智力量表的智商离差智商:T=100+15Zl 美国大学入学考试报告分数:T=500+100Zl 我国四六级英语考试分数:T=500+70Z标准分数进一步线性变换为导出分数的优点:1具有等单位特性,便于进一步的统计分析2在正态分布下,可以利用正态分布表将各种导出分数与百分等级作换算3可以将几个测验上的分数做直接比较并累加求和和求总分、其他导出分数常模A标准九分=5+2ZB几种导出分数间的相互关系:1标准分数与百分等级之间的关系:标准分数Z值的大小表示被试的原始分数与他所属团体的平均分数的距离恰有Z个标准差那么远;2各常模导出分数的相互关系:在心理测量中,当被试群体足够大时,若所测的又是人的基本心理特质,那么,所得分数的分布形态,一般都能接近正态3、常模的应用单选科学的合成方法:先把各分测验的原始分转换成量表分,然后再求各量表分的累加和主要方法:1、利用常模资料:在求出分测验的量表分的基础上累加求和或剖析图法2、临床诊断方法:根据直觉或经验,主观地将各种因素加权而获得结论或评定的方法3、加权求和法:包括单位加权,等量加权和差异加权。剖析图:对于有多个分测验的标准化心理量表(或成套测验),把被试在全量表中各个分测验上的得分的总体形状表达出来,并具体说明被试各个分测验的实际表现以及彼此间相对地位的直观而形象的图形。绘制测验量表剖析图:绘出直角坐标。一般,横轴上可指定分测验,纵轴则可以进行量表取分; 分别对各分测验按量表分值在直角坐标系中描点; 将各量表的得分点连结,从而得到所有分测验分数的折线;全国常模与特殊常模多选根据样本的大小和来源,常模可分为全国常模、区域常模和特殊常模一个量表如果既有合格的地区性常模又有全国性常模,那么,使用被试适合的地区性常模来作解释,其信度和效度可能会更好些。对特殊被试的测验结果的解释,不能以普通的常模为依据特殊常模:根据特殊群体的较少而特定的范围对测验进行标准化,建立起的适合特定群体实际情况和测验目的的要求的常模。第五章 测验的信度和效度S1 测验的信度1、信度概述定义(识记)信度就是测验抗干扰能力或者说所得结果一致性的指标 (稳定性、可靠性、一致性)(每个被试在测验工具上所获分数都可以视为由两部分构成:一真分数;二测量误差:随机误差和系统误差)信度的作用:信度是衡量一个测验质量的重要指标之一。它的作用表现在:第一,反映测量过程中所存在的随机误差的大小,能有效地评价一份测验的可靠性程度;第二,用来解释个体测验分数的意义;第三,用来解释不同测验间的分数差异;2、信度的估计方法(实施两次测验:重测信度、复本信度;实施一次:同质性信度、评分者信度) 信度系数:用相关系数来表示信度的高低,这种相关系数称为信度系数;重测信度(稳定性系数),也叫重测法:用同一个测验对同一组被试施测两次时所得结果的一致性程度(两次测验得分用皮尔逊积差相关法计算相关系数)。使用重复信度的几个前提条件:所测的心理特质必须是稳定; 练习和遗忘效果基本上相互抵消复本信度(等值稳定性系数),也叫交替测验法:两个平等的测验测量同一批被试所得结果的一致性程度(两分测验得分用皮尔逊积差相关法计算相关系数)同质性信度:指测验内部所有项目间的一致性程度。项目间的一致性有两层意思:一是所有项目测的是同一种特质;二是指所有项目得分之间都具有较高的正相关;估计同质性信度的方法有:分半信度;库德理查逊信度;克隆巴赫的系数分半信度:一个测验分成平行对等两半后,被试在这两半上所得分数的一致性程度 库德理查逊信度:适合于全部是二值计分制项目的测验;克隆巴赫的系数:用于测样是论述题或既有选择题又有论述题等多种题型的情形评分者信度:指多个评分者给同一被试的作答反应进行评分的一致性程度3、信度系数的使用(不考)4、保证和提高测验信度的方法影响测验信度的主要因素:抽样误差; 随机误差提高测验信度的常用方法:选取恰当的被试样本;延长测验的长度,长度指测验的项目数量,新增项目必须与原有项目同质;控制测验的难度,提高测验的区分度(难度控制在中等水平且接近正态分布分布);提高测验内容的同质性; 测验实施时严格按要求施测,努力争取被试积极配合,测验评分严格按标准客观评定(保证测验标准,尽可能减少随机因素的影响); S2 测验效度1、效度的概述定义(识记)效度就是测验测到它打算要测的心理特性的程度(测验结果的有效性程度)效度与信度的关系 :高信度是高效度的必要条件,但不是充分条件;信度高的测验不一定效度高,但效度高的测验信度一定要高。经典测验理论2、效度的验证:就是从多个方面寻找证据来证明一个测验的有效性程度的过程,通常会从以下三种途径来验证分析:第一,(内容效度)从测验内容的角度来分析验证,并提供证据说明是否能达到测样的目的;第二,(构想效度)从测验是否符合心理学上某种心理理论的角度来分析验证,并提供证据说明是否能达到测样的目的;第三,(实证效度)从测验的实效的角度分析验证,并提供证据说明是否能达到测样的目的;内容描述的效度验证分析法:是系统检查一个测验实际测到的内容与所要测量的内容之间的吻合程度;所得结论通常称为内容效度考察测验的内容效度包括三个方面问题:a项目要测量的是否真属于应测量的领域;b测验所包含的项目是否覆盖了应考察领域的所有方面;c考察所测特质不同方面的测验项目,其比例是否恰当内容效度的测验方法:逻辑分析法、再测法、复本法、经验法结构鉴别的效度验证分析法:是分析和证实测验能够说明心理学上的理论结构或特质的程度,所得结论通常称为结构效度法。方法包括:逻辑分析法、发展水平的变化、与另一有较高结构效度的测验比较;与另一测查不同结构的测验相比较、实验操作法、因素分析法效标预测的效度验证分析法:是分析测验分数与作为效标的另一独立测量结果之间的一致性程度;所得结论通常称为效标关联效度(实证效度)。效标:测验外变量的取值就被称为效标,因为它是用来判断测验是否有效的标准。效标污染:主试知道被试原来的测验成绩,从而影响了效标测量中对被试的评定 根据效标资料收集的时间差异:效标关联效度又分为同时效度和预测效度 A同时效度:所要验证效度的测验,与另一效标测量的数据资料,是大约同时获得的B预测效度:测验结果是用来对未来的行为或效标测量做出预测的,测验分数本身跟效标测量资料是一先一后获得的。3、效度系数及应用(不考)4、提高测验效度的方法:影响测验效度的因素:测验信度;测验的构成 接受测验的被试;所选效标的性质提高测验效度的方法:所有提高信度的方法,均有助于提高效度; 精心编制测验,避免出现较大的系统误差创设规范化标准化的测试情景,妥善组织测验,保证每个被试都能发挥正常水平,控制随机误差选好正确恰当的效标,准确地进行效标测量,尽力避效标污染并正确地使用有关统计方法进行分析选取具有代表性和异质性的被试群体。S31、测验性能考察与选用决策。选择考察信度和效度资料,主要方面应该有:设计验证了哪些种类的信度和效度指标; 信度和效度的分析验证是在什么样的被试组上,如何具体地进行的; 信度和效度的时效性2、测验有偏性分析:有偏性是指测验对于参加测试的某些群体或个体来说有偏见或不公平,如果一个测验在两个不同的子群体上有不同的测验效度,即认为该测验存在有偏性第六章 智力测验S1 概述l 高尔顿是第一个对智力进行系统研究的人重视个体差异和提倡心理测量(心理测量运动的重要任务) 等级评定量表、问卷法及自由联想法的先驱l 1、智商及其定义智龄(心理年龄):指通过被试的测验作答表现确定下来,某一年龄儿童通常具有的智力水平。比率智商应用 :比率智商是指采用心理年龄与实足年龄的比值进行计算的智商.IQ=MA/CA*100。1916年斯坦福比纳量表提出比率智商离差智商是确定个体在相同条件的团体中的相对位置,它实质是将被试的智力测验成绩和同年龄组被试的平均成绩相比较而得出的相对分数。离差智商IQ=100+15Z 2、智商的分布(识记)和智力的等级划分:呈正态分布,大部分人的智商处于中间水平,只有极少数人的智商极端地高或低推孟智力分布表识记(9个等级,最后60以下,分为5070:低能;2550:无能;25以下:白痴):韦克斯勒智力等级分布表:S2 个别智力测验(常见的智力量表有:斯坦福比纳测验、韦克斯勒智力测验、考夫曼儿童成套智力测验、区分能力量表等)1、 斯坦福比纳智力量表斯坦福

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论