测量学复习文档格式.docx
- 文档编号:19002137
- 上传时间:2023-01-02
- 格式:DOCX
- 页数:54
- 大小:60.99KB
测量学复习文档格式.docx
《测量学复习文档格式.docx》由会员分享,可在线阅读,更多相关《测量学复习文档格式.docx(54页珍藏版)》请在冰豆网上搜索。
二、心理测量的性质
1、心理测量的间接性
2、心理测量的相对性
3、心理测量的客观性(测验的标准化)
第三单元心理测验的分类
一、按测验的功能分类:
1、智力测验:
测验人的一般智力水平。
2、特殊能力测验:
偏重测量个人的特殊潜在能力。
3、人格测验:
个性中除能力以外的部分,包括性格、气质、兴趣、态度、品德、情绪、动机、信念等方面的个性心理特征。
人格测验一般有两种方法,问卷法和投射法。
二、按测验材料的性质分类
1、文字测验——以言语文字呈现刺激。
优点是实施方便,团体测验多采用这种方式,肢体残疾而无言语障碍的人只能进行此种测验;
缺点是易受文化程度和教育背景的影响,从而使效性降低。
2、操作测验——也称非文字测验,优点是不需要使用言语文字,不受文化因素限制,测验题目多是对图形、实物、工具、模型的辨认和操作。
缺点是不易团体使用。
这两类测验经常结合使用。
三、按测验材料的严谨程度分类
1、客观测验:
测验中所呈现的刺激,只需被试直接理解,无须发挥想象力来猜测和遐想,故称客观测验。
绝大多数心理测验属此类。
2、投射测验:
测验中所呈现的刺激无明确意义、问题模糊,对被试的反应没有明确规定,被试在不受限制的情境下,凭借自己的想象力做出反应。
四、按测验的方式分类
1、个别测验:
测验过程中,以一对一的形式进行。
这是最常用的心理测验形式。
优缺点2、团体测验:
测验过程中,由一个或几个主试对较多的被试同时实施测验
团体测验材料,可以用于个别测验,如MMPI、EPQ、16PF等。
但个别测验材料一般情况下不能以团体方式进行。
五、按测验的要求分类
1、最高作为测验:
要求被试尽可能做出最好的回答,主要与认知过程有关,有正确答案。
2、典型行为测验:
要求被试按通常的习惯方式做出反应,没有正确答案。
总结:
最高行为测验------能力测验---有时间限制—答案有对错—题目有难度----对信度的要求高—对动机要求高--效度讲表面效度(
典型行为测验---人格测验---没有时间限制---答案无对错—题目有通俗性—对信度的要求没有能力测验那么严格--动机要求能维持测验就行了---表面效度要求低一些
第四单元纠正错误的测验观
一、错误的测验观
1、测验万能论:
对测验结果绝对化
2、测验无用论:
反对使用心理测验
第一、某些人格测验侵犯了个人隐私,违背民主原则。
第二、测验为宿命论和种族歧视提供了心理学依据。
3、智力测验等同于心理测验
二、正确的测验观
1、心理测验是重要的心理学研究方法之一,是决策的辅助工具。
2、心理测验作为研究方法和测量工具尚不完善
正确的态度:
既要承认心理测验的不完善,又要科学地自信地使用心理测验。
第五单元心理测验在心理咨询中的应用
目前心理门诊中常用的有三类测验:
智力测验;
人格测验;
心理评定量表
一、智力测验
1、何种情况下使用:
(1)求助者有特殊要求
(2)求助者有可疑智力障碍
2、常用智力量表:
(1)吴天敏修订的中国比内量表
(2)龚耀先等修订的韦氏三套智力量表
(3)林传鼎等修订的韦氏儿童智力量表
(4)张厚粲主持修订的瑞文标准型测验(SPM)
(5)李丹等修订的联合型瑞文测验(CRT)
二、人格测验
1、作用:
(1)有助于对求助者人格特征的了解
(2)加深对求助者心理问题的理解
(3)针对性地开展心理咨询与治疗工作
(4)了解求助者是否属于精神异常范围(MMPI)
2、常用的人格测验量表:
(1)艾森克人格问卷(EPQ)
(2)卡特尔16种人格因素问卷(16PF)
(3)明尼苏达多项人格调查表(MMPI)
三、心理评定量表
1、功用:
(1)检查求助者某方面心理障碍的存在与否或程度如何
(2)反映病情的演变
2、量表的内容范围:
(1)精神病评定量表
(2)躁狂状态评定量表
(3)抑郁量表
(4)焦虑量表
(5)恐怖量表等等
第六单元心理测量的发展史
一、科学心理测验的产生和发展
(一)心理测验的先驱者
1、英国的生物学家和心理学家高尔顿。
提出了相关的概念,为心理测验奠定了统计学基础。
2、美国心理学家卡特尔
,卡特尔发表了《心理测验与测量》一文,这是心理测验第一次出现于心理学文献中。
3、法国心理学家比内
1905年,与助手西蒙(T.Simon)编制了世界上第一个正式的心理测验——比内-西蒙量表。
也是世界上第一个正式的智力测验。
第二节测验的常模
第一单元常模团体
一、常模团体的性质
是由具有某种共同特征的人所组成的一个群体,或者是该群体的一个样本。
它用一个标准的、规范的分数表示出来,以提供比较的基础。
二、常模团体的条件
1、群体的构成必须明确界定
2、常模团体必须是所测群体的代表性样本
3、样本大小要适当
一般最低不小于30或100人。
全国性常模,一般应有2000~3000人。
4、标准化样组是一定时空的产物
三、取样的方法
1、简单随机抽样
2、系统抽样(等距抽样):
先计算组距
要求目标总体无等级结构存在,无内部循环规律存在
3、分组抽样
4、分层抽样
(1)分层比例抽样
(2)分层非比例抽样
四、常模与常模分数
1、常模:
它是解释心理测验分数的基础。
2、常模分类:
按样本的大小和来源分为:
全国常模:
样本代表的是总体是全体中国人
区域常模:
代表山东
特殊常模:
比如说职业常模(教师常模,警察常模,医务人员常模)
根据具体应用标准和分数特征:
百分位常模,标准常模
3、常模分数
是指施测常模样本被试后,将被试者的原始分数按一定规则转换出来的导出分数。
分数分为两类:
1----原始分/粗分数
2---常模分数/标准分数/转化分数/导出分数/量表分数
第二单元常模的类型
一、发展常模
人的许多心理特质,是随着时间以有规律的方式发展的,所以可将个人的成绩与各种发展水平的人的平均表现相比较,根据这种平均表现制成的量表就是发展常模,也称年龄量表。
(一)发展顺序量表
是最直观的发展常模。
它所要说明的是儿童在什么样的年龄应该具备什么样的能力或行为属于正常发育范围。
1、葛赛尔的发展程序表
2、皮亚杰的守恒概念
5岁质量守恒;
6岁重量守恒;
7岁容量守恒。
(二)智力年龄
首先使用智龄概念的是比内—西蒙量表
定义:
一个儿童在年龄量表上所得的分数,就是最能代表他的智力水平的年龄,这个分数就是智力年龄,简称智龄。
(三)年级当量/年级量表
单位通常为10个月间隔(以10个月为一个年级)。
二、百分位常模
百分位常模包括百分等级和百分点、四分位数、十分位数。
1、百分等级
应用最广的表示测验分数的方法。
一个测验分数的百分等级是指在常模样本中低于这个分数的人数百分比。
它表示个体在常模团体中所处的位置,百分等级越低,个体所处的位置就越低。
2、百分点(百分位数)
相对于某一百分等级的分数点就叫百分点。
根据原始分数和百分等级之间的一一对应的关系编制一个对照表,叫百分位常模。
这样就能根据百分等级确定百分位数,根据百分位数确定百分等级。
3、四分位数
4、十分位数
三、标准分常模
标准分常模是将原始分数与平均数的距离以标准差为单位表示出来的量表。
因为它的基本单位是标准差,所以叫标准分数。
常见的标准分数有:
T分数、标准九分数、标准十分、标准二十分、离差智商等
1、线性转换的标准分数
2、非线性转换的标准分数
当原始分数不是常态分布时,也可以使之常态化,这一转换过程就是非线性的。
四、智商及其意义
最早的比内-西蒙智力测验中没有智商的概念,只用“心理年龄”表示智力高低。
(一)比率智商
心理年龄除以实足年龄所得的商数。
比内-西蒙量表1916年经美国斯坦福大学心理学家推孟改进并在“斯坦福-比内量表”中第一次采用智力商数的说法。
其公式为:
MA(心理年龄)
IQ(智商)=--------------------×
100
CA(实足年龄)
等于100代表正常或平常的智力,高于100代表发展迅速,低于100代表发育迟缓。
缺点:
由于个体心理年龄与十足年龄并不同步增长,所以比率智商并不适合年龄较大的受测者
(二)离差智商
以年龄组为样本计算而得出的标准分数(即智商放在不同的年龄组里)
韦克斯勒将离差智商的平均数定为100,标准差定为15.
1960斯坦福-比内测验中,使用的是平均数100,标准差16的标准分数量表,用离差智商代替比率智商
从不同测验获得的离差智商只有当标准差相同或接近时才可以比较,标准差不同,其分数的意义便不同。
比标准分高一个标准差---84%
低---16%
第三单元常模分数的表示方法
一、转换表表示法
最简单且最基本的表示常模的方法就是转换表/常模表
二、剖面图表示法
是将测验分数的转换关系用图形表示出来,从剖面图上可以很直观地看出被试在各个分测验上的表现及其相对的位置。
第三节测验的信度
第一单元信度的概念
一、信度的定义
是指同一被试在不同时间内用同一测验重复测量,所得结果的一致程度。
简言之,信度就是对测量一致性程度的估计。
/一个测量对随机误差的控制程度/真分数T所占的比例
它强调的是测验的一致性和稳定性。
X=E+T
信度只受随机误差影响,随机误差越大,信度越低。
系统误差产生恒定效应,不影响信度。
信度是标准化心理测验的基本要求之一。
二、信度的指标
(一)信度指数:
真分数的标准差与实得分数的标准差的比值。
(二)信度系数:
信度指数的平方就是信度系数。
信度是以信度系数为指标,位于0.00--1.00之间
(三)测量标准误:
衡量随机误差的大小
标准误越大,随机误差越大,标准误越小,随机误差越小
标准误和信度关系:
信度越高,标准误越小;
反之,越大。
第二单元信度评估的方法
一、重测信度(又称稳定性系数)
1、定义:
使用同一测验,在同样条件下对同一组被试前后施测两次,求两次得分间的相关系数。
反应的是跨时间的稳定性
2、优缺点:
优点----提供测验是否随时间而变异的资料,作为被试将来行为表现的依据。
缺点----易受练习和记忆的影响。
3、时距:
一般两周到四周,间隔时间最好不超过六个月。
二、复本信度(又称等值性系数)
以两个等值但题目不同的测验来测量同一群体,然后求得被试在两个测验上得分的相关系数。
几乎同一时间施测/间隔最短时间。
两复本同一时间施测,得出不同复本的关系;
相隔一段时间施测,称为重测复本信度或稳定与等值系数。
这是更为严格的信度考察方法,应用较广泛。
优点----能适度避免重测信度的一些缺陷。
局限性----
(1)对易受练习影响的行为,复本信度不能完全消除
(2)测验过程易产生迁移(3)许多测验建立复本信度较困难
三、内部一致性信度
重测信度和复本信度主要考察测验跨时间的一致性(稳定性)和跨形式的一致性(等值性),而内部一致性信度系数主要反映的是题目之间的关系,表示测验能够测量相同内容或特质的程度。
1、分半信度
(1)定义:
采用分半法估计所得的信度系数。
(2)实施过程:
将测验按奇、偶数分为等值的两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。
所代表的是两半测验内容取样的一致程度。
测验越长,信度越高
2、同质性信度
同质性主要代表测验内部所有题目间的一致性。
当各个测题的得分有较高的正相关时,则测验为同质的;
相反,则为异质的。
四、评分者信度
由两位(或两位以上)评分者按评分标准分别给分,再根据每份测验的两个分数计算相关,就得评分者信度。
相关达0.90以上,则评分是客观的。
2、用途:
用于测量不同评分者之间所产生的误差。
第三单元信度与测验分数的解释
一、解释真实分数与实得分数的相关
rxx=0.9,我们可以说实得分数中有90%的变异是真分数造成的,仅10%是来自测验的误差。
信度系数的分布是从0.00到1.00的正数范围,代表了从缺乏信度到完全可信的所有情况。
同时它也告诉了我们测量的误差比例是多少。
二、确定信度可以接受的水平
1、能力测验和成就测验的信度在0.90以上
2、人格测验、兴趣、态度、价值观等测验的信度在0.8-0.85或更高
3、一般原则:
(1)当rxx﹤0.70时,测验因不可靠二不能用
(2)当0.70≤rxx﹤0.85时,可用于团体比较
(3)当rxx≥0.85时,才能用来鉴别或预测个人成绩或作为。
(4)新编的测验信度应高于原有的同类测验或相似测验。
三、解释个人分数的意义
1、从信度解释个人分数意义的作用
(1)估计真实分数的范围
(2)了解实得分数再测时可能的变化情形
2、确定不同概率水平上真分数的置信区间
X(t)=X±
1.96SE
解释:
大约有95%的可能性真实分数落在所得分数±
1.96SE的范围内
四、比较不同测验分数的差异
书上例题
第四单元影响信度的因素
一、样本特征
信度受样本是否异质及样本团体平均能力水平的影响。
1、样本团体异质性的影响
一般而言,若获得信度的取样团体较为异质的活,高估信度。
同质的话低估信度
2、样本团体平均能力水平的影响
对于不同水平的团体,题目具有不同的难度,每个题目在难度上的微小差异累计起来便会影响信度
二、测验长度
在一个测验中,增加同质的题目,可使信度提高。
1、测验越长,测验的测题取样或内容取样就越有代表性。
2、测验越长,被试的猜测因素影响就越小。
报酬递减率原则,测验过长引起受测者的疲劳和反感而降低可靠性
三、测验难度
1、影响范围:
智力测验、成就测验、能力倾向测验等。
2、影响程度:
测验太难或太易,将使分数集中在低分段或高分段,从而使信度降低。
难度值为0.5时,信度最高。
3、选择题的理想难度:
五选一为0.7;
四选一为0.74;
三选一为0.77;
是非题为0.85。
四、时间间隔
用再测法或复本法求信度,两次测验相隔时间越短,信度系数越大;
相隔时间越久,信度系数越低。
第四节测验的效度
第一单元效度的概念
一、效度的定义
所测量(X)的与所要测量(V)的心理特点之间的符合程度,或者简单地说是指一个心理测验的准确性。
/对随机误差和系统误差的控制程度/真分数T所占的比例。
效度是科学测量工具最重要的条件。
选用测量工具,必须首先鉴定其效度。
注意事项:
效度既受随机误差影响,又受系统误差影响;
可信的测验未必有效,但
有效的测验必定可信,信度是效度的必要条件。
二、效度的性质
1、相对性
任何一种测验只有用于与测验目标一致的目的和场合才会有效。
没有一种对所有目的都有效的测验。
评鉴测验的效度时,必须考虑其目的与功能。
2、连续性
效度通常用相关系数表示,它只有程度的不同,没有“有效”或“无效”之说,应该用效度较高或较低来评价。
三、信度与效度的关系
1、信度高是效度高的必要而非充分条件
信度高不一定效度高。
但一个测验要想效度高,真分数的变异数必须占较大的比重,即测验的信度必须高。
2、效度是受信度制约的
一个测验的效度不会超过他的信度的平方根/信度系数的平方根是效度系数的最高限度。
第二单元效度评估的方法
一、内容效度
(一)定义:
指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。
因主要与测验内容有关,所以称内容效度。
测验题目是行为范围的好样本,推论将有效;
反之,将无效。
如何编制有较高内容效度的心理测验
(1)对所测量的心理特性有明确的概念,并划定出哪些行为与这种心理特性有密切的关系。
(2)测验题目应是所界定的内容范围的代表性取样。
(3)测验题目是否要有同质性,依实际需要而定。
只有当测验用来测量某一心理特质时,高度的同质性才是需要的。
(二)内容效度的评估方法
1、专家判断法(最常用)
请有关专家对测验题目与原定内容的符合性做出判断,看测验的题目是否代表规定的内容。
若专家认可,则测验具有内容效度。
专家判断法是一个逻辑分析的过程,所以内容效度有时又称“逻辑效度”。
2、统计分析法
计算两个评分者之间评定的一致性---评分者信度
两个测验复本上得分之相关来作评估—复本信度
再测法也可用于内容效度评估----重测信度
3、经验推测法
通过实践来检验效度。
(三)内容效度的特性
1、非普遍适用性
2、时间上的特定性
3、与表面效度的区别
内容效度的判断者是专家,表面效度的判断者是外行;
内容效度考虑的是题目与测量目的和测量总体之间微妙的逻辑关系,表面效度只考虑题目与测量目的之间明显的、直接的关系;
最高行为测验要求有较高的表面效度,典型行为测验要求有较低的表面效度。
二、构想效度(结构效度)
是指测验能够测量到理论上的构想或特质的程度,即测验的结果是否能证实或解释某一理论的假设、术语或构想,解释的程度如何。
如何建立理想的构想效度
(1)从某一构想的理论出发,提出关于某一心理特质的假设,然后设计和编制测验并进行实测,最后对测验的结果采用相关或因素分析等方法进行分析,验证与理论假设的符合程度。
(2)用实证的方法搜集资料,对假设逐一加以验证。
(二)构想效度的估计方法
1、对测验本身的分析。
①测验的内容效度可以作为构想效度的证据。
②测验的内部一致性指标可以推断测验是测量单一特质还是测量多种特质,从而为评估测验构想效度提供证据。
③有时分析被试对题目的反应特点可以作为构想效度的证据。
2、测验间的相互比较
①相容效度:
测量相同结构的各测验之间应该有较高的相关。
②区分效度:
不同特质测量分数应当低相关。
③因素分析法:
实际上就是因素与变量的关系。
3、效标效度的研究证明
4、实验法和观察法证实
三、效标效度
(一)什么是效标效度
1、效标——被预测的行为是检验效度的标准
2、效标效度——反映的是测验预测个体在某种情境下行为表现的有效性程度。
3、效标效度分类:
同时效度——测验所得的分数可与效标同时验证。
通常与心理特征的评估与诊断有关。
用来诊断现状。
预测效度——效标资料需要一段时间才可搜集到。
通常用于选拔、分组。
用来预测结果。
理想的效标应具备的条件:
①能最有效地反映测验目标,即效标测量本身必须有效。
②具有较高的信度,稳定可靠,不随时间等因素而变化。
③可以客观地加以测量,可用数据或等级来表示。
④测量方法简单,省时省力,经济实用。
(二)效标效度的评估方法
1、相关法——评估效标效度最常用的方法
①积差相关
②点二列相关
③二列相关
④多系列相关
2、区分法
该方法的思路。
(P389页图解)
3、命中率法
当用测验做取舍时,正命中率和总命中率是测验有效性的较好指标。
正确的预测为命中,不正确的预测为失误。
总命中率和正命中率的计算方法。
正命中率高低长随划分测验分数成功与失败的临界分数的高低而变化。
临界分数越高,正命中率越高,临界分数越低,正命中率越低
第三单元效度的功能
一、预测误差
根据测验分数对效标得分进行预测总会存在一定的误差,不可能预测得完全准确。
这个误差分布的标准差就称为预测误差。
效度系数越大,预测误差越小。
估计的标准误,是指所有具有某一测验分数的被试其效度分数分布的标准差,即预测误差大小的估计值,是对真正分数估计的误差大小。
二、预测效标分数:
回归方程及各个字母分别代表什么
三、预测效率指数
由于该测验的使用,实得我们在估计受测者的校标分数时减少了40%的误差
第四单元影响效度的因素
一、测验本身的因素
二、测验实施中的干扰因素
1、主试的影响因素
2、被试的影响因素
三、样本团体的性质
(一)样本团体的异质性
1、只以选拔上的被试为样本团体参加效度研究,降低了测验的效度。
2、选拔标准太高,样本团体的同质性增加,降低了测验的效度。
(二)干涉变量
四、效标的性质
第五节项目分析
内容效度
定性分析题目编写的恰当性
项目分析题目编写的有效性
定量分析——题目难度和区分度
项目分析的作用和意义:
选择和修改测验题目,提高测验的信度和效度。
第一单元项目的难度
一、定义:
难度是表示项目的难易程度。
这一概念在能力测验里称为项目的难度水平,而在非能力测验里,称为“通俗性”或“流行性”。
难度的指标通常以通过率(P)表示,即以答对或通过该题的人数百分比来表示。
通过人数越多,难度越低;
通过人数越少,难度越高。
二、计算方法
(一)二分法记分的项目
1、通常情况下用公式5-14
例题:
设有80名学生参加某个测验,答对其中某题目的有32人,则该题的通过率是:
P=32/80*100%=40%
2、人数较多时分为三组,用公式5-15
3、平衡机遇对难度的影响,用难度校正公式
(二)非二分记分的项目
举例:
设某问答
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 测量学 复习