完整版心理测量考试复习.docx
- 文档编号:1118829
- 上传时间:2022-10-17
- 格式:DOCX
- 页数:18
- 大小:64.18KB
完整版心理测量考试复习.docx
《完整版心理测量考试复习.docx》由会员分享,可在线阅读,更多相关《完整版心理测量考试复习.docx(18页珍藏版)》请在冰豆网上搜索。
完整版心理测量考试复习
一、最早的智力测验——比奈—西蒙量表P11
1.比奈(AlfredBinet)
法国心理学家,心理测验的鼻祖。
贡献:
(1)提出了测量智力的方法,并建立了最早的相对客观、量化的度量工具。
(2)将智力测验成功地运用于教育领域,使人们看到了心理测验的应用价值,推动了心理测验的迅速发展。
智龄是比奈—西蒙智力量表中使用的判断智力的术语。
比奈智力量表系列主要有比奈量表、斯坦福—比奈量表和中国比奈量表。
(一)比奈量表
比奈量表是比奈和西蒙编制的,有1905年、1908年和1911年三种版本。
内容:
1905年版共有30道题,题目顺序由易到难排列,通过对3岁至11岁各50名正常儿童和部分智力落后儿童以及成人测试的结果,分析确定题目的难易程度,并用不同难度的题目代表不同年龄的智力水平。
特点:
①个体测验;②用智力年龄来评判结果。
不足:
(1)从内容上看,该量表主要是对判断、理解和推理能力的测查,并不能涵盖智力的全部内容。
(2)从形式上看,这个量表无论是测验主持人的指导,还是被测者的回答或反应,主要都是以语言形式进行的,因而对语言能力的依赖程度较大,这对某些特殊儿童如聋哑儿童是不公平的。
(3)这个量表不能准确地表示测验总分,只能以被测者完成题目的多少来大致确定其智力水平。
行为样本(behavioralsample)就是“少数有代表性的行为”P31
标准化(standardization)P32是指测验编制、实施、记分和测验分数解释必须遵循严格的统一的科学程序,保证对所有被测者来说施测的内容、条件、记分过程、解释系统都相同。
①测验题目的标准化;②实施过程和记分的标准化;③选用有代表性的常模。
信度(reliability),主要是指测量结果的可靠性或一致性。
P32信度(reliability)是指测验结果的可靠性、稳定性,即测验结果是否反映了被测者的稳定的、一贯性的真实特征。
简言之,信度就是对测量一致性程度的估计。
#误差的含义和类型P140
1.含义:
误差——测量中与目的无关的变因所产生的不准确、不一致的效应。
2.类型
(1)抽样误差——由样本变动而产生的误差。
信度或效度估计中,抽样误差可以忽略不计。
(2)系统误差——与测验无关的因子所引起的恒定、系统的、有规律的变化,存在于每次测验中,又称常定误差。
系统误差影响效度,但与信度无关。
(3)测量误差(或观察误差、随机误差、偶然误差)——使用测量工具进行心理测量所造成的误差。
测量误差是不系统的、随机的,偶然因素引起的。
信度完全受测量误差的影响,也会影响效度。
#影响信度系数的因素P156
一、分数分布范围的影响
(一)团体的异质性
如同所有相关系数—样,信度系数受分数的分布范围所影响,而分数范围与被试团体的异质程度有关。
一个团体越是异质,其分数范围越大;而一个经过筛选,相对同质的团体分数较为均匀。
提高信度系数,需要测验团体的异质性高。
团体异质性不同,分数的标准差亦不同。
当将测验用于标准差不同的团体时,可用克莱公式推算出新的信度系数。
(二)团体的平均水平
对于不同水平的团体,题目具有不同的难度。
每个题目在难度上的微小差异累积起来便会影响信度。
这种影响都不能由统计公式来推估,只能从经验中发现它们。
比如:
斯坦福一比奈测验的信度系数从0.83到0.98不等。
年龄较大的比年龄较小的信度高,智商较低的比智商较高的信度高。
二、测验长度的影响
一般说来,在—个测验中增加同质性的题目,可以使信度提高。
假设有一个包括10个题目的测验,信度为0.50,若把测验增加到50个题目,其信度将增加到:
当由于测题过少而导致信度较低时,增加多少个题目可以达到理论的信度指标,可以用下式来推算:
三、测验难度的影响
当测验过难且题目形式为选择题时,受试者会对许多题目作随机反应——瞎猜,这样我们就无法对其分数置信。
若大部分人随机作答,分数的差别将主要取决于随机误差,因而信度将趋近于零。
因此,如果题目确实允许猜测,应使整个测验稍容易一点,以减少猜测机会,增加可靠性。
洛德(Lord)提出在学绩测验中,为了保证其可靠性,各类选择题的理想平均难度为:
五选题0.70
四选题0.74
三选题0.77
是非题0.85
四、间隔时间
以再测法或复本法求信度,两次测验相隔时间越短,其信度系数越大;间隔时间越久,其它变因介入的可能性越大,受外界的影响也越多,信度系数就越低。
效度(validity),与测量目标有关的真实分数方差(即由测量目标变量所产生的方差)与总分方差的比率。
P33效度是一个测验对其所要测量的特性测量到什么程度的估计。
通俗的说,也就是测验是否精确的测量了想要测的东西。
社会赞许性做答,有的受测者可能会掩饰自己真实情况,按照社会认可的方式去做出自我评价,使自己看起来更“好”。
效度指标主要包括:
①效标关联效度
②内容效度
③构想效度
rXY=Sv2/SX2,Sv其中是有效方差,SX是总方差。
P170
而SX2=ST2+SE2=SV2+SI2+SE2
可见,造成测验分数变化的原因出自三大来源:
测量对象本身的变化,量具的精度造成的系统误差,量具使用中造成的随机误差。
二、效度评定的方法
(一)内容效度
1.定义:
检查测验内容是否是所要测量的行为领域的代表性取样的指标。
内容效度分析时要注意两方面的问题:
1)应避免将测验取样的行为领域过于泛化。
2)要注意测验分数中无关因素的影响。
2.内容效度的评估方法
(1)没有可用的数量化指标,只能靠推理和判断评估。
(2)依赖条件:
●测验内容范围明确;
●测验内容的取样有代表性。
(3)确定方法:
通常是由专家根据测验题目和假设的内容范围作系统的比较判断。
也可间接借用其他统计指标说明,如评分者信度,复本信度等。
克朗巴赫法:
由两个独立取自同样内容范围的测验的得分之相关来作数量的估计。
3.确定内容效度的步骤
1)确定总体范围,即描述有关的知识与技能及所用材料的来源;
2)编制双向细目表,确定内容和技能各自所占的比例,并由测验编制者确定各题所测的是何种内容与技能;
3)制定评定量表来测量测验的整个效度及其他特点。
4.内容效度的应用
(1)最适合于评估教育和职业成就测验。
内容效度的评价可以回答以下两个问题:
①样本的代表性;
②无关因素的影响程度。
(2)评价某些用于选拔和分类的人事测验。
(3)不适用于能力倾向测验和人格测验。
5.表面效度(facevalidity)
表面效度是指测验在采用者或被试的主观
认识上觉得有效的程度。
有时为了取得被试的合作和信任,表面效度是不容忽视的。
适用领域:
职业兴趣测验、成就测验等
不适合领域:
人格测验
(二)效标关联效度(效标效度)
1.定义:
反映测验分数与外在标准(效标)的相关程度,即测验分数对个体的效标行为表现进行预测的有效性程度。
效标关联效度往往用于预测性测验。
这种测验中,根据测验分数作出的预测一般用于甄选决策。
2.效标关联效度的类型
(1)预测效度
①定义:
反映由测验分数对任一段时间间隔后被试行为表现的预测程度。
②适用范围:
对人员进行选拔、分类和安置的人事测验。
(2)同时效度
①含义:
效标材料和测验分数同时搜集。
②应用范围:
因为同时效度的评估不需要长期追踪,所以应用比较普遍。
(3)同时效度和预测效度的差异——测验目的不同。
前者多用于诊断现在的状态,后者多预测未来的结果。
3.效标和效标测量
(1)效标:
衡量测验有效性的参照标准。
(2)效标测量:
可操作的测量指标。
(3)效标分类:
观念效标:
效标的实质概念内容。
效标测量:
即效标的具体度量方法。
(3)保证效标测量客观性的要点:
①避免偏见的影响(特别是等级评定)。
②防止效标污染。
效标污染——由于评定者知道测验分数而影响个人的效标成绩的情形。
(三)构想效度
1.定义:
测验的构想效度是指测验能够测量到理论上的构想或特质的程度。
也称为结构效度。
所谓构想通常指一些抽象的、假设性的概念或特质,如智力、创造力、言语流畅性、焦虑等。
这些构想往往无法直接观察,但是每个构想都有其心理上的理论基础和客观现实性,都可以通过各种可观察的材料加以确定。
构想效度关注的问题是:
测验是否能正确反映理论构想的特性。
2.确定构想效度的步骤
(1)建立理论框架,以解释被试在测验上的表现;
(2)依据理论框架,推演出各种有关测验成绩的假设;
(3)以逻辑和实证的方法来验证假设,根据这些累积材料决定这种理论是否能恰当地解释现有材料,如果不能作出恰当解释,则应该修正上述假设,直到能作出恰当的解释为止。
3.收集有关结构效度资料的方法P177
(1)测验内方法
这类方法主要是通过研究测验内部构造(如测验的内容、对测题反应的过程,以及项目间或分测验间的关系)来界定所测量的结构范围。
举例:
☐独生子女“合群性”的结构描述:
☐1.见老师、小朋友主动匆“招呼与否;
☐2.是愿意自己独自玩,还是与其他孩子一起玩?
☐3.言语较多还是较少,见生人时害羞?
大方否?
☐4.在做游戏时,与人交往时,能与人合得来吗?
(2)测验间的方法
测验间的方法是同时考虑几个测验间的相互关联,从而获知这些测验所共有的特点是什么或这些测验是否测量相同的结构。
测验间方法有多种:
因素分析;相容效度;会聚效度和区分效度。
①相容效度
相容效度是求一个新编好的测验(即一个需要确定其结构的测验)与另一个已知其结构的测验分数之间的相关。
例如,新的智力溯验的分数通常与已作过效度确定的个别测验如斯坦福一比纳智力测验来比较,假如相关高,则两测验所测且的是相同的结构,而且新测验的得分也可像已确定结构的测验的分数一样解释。
②会聚效度和区分效度
坎贝尔(D.T.Campbell)和费斯克(D.W.Fiske)1959年提出的构想效度的一种考验方法。
会聚效度:
一个测验与测量相同特质或构想等理论上有关的变量有高的相关。
区分效度:
一个测验与测量不同特质或构想等理论上不同的变量有低的相关。
P184重叠量的计算
四、影响效度的因素P185
(一)测验的因素
1.测题中所用词汇和句型不能过于困难。
2.试题的意思应该清楚。
3.所编制的测题应该适合所要测量的学习结果。
4.测题中不能提供额外线索。
5.测题的编制要合理。
6.选择题的正确答案不能有明显的组型。
7.测题数目——增加测题的数目
8.测题的难度要适当。
(1)常模参照测验——测题平均难度应在0.5左右,并有适当的难度分布。
(2)标准参照测验——测题难度应该与教学目标的要求相一致,不需要区分学生的优劣,
(二)测验实施和计分方面
1.测验情境,如场地的布置、材料的准备等。
2.是否遵照测验使用手册的各项规定进行标淮化的施测。
3.指导语是否已将答题方式说明清楚;
4.是否按要求进行时间限制。
(三)被试的主观方面
被试的兴趣、动机、情绪、态度和身体健康状况以及是否充分合作与尽力而为等,都会影响
到测验结果的可靠性和正确性,即效度和信度。
(四)进行效度化所依据的有关准则
效度系数值受到三方面影响:
测验信度、准则变量测量的信度、预测变量与准则变量间真正的相关程度
(五)样组方面
1.样本的代表性
2.样本规模:
3.样本的异质性
总的来说,提高效度必须对测验编制和实施标准化。
五、效度与人才选拔P190
1.基本概念
(1)基础率:
在总体中自然存在的合格人员比例。
(2)录取率:
采用测验作为筛选工具时所录取的人员比例。
录取率=录取人数/总人数
(3)取舍正确性
命
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 完整版 心理 测量 考试 复习