语文评价第三讲crosoft Word 文档.docx
- 文档编号:25601955
- 上传时间:2023-06-10
- 格式:DOCX
- 页数:36
- 大小:44.39KB
语文评价第三讲crosoft Word 文档.docx
《语文评价第三讲crosoft Word 文档.docx》由会员分享,可在线阅读,更多相关《语文评价第三讲crosoft Word 文档.docx(36页珍藏版)》请在冰豆网上搜索。
语文评价第三讲crosoftWord文档
第三讲语文测试
教学目的:
教学重点:
教学时间:
4学时
语文测试的性质与类型
一、语文测试的性质(略,详见朱本)
二、语文测试的类型
语文测试的分类是一个相对的概念,按照不同的标准可以分为不同的种类。
(一)按测验的标准划分——标准化测验与教师自编测验
标准化测验是由专家或专业的测验发行机构编制的,测验的设计、编制、实施、评分及分数解释等一系列过程都依据统一的标准而进行。
标准化测验的试题取材广泛,题量多,涉及面广,具有较高的信度和效度。
它的难度适中,区分度高,施测、评分等都按一定的标准进行,因而具有客观性、真实性等优点,是学生学业成就评价的主要方式之一。
然而,标准化测验不易编制,有关的要求也比较高。
教师自编测验是教师依据实际的教学需要,为对学生的学习结果进行考查而自行设计与编制的测验。
它的编制较简单、灵活,使用范围广,可以针对不同情况的学生使用,贴近教学实际,有利于教师正确评价学生的学习成就。
当然,教师自编测验也要遵循一定的规则,才能达到真实评价学生的目的。
教师自编测验的信度和效度要求不如标准化测验那么严格。
表2-1教师自编测验与标准化测验的比较(王汉澜:
《教育测量学》,195页,开封,河南大学出版社,1987。
)
项目
教师自编测验
标准化测验
测验内容
根据各地实际使用的教材编写
根据统编教材编写,不反映地方教材特点
试题质量
未经预测和筛选,质量一般比较低
经过预测、题目分析和筛选等步骤,质量较高
测验信度
信度未知,一般在测验后用分半法求得
在0.89以上
施测与评分
可以统一要求,但不完全标准化
按指导语施测,用机器或记分器评分
分数的解释
按照某种标准或用被试在团体内的相对位置解释测验分数
与常模相比较,解释考生的测验分数
(二)按测验题目的特性划分——客观式测验与主观式测验
测验的试题可以客观地记分,不受主观因素的影响,而且答案唯一,这样的测验叫客观式测验。
客观式测验的试题形式多样,主要包括再认式的选择题、是非题、匹配题和再现式的填空题、简答题等。
客观式测验的优点是测试试题容易标准化,试题内容取材广泛,评分也客观公正,而且省时。
不足之处是只能评价学生一般的学业成就,而对较复杂的学业成就如学生语言文字材料的组织、表达能力,问题解决中的创造性等能力则难以胜任,而且也易受学生猜测因素的影响。
主观式测验是指传统的问答式测验,学生根据测验提出的问题自由作答。
它包括论述题、说明题、作文题等形式。
其中,论文式测验的优点是试题编制容易,学生可以充分表达自己对问题的理解和看法,可以有效地评价学生分析问题、理解问题、材料组织和应用等能力,而且学生回答的猜测因素较小。
其缺点是取材范围有限,代表性不强,评分易受主观因素的影响,客观性不足,而且也很费时。
尽管论文式测验有以上缺陷,但同时又有着客观式测验所不具备的优点,因此,在实际评价过程中不能简单排斥或取消这类测验题型,而应在不断改进试题及提高命题质量的基础上,将二者很好地结合起来,取长补短,配合使用。
(三)按测验的用途划分——形成性测验与终结性测验
形成性测验主要是指在教育教学过程中,教学者为了改进教学方法、提高教学质量而对学生进行的学习阶段及结果的评价。
它有单元测验、平时的随堂考试等形式。
形成性测验注重对学生学习过程中学习内容的评价,通过评价结果来调整教学内容或改进教学方法,使教学在不断的评价、反馈、改进中不断地完善;同时也有利于学生了解自己在学习过程中对知识的掌握程度以及自己的进步状况,便于学生自我评价、自我促进、自我提高。
形成性测验具有诊断和预测的功能。
形成性测验的测试过程比较频繁,可以是一周一次或是一单元一次等,但其测试的概括水平不高。
终结性测验是指在课程或一个教学周期结束时对学生学习结果的评价。
它主要评定学生的学业成绩,判定学生的学习是否达到教育教学目标的要求,同时也对学生的知识、技能及能力水平进行综合的评估。
终结性测验侧重于评价学生在较大范围内对知识的掌握程度,大多数是在形成性评价的基础上进行的。
它的取材内容广泛且具有一定的典型性和代表性,评价的频率不高,一般一学期或一学年两三次,如常见的期中考试、期末考试等。
但是它的周期太长,只是对学生学习效果的“回顾式”评价,不能适时地解决学生在学习中所出现的问题。
(四)按测验的特征划分——学科测验与综合测验
学科测验是测量学生在一定阶段时间内通过学习各门具体学科所获得的知识和技能的一种重要评价工具。
学科测验的种类很多,按科目来分,可以分为语文测验、数学测验、物理测验、化学测验等。
这类测验的试题具有基础性和全面性的特点,它们在概念与标准化上与其他任何学科的测验无关。
综合测验是包括不同学科内容范围、相互配合进行的成套测验。
此类测验用来测量各个教学阶段中学生在若干学科上所获得的知识与技能。
其优点在于编题计划的综合性,即把主要的知识、技能或各课程的主要内容设计到试题计划的各个组成部分中。
评价的结果既可以进行综合性比较,也可以为分科性比较提供依据。
(五)按测验的形式划分——操作测验与书写测验(纸笔测验)
操作测验主要考查学生实际的动手操作能力及知识的应用和迁移能力。
尤其在理、化、生学科方面比较突出。
操作测验的准备和实施很费时,而且评分也困难,测试的条件不易控制。
书写测验也叫纸笔测验,指以书面形式的测验工具评价学生学业成就或认知能力发展状况的一种评价方式,可分为再认式测验(如是非题、选择题、匹配题等)和回忆式测验(如填空题和简答题等)。
纸笔测验是教育者了解学生分析和有效解决各类问题、语言材料的组织和表达能力的有效手段。
在传统的评价中一般以纸笔测验为主。
三、语文测试的必备条件
作为测验工具的测验或量表是有好坏之分的。
判断一个测验是否有效,主要依赖客观的标准来衡量,而不能只凭主观经验来判断。
无论是心理测验还是教育测验,不管是标准化的测验还是教师自编的测验,都要考虑其效度、信度、难度、区分度等反映该测验质量特性的重要指标;否则,这一测验的代表性和可行性就会让人质疑,影响测验的效果。
(一)效度
效度是指一个测验所能测量的准确程度,即测量结果能否准确表达所测量的特征和功能。
一个测验的有效与否,关键在于它是否准确测量了其所能测量的内容。
效度是学业成就评价最重要的必备条件。
值得注意的是,测验的效度是相对的。
任何测验只是针对一定的目的而言才是有效的,而不存在对所有目的都有效的测验。
因此,在测验中,测验的试题必须依据一定的教学目标而定,而且取材应具有典型性和代表性,能对学生的评价起到诊断和预测的作用。
(二)信度
信度是指一个测验的一致性程度,即测验的可靠性程度。
它是表明评价工具质量的另一个重要指标。
信度和效度是相互关联的。
一个测验对于某个目的具有一定的信度,但它不一定是有效的;而一个测验对于某个目的是有效的,那么它一定是可信的。
在学业成就的评价中,必须保持测验的准确性和可靠性。
因此,在测验实施的整个过程中,必须要使试题的编制和评分具有良好的可靠性。
编制的试题必须符合学生现有的心理特点,而且试题的内容应在大纲要求的范围内取材。
同时,对试题进行评分时,评分者应客观公正,持相同的评价尺度,尽可能地增强评价的信度。
(三)难度
难度是指试题的难易程度。
测验中,试题应具有一定的难度。
只有这样,才能达到评价学生的目的。
但是,难度也不应过大,一般难度值在05左右为宜。
难度值通常用答对或通过测验的人数比例来衡量。
(四)区分度
区分度也叫鉴别力,它主要指测验将不同水平的被试区别开来的能力,反映了测验与被试实际水平的符合程度如何,而且它与难度紧密相关。
测验的难度过大或过小,都不利于正确地评价学生,而且这时测验的鉴别力也毫无意义。
语文测试的题型及语文试卷编制
一、什么是是非题
(一)是非题的含义及使用
是非题也叫二项选择题、正误判断题。
它基本上是只有两个选项的选择题,当选项只有两种可能性时,出是非题比选择题更适合。
是非题一般是由陈述句组成的,其基本形式是提供一个叙述,让学生判断叙述正确与否。
常见的是非题的变形有丛集题型(clustervariety)和改正题型(correctionvariety)。
丛集题型也称多重是非题(multipletrue-falseitems),它提供一个题干,根据题干,设计若干对或错的答案叙述供学生判断。
改正题型要求学生对叙述所强调部分(通常是字或词)的对错作判断,并将错误的部分加以改正。
(二)是非题的优点及不足
是非题可以说是一种简化了的选择题,它在编制与使用中具有这样一些优点:
(1)与选择题相比,是非题的编制较容易,评分也客观、公正;
(2)是非题的作答迅速,能在较短时间内考核较多的教学内容,效率较高;(3)可以和解释性试题连用,来测量学生更高水平的认知能力和复杂的学业成就;(4)是非题的命题内容很广。
但是,是非题也有其不足之处。
(1)猜测因素很强。
由于是非题只有两个选项,即使学生对命题的内容一无所知,也有50%的机会猜对答案,不能真正反映出学生对知识的理解和掌握程度,而且很容易使学生在学习中产生侥幸心理,从而导致教师对学生实际知识的评价失真,使得评价的鉴别力低,信度也不高。
(2)虽然是非题的命题内容广泛,但很难编制出能测量较高层次的认知能力的试题。
是非题一般适用于测量学生较低层次的认知能力,如判断概念、定律或规则的是与非,而对较高层次的认知能力目标就难以测量。
为了提高是非题的信度和鉴别力,可以采用以下方法来减少学生对试题的猜测因素。
(1)当所有的学生都不知道正确答案时,鼓励他们都去猜测。
由于学生的猜测行为是不可阻止的,所以只有让所有学生都去猜测才能平衡猜测效应。
(2)要求学生改正错误。
运用这种方法时,在每个选项后面都留出一点空隙,如果学生判断题项有错误,就在空隙处给以改正,并要求学生把不正确的部分用横线标示,写出正确的内容。
(3)鉴于是非题存在的不足,可采用将是非题与说明题相结合的办法。
这种方法既让学生判断,又让其说明理由,既可以减少学生猜测的机会,也可以测量学生较高层次的认知能力。
(三)是非题的设计
鉴于是非题自身的特点,为了教师能够编制出高质量的是非题试题,发挥其鉴别的功能,教师在编制试题时应遵循以下命题要求。
1.应尽量避免用否定句,尤其是双重否定
学生在答题时很容易忽视否定陈述中的否定词,从而导致判断错误。
双重否定则使叙述的语句模糊,从而增加了学生对内容理解的不确定性。
在不得不使用否定句来陈述时,应突出强调否定词眼,起到提醒的作用。
【不良试题】
(T)几乎不可能没有一个人在其成长过程中不曾遇到挫折。
【修正试题】
(T)几乎每一个人在其成长过程中都曾遇到挫折。
2.避免使用具有暗示性的字词或特殊的限定词句“所有”“通常”“只有”“可能”等词。
【不良例题】
(F)只有考上重点高中,才能考上名牌大学。
3.每一题只能包含一个核心的概念
应避免两个或两个以上的概念在同一试题中同时出现,而造成“似是而非”的情形,干扰学生的判断及回答。
【不良例题】(叙述中的概念,一个是对的,另一个是错的)(余民宁:
《教育测验与评量:
成就测验与教学评量》,155页,台北,心理出版社,2002。
)
(F)妯娌是属于姻亲关系,而叔侄是属于直系血亲关系。
【修正例题】
(T)妯娌是属于姻亲关系。
(T)叔侄是属于旁系血亲关系。
4.题目的陈述应简洁
是非题中,试题题目陈述的内容应当简洁、明了,尽量使用简单句来表述,避免使用复杂的句法结构,否则会使其变成阅读能力的测验,而达不到测试的目的。
上面的例子中,我们完全可以去掉那些无用的部分,保留重要的观点即可。
也可以改变句子的句法结构使句子变得简洁、明了,利于学生正确作答。
5.试题正确与错误的题数应大致相同,且以随机排列的方式呈现
是非题很容易造成学生猜测作答。
当学生遇到不会做的试题时,就会作出猜测。
因此,为了避免学生作答时盲目猜测,在编制试题时,应尽量让正确与错误的试题数大致相同,防止因学生猜题而造成能力评价的误差。
正确与错误的试题应按随机的方式呈现,以降低学生猜测的倾向。
6.试题的表述应清晰、明确
是非题中试题的表述要清晰、明确,不能含糊其辞、“或左或右”,否则会影响学生作出正确的评判。
7.试题中的陈述应避免直接使用教材中的原话
试题的取材不能一成不变地引用教材的内容,应适当地加以组织加工,以达到评价学生能力的目的,而不至于只评价学生的再认能力。
8.避免使用没有任何来源的观点,意见性的陈述必须指出参考资料的出处或依据
一般情况下,意见性的陈述并无对错之分,不能让学生把它视为事实来作答。
因此,为了避免有争议,在凡涉及相关的个人意见、观点等时,都应列出其来源或依据,这样材料才具有说服力。
二、什么是匹配题
(一)匹配题的含义及使用
匹配题(matchingitem)是由两列词或短语组成的,要求学生将一列中的每一条与另一列的相匹配,又称为配对题。
需要从另一列中找到对应信息的项目称为前提项,从中作出选择的那部分称为反应项。
两列项目数完全相同的称为完全匹配题,不相同的称为不完全匹配题。
凡是学习结果强调的是判断两种事物之间联系的能力,并且有同质的前提项和反应项,那么就可以使用匹配题。
一般认为,比较重要的联系有:
人物……成就 日期……历史事件
术语……定义 规则……例子
符号……概念 作者……书名
外语单词……英文对应词 机器……用途
动植物……类别 原理……说明
物体……物体名称 部件……功能
(二)匹配题的优点及不足
匹配题使用的范围很广,可与其他类型的试题连用来测量较高层次的认知能力。
它的形式紧密,效率高,能在较短时间内测量到大量的相关内容,评分简便、客观、快速、公正,有效地避免了人为的主观因素的干扰。
但是,匹配题大多只能测量一些关系性的死记硬背的知识,不利于学生知识的应用和迁移;而且相关的线索较多,对学生的作答有一定的暗示性。
编制具有足够同质性反应项的试题很困难,而且对编题人员的要求相对较高。
鉴于编制匹配题同质性难的问题,可以采用多项选择来解决,因为每个题目都与一个特定的结果直接相联系。
只有当同质材料使匹配题能更加有效地测量同样的成就时,才选用匹配题。
(三)匹配题的设计
1.指导语必须明确、清晰
在试题中,指导语必须清楚明确地说明答题的要求、原则,不至于学生因不懂题意而盲目作答,导致不必要的错误。
同时,也可以节省测量的时间。
2.题目陈述的内容必须是同质的或接近的(应都属于同一类别或同一性质、关系的事物)
在编制试题时,必须注意内容的同质性,不要泛泛而谈,这样有利于增强试题选项的迷惑性,达到辨别学生层次和所掌握的知识水平的目的。
否则,会增加或降低试题的难度而达不到评价的目的。
3.应尽量编制不完全的匹配题,而且每个备选项被选的次数应不受限制
编制试题时,尽量采用不完全的匹配题,对备选项被选的次数不加限制,可以被选一次或两次或三次等,这样有利于减少学生在作答时凭借猜测来回答的机率,增强试题的有效性和鉴别力。
反之,若题干与选项一一对应,作答中最后一对选项就如同虚设,甚至对学生的整个作答产生暗示作用。
因此,设计匹配题时,应尽量使用不完全的匹配题,如下例。
请思考下列叙述,从右边的反应项中选出一个最适合的,并填入左边前提项的括号内。
(余民宁:
《教育测验与评量:
成就测验与教学评量》,162页,台北,心理出版社,2002。
)
前提项 反应项
(F)1.恍然 A.轻巧的样子
(G)2.妩媚 B.辽远的样子
(D)3.沸沸然 C.稀少的样子
(E)4.烂漫 D.腾涌的样子
(C)5.寥寥 E.光彩纷呈的样子
F.忽然领悟的样子
G.姿态美好的样子
H.模糊不清的样子
4.题目陈述的内容应当简洁
在试题的陈述中,题目应简洁、明确,将更简练的反应项放在右边,而且反应项应按一定的规律如时间先后顺序、数字大小或字母的先后顺序等随机呈现,这样可以减少学生凭记忆的线索或盲目的猜测方式来作答。
5.试题中选项和被选项的数目应在10个以内,同时应减少与答题有关的线索
试题中前提项和反应项的配对数目过多,就会使材料难以达到同质的要求,而且容易给学生提供不必要的作答线索,也会增加学生作答的时间。
在限定的时间内,反应项数目过多的匹配题就很容易变为对学生的阅读和理解速度以及反应的准确性进行评价,而偏离了命题的本意。
因此,试题中选项和被选项的数目应在10个以内,4~7个为佳,这样利于学生在限定的时间内作答。
6.应将同一匹配题中的所有选项和被选项放在同一页试卷上
将试题的所有部分放在同一页上,有利于学生减少翻页寻找选项的时间,而且也不会出现漏答的情况,同时也有利于提高学生作答的速度和测验的效率。
三、什么是简答题
(一)简答题的含义及使用
简答题是指要求被试(学生)对所提问题用简短的语句来回答的一种题型。
回答的内容可以是几个字词,也可以是几句话。
常用的简答题类型有解释题、直接问答题、列举题、简要说明题等。
(二)简答题的优点及不足
简答题适合于测量学生对所学基础知识、定义、原理等内容的回忆和再现的情况,在一定程度上也可以评价学生推理和解决问题的能力。
和填空题一样,简答题的编制较灵活、简便,可以从不同方向、不同侧面考虑出题的内容,有利于增强对学生所学知识进行评价的准确性,而且不受学生猜测因素的影响。
由于简答题的以上特征,也限制了它难以对高层次的教育教学目标(如对知识的综合、分析、评价等)进行很好的评价,而且评分易受主观因素的影响(如学生作题时字迹清晰度、错别字、教师评分时的主观性等),客观性不强。
鉴于简答题的限制,可将简答题与多项选择题相结合,组成新的题型——选择说明题,即要求学生在所提供的选项中选出正确的答案,然后解释原因。
(三)简答题的设计
鉴于简答题的优缺点,在设计简答题时应注意遵循以下编制原则。
1.问题的陈述应简洁、明确
简答题的试题陈述要简洁、明确,使学生能够明确掌握试题的要求,并能正确作答,而不会在理解题意上花费过多的时间。
2.问题的答案要简洁、唯一,避免有争议的答案存在
问题的答案要尽量唯一,避免有争议的答案。
如果答案确实难以确定时,应选择最佳的,以利于评分的客观性和公正性。
3.应侧重于考查学生对所学知识的应用和迁移
问题的陈述应着重于考查学生对知识的应用和迁移,要灵活多样,注重与实际生活相结合,而不要只考查书本上的“死知识”,那样不利于学生能力的提高。
4.在考查某一公式的实际应用时,所提供的数字要便于计算
试题中,涉及计算的数字不要复杂化而要简洁,避免给学生的计算带来困难,而影响学生的作答。
5.问题的陈述应尽量以直接陈述为主,避免间接陈述
问题的直接陈述较自然,而且问题的结构很严谨,也便于学生理解。
而间接陈述则会影响学生对问题的理解,不利于学生对问题的掌握及正确作答。
因此,在设计试题时,应侧重于以问题的直接陈述为主,避免使用间接陈述。
四、什么是选择题
(一)选择题的含义及使用
选择题在当今客观测验中被认为是最基本、使用最广、影响最深远的一种试题类型,尤其是配合电脑的使用,使得阅卷、记分、试题与测验分析结果都相当快速与正确。
选择题(multiple-choiceitem)是指从多项选择中挑选一项正确选项的试题类型,它由一个“题干”和几个“选项”组成。
题干是根据所要考查的内容而编制的一个问题或一句不完整的话。
选项则是根据题干而设计的几个备选答案。
备选答案中正确的答案称为“正确答案”或“最佳答案”,错误的答案称为“错误答案”或“迷惑性答案”。
选择题按备选答案中正确答案的个数,分为单项选择题和多项选择题。
单项选择题在备选答案中只有一个正确答案,多项选择题在备选答案中有两个或两个以上的正确答案。
因此,在编制试题时,应明确说明选择的要求。
选择题的类型有许多,每种类型都有其编制目标和功能特性,如能熟悉各类型的编制目标和格式,再配合每次编制测验的目的,就能编制出符合使用需要的成就测验来。
因此,这里有必要先介绍这些常见的选择题类型。
常见的选择题,可以按照其所能测量到的认知目标层次的高低,归纳为下列由低到高排列的五类。
其中每类题型都有其特别的编制格式,只要熟悉此格式,并加以变化,就能随时设计出各式不同内容的复本试题来。
现分别说明如下(其中,P表示“问题的命题,并且写在题干里”;C表示“结果,为K个可能的选项”;→表示“产生、导致、得到”的意思)。
(余民宁:
《教育测验与评量:
成就测验与教学评量》,132~137页,台北,心理出版社,2002。
)
例1(选一个正确的答案)
《鲁提辖拳打镇关西》一文选自下列哪一本书?
(*为正确答案,以下同)
A.《西游记》 B.*《水浒传》 C.《三国演义》 D.《红楼梦》
(二)选择题的优点及不足
选择题可以测量出学生各种不同层次的学业成就,也可适用于不同学科范畴的课程内容,用来评价学生的认知能力。
选择题可以与电脑配合使用,使得评分快速、客观、公正,更科学化。
因此,它已成为当今教师自编成就测验所普遍使用的一类题型。
选择题具有以下优点:
(1)适用范围广,能较好地考查学生各个层次的认知能力,如学生的记忆、分析、推理和应用知识的能力等;
(2)取材广泛,受学生猜测因素的影响较小,信度较高;(3)编制比较灵活,可以根据测试的目的,调整试题的难度,从不同的角度评价学生各层次的能力;(4)评分较客观公正,而且可以与电脑联合使用,评分省时、省力。
但是,选择题在使用与编制中也存在一些不足:
(1)与论述题相比,选择题的编制相对费时、费力;
(2)要编制出“似是而非”的良好的诱答选项或迷惑性选项很困难;(3)由于选择题的选项是相对固定的,测不出学生问题解决、材料的组织与表达等能力;(4)选择题中试题的得分可能受学生阅读理解能力的影响。
(三)选择题的设计
一份有效的选择题,不仅能够很好地鉴别出学生对知识的掌握程度,也能甄别出学生对问题的解决能力和知识的迁移能力。
为了更好地发挥选择题应有的功能,在编制选择题时应遵循以下设计原则。
1.题干陈述的内容应完整、简洁、明确
题干的陈述应简洁、明确,而不要叙述太过直接或冗长。
如果一句话无法完整、清楚地表达而被选项分割成两部分,这样就会增加学生对题意的误解。
因此,解决的最好办法就是将题干的叙述改为间接问法,使句子的叙述完整、明确,以减少学生对试题的误解,而不至于盲目作答。
2.试题所考查的内容应是重要的或关键性的知识
试题中,试题的内容和结构应测量学生学习的重要成果,并且是教材中重要的或是关键性的知识,而不能出现教材中无关紧要的、模糊的或不重要的内容。
否则,一方面会增加试题不必要的难度;另一方面,也不能达到评价的真正目的。
3.所编制的试题中,各试题的备选项的个数应相同,一般以四个为宜
一般而言,各试题中备选项的数目应保持一致,不可偏多也不可偏少,以四个为宜,但至多不
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语文评价第三讲crosoft Word 文档 语文 评价 第三 crosoft