小案例:刘老师刚刚教完了《项羽本纪》,希望能通过教学提高学生古文学修养,培养他们对历史的兴趣,同时也希望他们对历史事件有自己的见解。如何使用评价这个教学手段促进学生达到教学目标,同时又得到相关反馈信息呢? 刘老师要求学生课后阅读《项羽本纪》,从网上收集相关资料并撰写一篇读后感,这个作业的成绩将作为学期总成绩的一个部分。在一周后的一节课上,刘老师安排作业优秀的学生介绍自己的作业。
我们经常用客观测验来评价学生的学业成绩(比如考试、测验)。但是在测量复杂认知过程,评价态度和情感等方面仍然存在较大缺陷。随着新的评价理念日益深入人心,表现性评价和学生成长记录袋等新的方式涌现出来,较好的弥补了传统考试方法的局限。在上面这个案例中,刘老师设计了表现性的任务,要求学生表达自己的想法和见解,对于培养学生的兴趣、提高修养具有积极的促进作用。
制定针对学习者的评价方案是教学设计的重要一环。评价方案本身就是教学设计中一个重要组成部分。它对于准确了解教学效果,及时获得教学反馈,以便于进一步改进教学来说至关重要。
一般的评价过程为:(请点击查看) 一、客观测验本部分主要从考试的质量标准、试题的质量标准、试题编写原则三个角度对客观测验进行介绍。
1.考试的质量标准
(1) 效度:指考试对教学目标测量的有效性程度
(2) 信度:指测量的可靠性,它反映考试分数可准确重复的程度。
我们举一个打靶的例子来说明效度和信度。如果打靶的时候能击中靶子,我们说这次打靶是有效的;如果打靶时能够重复击中靶子,我们说打靶的水平是可信的。对于考试来说,如果试题反映了需要考查的内容,没有偏离要考查的内容,就保证了试题的效度;如果试题测试的结果能够大致重复,没有很大的偶然性,就说明了试题的信度。
| 小活动 | 试判断出现下列情况时,是测试的信度还是效度出现了问题:
• 考试分数不能准确反映学生水平。
• 考试内容偏离了学习目标。
• 对同一个体使用两套题目不同而内容相近的考题,考分相差很大。
• 员工在面试测验时表现优异,但在以后实际工作中表现平平。
|
| 2.试题的质量标准
(1) 区分度:区分度是反映试题区分应试者能力水平高低的指标。试题区分度高,可以有效拉开不同水平应试者分数的距离,使高水平者得高分,低水平者得低分,而区分度低则反映不出不同应试者的水平差异。试题的区分度与应试者的水平密切相关,试题难度只有等于或略低于应试者的实际能力,其区分性能才能充分显现出来。
区分度可用以下公式计算:D=(H-L)÷N(D代表区分度指数,H代表高分组答对题的人数,比如考试成绩前27%的人;L代表低分组答对题的人数,比如考试成绩后27%的人;N代表一个组的人数即高分组与低分组人数之和)。区分度指数越高,试题的区分度就越强。一般认为,区分度指数高于0.3,试题便可以被接受。小活动:如果一道考题的难度为0.533,而区分度为0.127, 试用日常语言说明该题的难度和区分度。
(2) 难度:难度是指应试者解答试题的难易程度,它是衡量测评试题质量的一个重要指标参数,它和区分度共同影响并决定人才测评的鉴别性。难度一般用以下公式计算:P=R÷N(P代表试题的难度指数,R代表试题的答对人数,N代表考生人数)。难度指数越高,表示试题越容易;难度指数越低,则表示试题越难。一般认为,试题的难度指数在0.3-0.7之间比较合适。
一道质量优良的试题应该难度适中。太容易,各个能力层次的考生都能通过,则这道题对于鉴别考生的实际水平没有意义;同理,太难,不管程度高的还是程度低的都不能通过,也对于鉴别考生水平意义不大。
| 小活动 | 如果一道考题的难度为53.3%,而区分度为12.7%, 试用日常语言说明该题的难度和区分度。
|
|
| 思考提示 | |
|
|
3.试卷编写原则
| 小活动 | 看看下面的配对题,思考一下,它有什么不当之处吗?
指南:将甲和乙配对
甲 | 乙 | • 林肯 | • 20 世纪的总统 | • 尼克松 | • 发明电话 | • 惠特尼 | • 发表《解放宣言》 | • 福特 | • 唯一一位在位辞职的总统 | • 贝尔 | • 黑人人权领袖 | • 金 | • 发明了轧花机 | • 华盛顿 | • 美国首位总统 | • 罗斯福 | • 唯一一位任期超过两届的总统 |
|
|
| 小活动 | 看看下面的选择题,思考一下,它有什么不当之处吗?
( 1 )当 53名美国人被伊朗扣为人质时, ____________________ 。
• 美国没有采取解救办法
• 美国向伊朗宣战
• 美国试图通过外交手段解救人质,后来采取了缓救行动
• 美国将所有伊朗学生驱逐出境
( 2)细胞内合成蛋白质的自由游动结构被称作___________________ 。
a. 染色体 b. 溶酶体 c. 线粒体 d. 自由核黄素
|
| 为了有效地评价学生的学习结果,在期中期末,教师通常要编写试卷,测试学生的学习成效。试卷中包括填空、配对、选择、计算、问答等题型。请参看试题编写原则。" 请你完成下面的两个小活动,进一步领会试卷编写的基本原则。
二、表现性评估 ( Performance Assessment )广东天河区华康小学何燕等几位老师开发了关于“市制单位”调查活动的表现性任务。其设计思路是:小学四年级的学生已经在第七册第一单元中认识了十进制的计数方法,但实际生活中还存在着一些非十进制(比如时钟的十二进制,分钟的六十进制,计算机的二进制)的计数方法,从体现数学的现实意义这个角度出发,应该让学生了解一些与日常生活息息相关的非十进制计数法,同时在这个过程中培养学生收集信息和处理信息的能力。于是,在学完第七册第一单元后设计了一个非十进制计数方法调查的任务。
| 小活动 | 请对该表现性评价的测验目标和表现性任务提出自己的看法;并设想本案例需要制定什么样的评分细则,规定什么样的测验要求?
|
| 表现性评价直接测量教学内容的掌握情况,而不是仅仅说明已经发生的认知的、情感的和心理的过程的指标。教师通过设计表现性任务,对学生的高级思维、情感态度进行评价。 设计和计划表现性评价的 4个步骤如下:(请点击查看)(注:若上面Flash中的---详细规定评分原则一项中的《核查清单》《评分量表》 不能打开,请参阅。)
| 小活动 | 在你的教学实践中,哪些环节可以采用表现性测验?在设计表现性测验的过程中,可以从哪几个角度来设计?
|
| 三、档案袋评价 (Portfolio Assessment)小案例:吴老师原来一直使用考试的方式来评定学生的学业成绩,但是他发现,考试方式有时候存在一定的偶然性。当他了解了新的档案袋评价方法后,决定在他的几何课上使用档案袋来评价学生,补充单一考试评价的不足。
制作档案袋的任务在学期开始就布置下去了。教师要求学生把本学期要求完成的五个综合性数学实践活动任务(例如调查学生阅读习惯、测量大讲堂的面积等)的结果放到档案袋中,形成档案袋评价的材料。
学期末,吴老师首先让学生对每件作品进行自我陈述;然后,要求学生使用他提供的评估量表,对档案袋进行互评,并加上对他人作品的评语。互评让学生不仅能得到同伴的反馈,而且还有机会欣赏别人的档案袋作品。
使用档案袋评价一段时间后,吴老师认为档案袋评价方法明显提高了学生的教学参与感,在给别人提供反馈评价的过程中,学生对问题的理解更深入了。 |