纸笔评价、表现性评价和档案袋评价各自的优缺点
评价方式
 
评价的基本方法是教育评价中最核心的内容。教育评价的方法有多种,对中小学教师来说,最常用的教学评价有三种:纸笔测验(书面考试)、2.表现评价(面试,答辩)、成长档案。
评价方式之一:纸笔测验
一、纸笔测验的优点和局限性
纸笔测验,又称为书面考试。指把测试题做成试卷印在纸上,学生根据考试题,在试卷上用笔作书面回答的测量方式。
用纸笔测验需满足的条件是:
1.该测量的项目问题(试题)可以用文字、图表、符号等方式在试卷上印刷呈现,并加以说明。
2.该测量的实施可以让被试(学生)用笔在纸上作答,并且对这种答案是可以做出判断的。
(一)纸笔测验的优点
由于上述基本特征,纸笔测验具有规模大、效能高、稳定性好、机会均等、可复查、可比较等优点。
1.规模大指一次测量的规模可以无限放大,只需在考卷、考场、阅卷等环节安排好,从理论上讲这种测量可以做到不受规模大小的影响。大到全国范围内组织同一时间同一试卷的高考。这是任何其他测量方法无法替代的。因此纸笔测验效能最高,投入成本只包括试卷编制、印刷、监考、阅卷等环节,是低投入高产出的评价工具。
2.稳定性好、机会均等是指纸笔测验由于试卷的定制性,呈现在每位学生面前的项目问题(试题)都是一样的,表现的机会在形式上人人均等,把人为因素产生测量误差的可能性降到了最低。
3.可复查、可比较则是指纸笔测验的文档一旦做出就不会变化,可以长期保留备查。由于所有被试的项目问题都是一样的,而答案则取决于每位学生的不同水平,所以可以通过对每位
学生不同答案的分析,比较出不同学生水平的高低。
(二)纸笔测验的局限性
纸笔测验的最大问题有二:
1.容量有限。
2.项目问题(试题)的局限性。
由于纸笔测验需要被试在规定时间完成规定的任务,所以容量受到时间的限制。大多数纸笔测验的时间在1~2个小时左右,项目问题只能控制在50个以内,这给测量内容的覆盖程度上带来了一定的局限性。
同时,纸笔测验的项目问题和答案都只能用文字、图表、符号等形式来表述,看不到被试的实践操作,所以能检测到内容也是有局限性的。
测量作为教育评价中搜集数量化信息的手段,可分成直接测量与间接测量两种。
1.直接测量指可以直接用点数或工具测得数据的方法进行的测量。比如:学生人数、男女生比例、班级学生的视力状况、身高分布曲线、等等。
2.间接测量指对相对比较宏观或抽象的对象,用工具无法直接测得结果,只能通过学生对某种“投射”刺激的反应表现来间接推测学生水平的测量。
从测量的直接性与间接性来讲,纸笔测验内容的多少直接决定了项目问题能否做到对测验内容的全覆盖。假如能做到全覆盖的,就是直接测量;假如不能做到全覆盖的,就是间接测量。
学校最常用的单元小测验,教学目标有限,大多在20个以内。每个目标都可用一个或几个试题覆盖,因此可以看作是对单元学习结果的全部检查与测量,看作一种直接测量。而期中、期末、学年、学段考试,由于时间积累,课堂的直接教学目标可能会累积到几十甚至几百个。这在一次测验中是无法做到全覆盖的,需要对每一个教学目标进行抽样或抽象,而这种抽样或抽象就会影响测评结果的解释性。
由于学科的不同,抽样或抽象的方法也是不同的。
对有较强逻辑结构知识体系的学科来说,如数学、物理、化学等,可通过对课堂具体教学目标的逐级抽象,用少量的上位目标覆盖大量的下位目标,在一个学期结束的时候,整个学期的教学目标因为比较抽象程度高,可以抽象做3-4次的测验目标,把期中、期末、学年、学段测验目标控制在一次测验一张试卷范围内。这种测验可以被认为是对某学科学期、学年、学段学习结果的直接测量。
假如学科的知识结构比较松散,不能逐级抽象,那只能用抽样的办法选择部分教学目标测量。这种由抽样决定的学科测验结果,只能是间接测量,其结果的解释性会有一定的局限,要防止以偏概全。
抽样误差主要反映在样本对学科某学期、某学段学习内容的代表性程度上。所以,对纸笔测验来说,有一个问题很重要,从测验目标的厘定到试题对学科测验目标的对应程度,是衡量测验编制水平高低的最关键因素
从理论上讲,测量目标抽离的个数越少,就越能够用试题做到全覆盖,测验目标对教学目标的覆盖性越好,测验结果对学科学习水平的解释性就越强。反之,测验目标不能有效覆盖全体教学目标,则该测验结果对学科学习水平的解释性就相对较弱。
二、针对纸笔测验局限性的解决策略
纸笔测验的质量高低还取决于项目问题(试题)与目标的对应水平。具体单一的课堂教学目标,如:字词、语法、概念、定义、定理、公式、知识点等,很容易用选择、是非、填充、配对等题型与之对应。有了这种对应,很容易从学生的答题情况判断其相应学习内容的学习水平。
大多数教学目标到了学期、学段的时候都变得抽象综合,比如说,我们能不能在政治课上解释某一种社会现象,我们能不能在历史课上解释某一个历史事件的历史价值,我们能不能解释元素周期表在化学中怎么运用其解释化学现象,等等。这种抽象综合的教学目标,纸笔测验很难用客观性试题与之对应,只能用论述、解答等方式的主观性试题,既增加了试题与目标的对应难度,又造成复杂问题阅卷的精准性。这是纸笔测验最难回避的两难问题。
所以,纸笔测验从形式上决定了它的优点与局限性。如何放大它的优点,克服它的局限性,需要我们在实践中多探索研究。
(一)组合式测验
发展的趋势是用组合式纸笔测验替代综合式纸笔测验,就是把一次测验按时间分成几次小测验的组合。每次小测验只测一种学习结果,然后把几次测验的结果综合在一起呈现、分析和判断,可以克服一次性纸笔测验带来的两难问题。
组合式纸笔测验代替综合式测验的最常用方法就是两分法,既要兼顾测验试卷对学过知识内容的覆盖性,又要检查学生对这部分学习的深度,把一次测验分成两个分测验。
比如,对一个小时的测验来说,做两张卷子,第一张卷子半小时,第二张卷子半小时。
第一个分测验全部用选择题增加题量,半小时全部做选择题,假如说一分钟做一个的话,那就是30个选择题,30个选择题涵盖量就比较大,甚至还可以增加题量到40个,因为学生做选择题不需要花太多时间,只需看懂题目,读一个选一个,半小时内,做题速度快的学生可以做到40-45个题。提高测验对教学目标的覆盖程度,用在规定时间完成试题的数量检查学生对学科知识的掌握程度,称为速度测验。主要考察学生的熟练程度。
第二个分测验用1-2个综合性难题,让学生有足够的时间思考解答,检查学生对学科知识的理解深度,称为难度测验。
把一个测验分解为一半速度考试,检查学生对知识面的掌握情况,另外一半难度考试,检查学生对知识掌握深度的掌握情况。这种两试法,不仅可以缓解纸笔测验的两难问题,还可增加测验的分析程度。
常用的组合式纸笔测验代替综合式测验,以增强测验的诊断性模式有:
理科——速度测验(知识面测验)+难度测验(能力测验)
英语——词汇+阅读理解+口试+听力(纸笔测验在试题显示和回答方式上的拓展)
语文——语言学基础知识+阅读+写作
(二)增加被试的背景调查
纸笔测验还有一个发展趋势就是在试题前面增加一段被试的背景情况调查。如:性别、父母职业情况、家庭学习条件、藏书多少、对就读学校的喜欢度、师生关系、在同类学生中百分位、每天用于作业的时间、睡眠时间、课外阅读情况等等。
这些资料可以与测验成绩做各种相关分析,以了解影响学生学习的各种因素,对诊断教学问
题,改进学校教学工作、政府教育政策起到警示作用。在全国性的质量抽测、PISA项目、国际比较研究、政府的教学质量检测等都有这样的功能设计。对广大教师而言,有时可以利用学生的测验顺便做一些有关学习背景的调查,这样可以增加一次考试以后所能得到的可以分析的各种要素。
三、纸笔测验的基本编制程序
纸笔测验的基本编制程序是:
1.测验蓝图设计。根据测验容量和要求设计测验蓝图。
2.命题。根据测验蓝图选题。
3.组卷,确定评分标准。
4.实测。
5.阅卷。
6.考后分析。
测验蓝图是一张双向细目表,从能力与内容两方面进行设计。一般测验蓝图的设计单位是得分点。
所以,拿到一张双向细目表后,现在最右下角把测验的总分填好。比如,下面这个期末考试的测验蓝图。这个测验是100分,总共六个单元,根据不同内容的权重分配,然后根据不同水平的权重分配。大多采用布鲁姆的教育目标分类学的六个水平,识记、理解、应用、分析、评价、创新,前三种叫做基础性学习水平,或者叫做常规性学习水平;分析,一般叫做中等难度的学习水平;综合、评价就是比较难的学习水平。老师当中有一个俗称,组织考卷就是721,即70%的基础题,20%的中等难度题,10%的难度题目,这也不是固定的,可以根据要求设计的。如下这个卷子,基础题定在6.5%,中等难度的风险题定在2%,难题定在1.5%,这样的比例比721更难一些。综合分配好以后,就可以把题目放进去,总共有五大类型的题目,一代表判断题,二代表选择题,三代表问答题,四代表计算题,五代表综合题。
识记
理解
应用
分析
综合
Σ
一/1、2
二/6
三/1
11
一/3
一/6
三/2、3
14
编制考试
二/1
一/7、8
三/4
11
一/4、5
二/7、8
四/1
18
二/2、3
一/9、10
三/5
五/1
28
二/4、5
二/9、10
四/2
18
Σ
20
20
25
20
15
100
注:表中一代表判断题,10题20分。二代表选择题,10题20分。三代表问答题,5题25分。四代表计算题,2题20分。五代表综合题,15分。
有了这张测验蓝图以后,有两个好处:第一,老师知道每个单元的题目要不要出,要出的话出几个,出什么题型。第二,有助于教导处审查一张卷子在内容丰富上的合理性。看看卷子在每个单元的丰富上是否和教学实施相对应,能力的分布上是否合理,然后判定卷子是否可行。所以,测验蓝图是帮教师编好一次纸笔考试的重要工具。
四、小结
纸笔测验作为最古老的评价工具之一已经存在了几百年。从最早的科举考试到现代的标准化测验,尽管在形式、试题、阅卷方式等方面都发生了很大的变化,但其基本性质没变,仍然是中小学使用最广泛的评价工具,也是教师教学能力的重要方面。
作为教师的一项基本功,教师一定要完成三件事:第一,从基本概念上了解什么是纸笔测验。第二,要知道怎样判断一个纸笔测验的好或不好。第三,如何编出一个好的纸笔测验。用好纸笔测验,使其更好地为教师教学服务。
思考题
1.说出纸笔测验的优缺点。
2.纸笔测验还可以有哪些改进,使其功能更大。
作业:
设计一个你所教学科期末考试的测验蓝图和考题前的背景调查问卷,并说明这样设计的意图。
评价方式之二:表现评价
一、表现评价的本质及特征
表现评价指评价者与评价对象在同一场合,由评价者提出任务,评价对象根据评价者布置的任务做出反映,评价者根据评价对象完成任务的表现,对评价对象某些方面作出评价。最常用的范式是面试。
用表现评价需满足的条件是:
1.评价者与评价对象同在现场,或者评价者有评价对象的录像资料、轶事记录、作品等表现性资料。