怎样“打分”更科学——刍议考试评价的百分制与等第制
橘右京怎么玩 据媒体报道,本学期上海将全面推行小学“等第制”评价。近期,不少家长的朋友圈被“等第制”刷屏。某微博还发起了一场有关“你支持小学推行‘等第制’吗?”的讨论,众多网民各抒己见,有人支持,有人反对。笔者认为,在百分制评价转变为等第制评价的过程中,出现某些担忧或疑惑,是一种正常现象。当务之急是,应该普及这方面的知识,让教师、学生和家长理性地看待这个问题。
  等第制与百分制的“前世今生”
  在表示学生考试、测验和作业水平时,通常采用等第制或百分制两种计分法。等第制,亦称等级制,是指用等第作为学生成绩的计分方法,包括文字等第和数字等第两种类型。文字等第采用优秀、良好、中、及格、不及格,甲、乙、丙、丁,上、中、下,或及格、不及格等来表示;数字等第采用5分、4分、3分、2分、1分来表示,其中5分表示“优秀”,4分表示“良好”,3分表示“及格”,2分表示“不及格”,1分表示“极差”。
  百分制是指,用0—100分作为成绩的计分方法。通常以100分为满分,60分为及格,60分以下为不及格。澳大利亚ACCESS考试、英国IELTS考试、美国TOEFL考试、GRE考试、GMAT考试以及我国中考、高考、大学英语四级和六级考试,常常以120分、150分甚至更高
的分数为满分。
黄慧慈  我国自汉代开始,采用等第计分法。汉代的太学(当时全国最高的教育机构)采用及格和不及格两个等第,唐朝和宋朝采用上、中、下三个等第,以后采用甲、乙、丙、丁四个等第,或优、良、中、可、劣五个等第。1902年(清光绪二十八年),清政府颁布的《钦定学堂章程》明确规定:“评定分数以百分为满格,通各科平均计算,每科得60分者为及格,不及60分者为不及格。”此后,中国开始采用百分制计分法。中华人民共和国成立后,在上世纪50年代广泛采用五级计分法,上世纪60年代后一般采用百分计分法,同时采用五级计分法,或“优、良、及格、不及格”四级计分法。古朗月行全诗解释
庆祝国庆节  不同国家对学习成绩的数量表达往往采用不同的计分法。譬如,意大利采用十一级计分法,荷兰采用十级计分法,波兰采用五级计分法。有些国家采用六级计分法或三级计分法,如:特优(superior)、优(excellent)、良(very good)、中(good)、及格(passing)和不及格(failure/below);优秀(outstanding)、满意(satisfactory)和不满意(unsatisfactory);超标(check plus)、达标(check)和未达标(check minus)。
  等第制与百分制有什么弊端
杜淳的父亲
  无论采用等第制还是采用百分制,其反馈结果将包括四个指向:向学生反馈,使学生充分了解自己的学业水平;向家长反馈,让家长了解子女的学业状况;向教师反馈,帮助教师判断教学成效,总结经验和教训,提高教学质量;向教研组、年级组和学校领导反馈,为进一步加强教学管理与教学决策提供依据。因此,等第制和百分制都应该力争做到:其一,客观、公正和透明;其二,反映考生掌握所学内容的广度和深度;其三,表明考生在学业方面的优点、不足和努力方向;其四,确定每位考生的相对位置。
  严格地说,等第制和百分制都不是一种完满的计分方法。以百分制为例,它至少存在两个严重弊端。
姚笛结婚了吗  第一,互补性。在学生评价过程中,教师大多只向考生提供一个总分。给出总分的最简单方法就是将各部分的得分相加,确定一个及格分数线。不管在哪个部分获得分数,只要总分超过60%就算及格。比如,一张试卷由五个部分组成,每个部分的分数为20分,总分为100分。甲乙两位考生各得80分。其中,甲考生在四个部分获得满分,一个部分获得0分,总分是80分;乙考生在全部五个部分中都获得了16分,总分也是80分。从分数上看,甲、乙两位考生水平相当,但其实他们之间存在着质的差别。他们之所以给人水平相当的感觉,是因为这种计分法利用了分数之间“互补性”,用强项获得的高分去“弥补”弱项获得的低
分。
  第二,模糊性。由于重大测试的试卷需要存档,考生拿到的只是测试的总分成绩。仅仅一个孤零零的总分成绩无法向考生提供详细的明确信息,其含义也是模糊不清的,因为考生不可能确切知道哪个部分及格了,哪个部分没有及格,哪个部分是强项,哪个部分是弱项,当然也无法知道自己在考生体中的相对位置以及在学业方面的优点、不足和努力方向。
  百分制计分法的两个弊端如此严重,等第制计分法的缺陷就更突出。
  等第制与百分制的技术修正
  由于等第制和百分制存在着“互补性”和“模糊性”两个弊端,它们已经受到学界的批评。为了提高计分法的“透明度”和“合理性”,我们可以在等第制和百分制的基础上,作一些技术性的修正。
  第一,提供两种分数。在重大测试中,应向考生提供两种分数,即各部分的得分和相加后的总分。澳大利亚ACCESS考试、英国IELTS考试、美国TOEFL考试、GRE考试和GMAT考试以及我国大学英语四级和六级考试,都向考生提供两种分数。这样便向考生提供了更加明确的信息。也许有人认为,这将增加教师的阅卷负担。其实不然。在试卷评阅过程中,
教师通常都把试卷分解成若干部分,首先给出各个部分的得分,然后给出相加后的考试总分。现在是利用计算机统计分数,提供两种分数是非常容易做到的。况且,重大测试举办的频率低,而且提供两种分数可以提高计分法的透明度和合理性,何乐而不为呢?
  第二,设置附加条件。在确定考生的最后考试等第时,须考虑两个因素:各部分得分相加后的总分和各个等第的附加条件。仍以上述试卷为例。该试卷由五个部分组成,每个部分的分数为20分,总分为100分。其中,90分以上为“优”,80分以上为“良”,70分以上为“中”,60分以上为“及格”,60分以下为“不及格”,但各个等第都必须符合相应的附加条件。比如,获得“良”的考生,任何部分的得分不得低于10分。这样,上述甲、乙考生获得的最后等第就出现了高低。甲考生在四个部分获得满分,一个部分获得0分,尽管其总分为80分,达到了“良”的最低分数线,但是他在一个部分的得分为0分,低于10分,因此他最后获得的等第只能降格为“中”;乙考生在所有五个部分中都获得了16分,其总分为80分,不仅达到了“良”的最低分数线,而且每部分的得分超过了10分,符合“良”的相应附加条件,因此他最后获得的等第为“良”。设置附加条件的好处在于鼓励学生全面掌握重要的知识点和技能。
  第三,依据曲线评定成绩,即依据学生成绩的分布曲线给出分数。数理统计中的“常态曲
线”原理认为,在任何一个学生体中,都有上、中、下三个层次,而且这三个层次所占的比例是一个恒定的常数。以智商为例,处于“常态曲线”两端的人数,即智商高于130的超常人数和智商低于70的人数,各占全民人口的2%左右;处于“常态曲线”中部的人数,即智商在85至100之间以及100到115之间的人数,各占全民人口的34%左右。因此,教师给某一学生体评定成绩时,应根据“常态曲线”的原理,适当注意一定的比例分布。
  必须注意的是,按照“常态曲线”原理决定各层次所占的比例,有时可能会脱离实际,缺乏科学性和合理性。比如,某班全体学生都非常优秀,考试成绩很高,如果依据常态曲线评定成绩,必然有一部分学生不及格,这会挫伤这部分学生的学习积极性,甚至滋生不满或敌对情绪。又如,某班全体学生学习困难,考试成绩很差,如果依据常态曲线评定成绩,必然有一部分学生获得优秀,这会导致那部分学生产生“学习优秀”的错觉,甚至滋生自满、骄傲的情绪。再如,某班全体学生原先学习困难,考试成绩很差,但是最近一个时期,他们经过努力拼搏,考试成绩提高了,如果依据常态曲线评定成绩,可能无法如实反映学生已经取得的进步。