语言能力的分级测试
——大学英语四、六级考试设计中的量化分析摘要:本文以大学英语四、六级考试实践为依托,从词汇量、阅读能力和微技能三方面论述了语言能力的定量分析,并结合语言能力的定性分析,概括了不同种类的语言能力分级测试,提出了建立全国统一的英语能力等级量表的构想。
关键词:语言能力;定量分析;定性分析;分级测试
一、语言能力的量化分析
在现代语言测试中对语言能力进行分级测试有着重大的实践意义,因此引起人们的重视。要回答能不能对语言能力进行分级测试的问题,首先必须从理论上回答有没有可能对语言能力进行量化分析。量化分析是现代社会科学研究的发展趋势,语言教学研究当然也不能例外。语言教学要提高实效不能满足于“基本上”、“一定的要求”、“以……为主”这样的一些笼统的、不确切的提法,而应当探索更精确的方法,以便对语言教学所涉及的众多因素进行量化分析。在进行语言能力的量化分析时应当定性分析与定量分析相结合。下面就大学英语四、六级考试设计中所进行的量化分析作一介绍。
二、语言能力的定量分析
1.词汇量:教学词表的制定
在讨论语言能力的量化分析时,人们首先想到的是确定词汇量。据统计,现代英语共有50万个单词,在有限的学时内要掌握英语以满足实际的交际需要,既没有可能也没有必要全部掌握这些单词。只有选择最必需的单词才能充分利用教学时间,在有限的学时内达到最大的教学效果。早在20世纪40年代就有心理学家、语言学家从事制定教学词表的研究工作,用手工收集素材,非常艰辛。今天有计算机辅助,完全可以把制定教学词表的工作做得更科学、更有效。
教学词表是教学大纲的组成部分,教学词表应包括特定语域中最基本、最常用的词汇,因此,是从事语言教学、编写教材、进行语言测试的基础。
制定教学词表是一项严肃的科研工作,由于从事语言教学的教师背景不同、接触的语言材料不同,制定词表时不能凭经验,不能凭主观判断。为了摆脱选词中主观因素的影响,制定教学词表的原则应是定量分析为主,定性分析为辅,对进入词表的每一个单词仔细斟酌。
1)建立专用语料库
计算机为语言统计提供了强大的手段。所谓定量分析就是对语言材料进行统计分析,为此建立了专用语料库,即JD学术英语语料库。语料库是语言研究的强有力的工具。语言是一种海量现象,语言事实是一个不可穷尽的开放系统。语言研究不可能调查一切语言事实。统计学告诉我们,对于一个大数量的体可以采用随机采样的方法进行研究,只要样本在三个方面满足采样条件,样本就能反映总体的
基本统计特征,这时研究样本就近似于研究总体。这三个条件是:样本的代表性、采样的随机性、样本必须有足够大的量。根据大学英语课程
的性质,即“以英语为工具获取专业所需的信息”,决定JD学术英语语料库所采语料在性质上属学术英语(English for Academic Purposes)范畴,并保证文、理、工、医各科有一定的比例;语料库容量初建时为100万英语词,现已扩大到350万英语词,使统计结果具有一定的可靠性;另外,为了保证采样的随机性,决定每个语料单元为≥500英语词的连续的语篇,从随机抽取的英、美出版的书籍中按一定的规律随机采样;为使建成后的语料库能反映各种不同语体,还根据学生未来使用英语的需要确定语体的比例。JD学术英语语料库的结构和语体分布见表1和表2。
江苏省常州市邮编
2)选词的统计学标准
选词的主要统计学指标是频率、覆盖率和分布率。
语料库中每个连续的字符串称为标型(token),语料库的容量指的就是标型数;相同的标型称为类型(type);类型经过削尾处理(lemmatization)就是单词,可见类型是一个词的不同词形。词频是一个单词在一定的语料中出现的次数。每个单词的出现频率求出后即可编制频率词表,频率词表是制定教学词表的主要依据,见表3。词的出现频率按语料的不同而不同,但当语料库容量足够大时,词的出现频率和词在词频表上的位置即相对固定,这时词的频率就成为概率。
表3  JD 学术英语语料库频率词表实样
覆盖率表示从频率词表上按频率次序选取的一定数量的单词,在全部语料中所占的百分率,图1是词数与覆盖率关系示意图;
图1
频率词表上词数与覆盖率关系示
意图
图2频率词表上词数对数与覆盖率关系示意图
少年的你结局是啥如果词数用自然对数表示,则与覆盖率基本上为直线关系,其示意图如图2所示。例如,频率词表上的前128个单词,覆盖率达到50%;前2485个单词,覆盖率就达到85%。覆盖率对外语教学有重要意义,统计表明频率词表上的高频词是语言中使用最频繁的词,在有限学时的教学中自然应优先讲授。
选词时需要考虑的另一个重要统计指标是分布率,分布率分为篇章分布率、专业分布率、专业大类分布率。有些词出现频率很高,但只集中在一篇特定的文章或一个特定的专业领域中;另一些词则在各个领域出现频率都很高,显然后者应给予优先考虑,见表4。
为了综合考虑频率和分布率和影响,制定教学词表时可以采用下列选词指数经验公式:
祝钒刚家庭背景I={αlogF + βlogD
S  + γ(D
t
-l)}0.5×1000
其中:I:选词指数
F:频率
D
S
:专业分布率
D
t
:篇章分布率
α,β,γ:经验数字上学路上的景物描写
从词的统计特征看,词分为三类(见图3),在坐标上的一端是频率和分布率都极高的单词,这些主要是
功能词;在另一端是频率极高而分布率极低的词,这些主要是专业术语;介于两者之间的是频率和分布率均较高的词,称为次高频词(sub-frequent words)。显然,这些词应是语言教学的重点,而专业术语应由学生随着学习专业的过程自然积累。
表4  频数相同的4个词实例
图3三类词的统计特征
公司年会歌曲在制定教学词表时也广泛参考了其他常用语料库的频率词表,如Brow Corpus,LOB Corpus,COBUILD,American Heritage,Cambridge Lexicon等。
3)选词过程的定性分析
根据对中学生毕业时已掌握的实际英语词汇量的调查、大学英语课程学时数的限制和已定课程目标,确定大学英语四级要求掌握4000词,六级掌握5300词。这里所指都是根词,不包括派生词。在按选词指数确定教学词表初稿后广泛征求100位语言教学专家的意见,对反馈的意见也进行定量分析,按增、删、补分别进行排序,频率高的优先考虑;最后由词表科研小组进行定性分析,逐词进行仔细选择。定性分析的标准是:
星光大道云飞a)社会学标准:根据在我国从事大学英语教学的需要,酌量收入反映我国国情的单词;
b)语言教学标准:根据语言教学的需要酌量收入进行课堂教学必需的单词;
c)语言学标准:主要根据词的搭配能力、派生能力、联想能力、词的可用性(availability)、词的文化内涵、词的义项多寡等。
最后确定的教学词表,绝对数字并不大,但容量很大,能够满足课程目标所规定的交际需要,教学词表作为教学大纲的组成部分公布,是编写教学、组织教学和语言测试的主要依据。
2.阅读能力
阅读能力是我国大学英语课程的主要培养目标,阅读又是大学生毕业后获取本专业所需信息的主要手段。在教学过程中阅读能力的培养,始终占据最主要的地位;在语言测试中,大学英语四、六级考试试卷各构成部分的得分经过加权处理,阅读部分的得分权重最大,也是为了体现阅读能力是大学英语课程的主要培养目标这一思想。
阅读能力可以从阅读速度、阅读理解和阅读材料难易度等方面来进行量化分析。在阅读速度方面,对于英美大学生来说阅读中等难度的材料,其阅读速度量表见表5。
表5  阅读速度量表