语料库的分类\创建和检索简述
赵丽颖的弟弟赵建飞随着计算机技术的发展,语料库开创了新的研究方向,引起了越来越多的注意。本文将简单介绍语料库的概念、分类、创建和检索及其在应用中的优越性和局限性,使相关爱好者初步了解语料库这一新的范畴。儿童演讲稿>快乐再出发
标签:语料库;平行语料库;类比语料库;创建;检索 李连杰和利智
1.引言
大陆喜剧电影自20世纪中期, 美国布朗大学创建了世界上第一个语料库,即标准美国英语布朗语料库,开创了语料库研究的先河,到20世纪80年代,这一星星之火开始渐渐有燎原之势,上海交通大学杨惠中教授便在这一崭新的浪潮之下,于80年代中期率先建成中国第一个真正意义上的语料库,即上海交大英语科技语料库、接着像中国学习者英语语料库、大学英语学习者口语英语语料库、北外的汉英汉日平行语料库等陆续建成,并且还吸引了一些教授、博士生、硕士生的目光,开始把研究方向转向语料库研究,为中国语料库研究的发展注入了新的力量,同时也推动了基于语料库的语言学研究和翻译研究的发展.
2.语料库的定义及分类快捷支付怎么开通
语料库是以计算机储存大量的真实语料,对语料做各种带有研究目的的加工标注,利用研制的检索工具对标注语料进行快捷的搜寻和分类,以发现并分析以往因条件限制而未能注意的语言现象(王克非,2004)。研究的性质和需要决定着语料库的性质,根据语料库中收集语料的种类多少可以分为,单语语料库、双语语料库和多语语料库(王克非,2004)。单语语料库指只收集一种语言的语料库,早期开发的语料库大多都是单语的,如布朗语料库。双语语料库指收集两种语言文本的语料库。多语语料库指收集两种以上语言文本的语料库。而双语和多语语料库又可以分为平行语料库、类比语料库和翻译语料库三类。平行语料库又可称为对应语料库,是由原文和它对应的译文文本构成的,可以有词语、句子和段落三种级别的对应关系;类比语料库是由同一语言不同变体的文本或不同语言的文本构成;翻译语料库是由具有翻译关系的不同语言的文本构成,它和平行语料库的区别在于,它仅仅只是篇章上的对应关系,不一定有其它级别的对应关系如词语、句子和段落等。这三类语料库的区别主要在于语料库的文本之间是否具有对应关系和翻译关系。
发布评论