- 188
吉杰-校园英语 / 翻译研究
《》英译语料库的构建及研究意义
大连民族大学/陈童节 钱程 通讯作者/宋昕
【摘要】《》英译语料库构建的最初目的便是服务于中外译者,令有关藏文化的翻译更加标准与便捷。为提升我国的文化软实力,典籍翻译的重要性不言而喻,因此语料库的使用范围相当广泛。本文旨在探讨《》英译语料库的构建过程及研究意义。
【关键词】 语料库 典籍 翻译
一、引言
随着世界经济全球化的进程,越来越多的国家、地域与民族间的‘界限’被打破。与此同时,经济的快速发展带来了大范围的人口流动、文化的传输与融合以及与多样的文化亲密接触的机会。许多学者的目光也开
始更多地投向对各少数民族文化的研究,尤其是已经形成自己独特体系的藏族文化,具有极高的研究价值及学术价值。民族典籍作为重要的研究材料之一,承担着对外输出藏族文化的重任。而对于民族典籍系统准确的翻译便成为了重要的沟通桥梁,打破了在不同时代背景下滋生出来的多样的文化之间的‘隔阂’。当翻译工作者翻译这些典籍时,亟需一个包含相关藏族人名、地名、风俗习惯等词汇的语料库。《》英译语料库的构建系统、全面的搜集了《》中的相关藏族特有词汇,此语料库的构建可将藏族语言翻译系统化,规范化,为相关翻译工作的效率提升奠定基础。
二、英译语料库的构建过程及结果
夸克(1959)带领建成了世界上第一个语料库,基于当时进行的英语用法调查,完成的《现代英语语法》对现代英语进行了系统全面的描写。这个语料库在语言学界产生了深远的影响。而今,语料库是以电子计算机为载体承载语言知识的基础资源,且语料库中存放的是在语言的实际使用中真实出现过的语言材料并经过加工整理。由此我们可以明确,在收集资料的过程中需要进行合理的筛选,选择真实可信的材料。真实可信,是本研究构建语料库的基本原则。
语料库按性质分类,可包括四个类型:1)异质的(Heterogeneous):即没有特定的语料收集原则,广泛收集并原样存储各种语料。2)同质的(Homogeneous):只收集同一类内容的语料。3)系统的(Systematic):根据预先确定的原则和比例收集语料,使语料具有平衡性和系统性,能够代表某一范围
内的语言事实;4)专用的(Specialized):只收集用于某一特定用途的语料。本研究所构建的《》英译语料库属于系统的语料库。
具体而言,本研究在构建《》英译语料库时大致分为以下三个步骤:
1.确定语料库的收集范围:由于《》这一史诗具有极高的神话传说彩,并且在藏族和蒙古族中均有不同版本的记载流传下来,这对我们的前期资料搜集造成了不小
的困难。对于在本书中所涉及的地名官职等有实可考的名词,我们在翻译中基本以使用最为广泛的译法为基准。对于音译的,没有固定标准的词语,我们则尽可能选用转译次数最少的译法。而对于大多数在本书中出现的专有名词(即格萨尔中特有的名词)主要参考了吴伟先生的译本,同时参考、国家图书馆数据库等进行专业系统的考证。
2.语料库的采集与整理:语料库的语料应该来自于具有明确主题的完整文本或一致主题的文本集。《》英译语料库的词汇样本基本来自于《》原文以及相关民族典籍,后期经人工进行手动筛选与整理。由于年代久远,版本多样,语料的整理变成了一项相当庞大的工程。为了保证所建语料库的丰富性与准确性,语料的清理与整理是本研究的重点。作为重要的民族典籍,《》的语言也具有直白质朴的特点,因而在本研究中我们主要采用了直译的研究方法并对原有的多种译法进行筛选。典籍中大量需要音译的人名地名最具有代表性,对于同一个单词我们搜寻了多种译法,剔除了经过二次
或多次转译的版本,从而保留了在读音与意义上都与原文最为相近的译法。
3.将语料导入语料库:在将语料导入的过程,我们主要使用了MonoConcPro 软件。
该软件主要处理以txt 结尾的记事本文件。我们将整理好的语料保存为txt 格式,通过软件的File 菜单将文件导入到软件中。然后我们进一步处理文档,通过软件的Frequency Order 功能自动统计词汇频率,再用Alphabetical Order 进行排序并用Save as file 保存(保存为All files 格式,方便以后使用EXCEL 等软件进一步编辑和导入,方便快捷)。一个简单的语料库就基本形成了(《》英译语料库部分见表1)
表1 《》英译语料库部分地名
岭地/岭噶布/岭国
Ling/Ling Garpo/the
State of Ling
德雅达塘查茂Teya Tatang Chamo
南赡部洲Southern Continent of
the earth 长系部落Sersi Tribes
藏区Tibetan areas 文布六部落Wenbo tribes 牛尾洲
Cow-Tail Contient 则拉Chelha 罗刹(国,地,族)
Richa/Raksasa 札朵秋峡谷Zhadorcho Gully 德庆坝子Techin Pazi 鲁古Logo 嘉雅桑多白日山Gyasangdobari Mountain 玛麦玉隆松多
Mamei Yulong
Songtog 西方极乐世界Western Paradise 嘉洛部落Chalho Tribe
朵康地区Torkang 阿玉底山Ngayoti Mountain 玛杰邦日山Magyipamri Mountain 鲁底山Loti Mountain 吉杰达日山
Gyigyitari Mountain 玛麦Mamei
三、英译语料库发展中存在的问题
1.语料库的代表性、完善性与标准化难题。语料库对于其应用领域来说,要具有足够的代表性,这样才
能保证基于语料库得出的知识具有普遍性和较高的完备性。由于真实的语言应用材料是无限的,语料库的样本有限性的特点是无法回避的。再加上藏语本身懂得的人数又少而其失传的语料又
校园英语 / 翻译研究
较为多,因此语料收集的完整性十分困难。而且有些藏语对应的解释较多,在不同语境中有着不同的含义,而我们在搜集这些语料时很难分别到他们所对应的所有解释。然而我们还是尽了我们最大的努力搜集去整理。尽量使我们所构建的语料库不失完整性与规范性,并使有限的样本语料尽可能地反映无限的真实语言现象。
2.需要独立的搜索引擎问题。我们此次构建的语料库采用简单方便的Excel软件。目前,语料库检索程序有concapp, AntConc, HyConc等等。并没有统一的规范的语料库检索程序。有些搜索引擎面向中文,有些面向英文,如果把世界所有语言都含纳,那就不失为一个优秀的搜索引擎了。而且,这些语料库检索程序水平参差不齐,而又各自存在各自的优缺点。如果可以规范语料库的搜索引擎,便可优化语料库。
3.语料库的资源共享问题。全世界研究语料库的人众多,构建语料库的亦很多。由于资源扩散的狭隘性,没人能保证保证每一个语料库构建后都得到广泛的应用。在搜索引擎上到我们所需要的语料库也不是一件容易的事。当我们构建完英译语料库,把它投入使用虽然不是一个难题,然而要想让更多的人去了解它,去应用它,便不是一件容易的事了。因此,我们需要一个规范化的独立的语料库搜
索引擎,让所有的语料库都能够在合适的平台上收录,得到应用,发挥它应有的价值。
4.语料库的局限性。语料库只能给我们关于某种语言现象的频率高低的信息,但是不能给我们某种语言现象是否可能的信息;语料库只能告诉我们语言事实本身,但是不能进行推理;语料库只能给大家提供例证,但是不能对例证提供解释,对于例证的解释要依靠语言学家对于语言的直觉和内省。
四、《》英译语料库的构建意义
在文化背景大不相同的族间,经过漫长的岁月形成并流传下来的语言不仅是复杂的、零散的,而且会形成独特的语言体系。而以藏语为代表的少数民族的语言由于流通地域小使用人数少等因素,不仅造成了藏语人才的稀有,也对其民族语言文字的翻译造成了极大的困难。而在我国从事翻译行业的人士中少数民族仅占有极小的比例,在翻译过程中对大量描述少数民族风俗习惯的词汇翻译难免会出现歧义。语料库本质是基于大数据之上的,所以它的实用性无需多言,常见的词汇APP基本都是以语料库为基础构建的。况且现在市面上常见的以藏族为代表的中国各个少数民族典籍往往经过了藏文到中文再到英文甚至更多层的翻译过程,并且大量需要音译的人名地名等等往往也会出现相当多种完全不同的翻译。此时,要想进行高效而又准确的翻译工作,语料库的构建就显得很有必要了。
在此次翻译过程中,我们基本上是采用了直译的方式,格萨尔《格萨尔》作为目前已知世界上最古老的史诗,或多或少的在语言文字上具有局限性。并且藏语相对于汉语而言,表述方式更加简单直白,这确
实给我们的翻译工作减轻了很多负担。
在对《》进行初步翻译时,遇到了诸多的人名、地名以及表述藏族与众不同的风俗习惯的词语。一度对像‘阿玉底山’‘古热石山’这样简单地名的翻译无从下手。几经周折,查阅资料才到‘Ngayoti Mountain’、‘Aori Stone Mountain’这样的译法。而如果有一个相对应的语料库能统一并规范词汇的译法,不但给典籍的翻译工作减轻了负担,也为读者减少了许多麻烦。像‘鲁古’‘德雅达塘查茂’这样的词汇仅需几秒钟便知道它的正确译法。阿特金斯等人认为语料库是“按照明确的设计标准,为某一具体目的而集成的大型文体库。”因此,语料库的开发具有明确而具体的目的。而《》英译语料库的构建必将对学者及译者提供极大的便利
五、结语
《》作为藏族文学的传世典籍,里面包含的大量的神话习俗,充分表现了温良恭俭让的古代藏族人民对于真实世界与自然的爱与敬畏,并将其表达为文字、知识一代又一代的传播下去。而通过我们的工作将特定的词汇提取为特定的词,进而整理成基于大数据之上的语料库,这不仅是为了提供给诸多译者提供方便,也表现出在文明不断向前发展的过程中,人类对与某一类型语言运用的常态。
通过对《》原文的处理,我们也深刻意识到少数民族文化的迷人之处,作为世界文化体系的不可分割的一部分,我们希望通过我们每个人的努力,吸引到更多的人关注少数民族文化。中国作为一个
庞大的多民族国家,各个民族之间的和谐统一是国家稳定发展必不可少的前提,对不同民族文化的深入了解无疑是民族间合作交流的基础。在此我们希望《》英译语料库的构建起到一个抛砖引玉的作用,并通过更多人的努力,将类似语料库做的更加详尽完善,使得少数民族典籍能够被转译为更加系统准确的文字供世界各国人民阅读、研究,在整个全球化的大背景下,真正的打破民族之间的界限,平等友爱的相处下去。
参考文献:
[1]黄昌宁.语料库语言学[M].北京商务印书馆,2002.
[2]曹竞.语料库语言学实用入门教程[M].北京理工大学出版社,2012.
[3]卫乃兴,李文忠,濮建忠等.语料库应用研究[M].上海外语教育出版社,2005.
*大连民族大学创新创业训练计划项目(校级A,XA201604121)
作者简介:
陈童节(1995-),女,满族,河北承德人,本科在读,大连民族大学外国语学院英语系。
钱程,女,汉族,辽宁锦州人,学生,在读本科生,化学工程与工艺 大连民族大学生命科学学院化学工程系。
通讯作者:宋昕(1983-),女,汉族,河北河间人,讲师,博士,研究方向:认知心理语言学。
- 189 -
发布评论