<Part1>
总的来说,语言学能够指出两种语言有多么相似,但是认定是否同种语言的问题,更多地是依赖于国家、民族、政治、历史等多种因素。比如克罗地亚语(Croatian)和塞尔维亚语(Serbian)其实完全是一种语言(统称塞尔维亚-克罗地亚语,Serbo-Croatian),只是前者采用了罗马字母,而后者采用的是西里尔字母(Cyrillic,就是俄语所用的字母),这与两个民族的历史文化有关。与此类似,捷克语和斯洛伐克语之间可以毫不费力地听懂对方,就象两种方言一样,但是人们传统上还是把它们看作两种不同的语言。
一种语言可以由两种书写符号(字母)表示,同样地两种语言也可以共用一套书写符号。如藏语,就是由于公元七世纪一个西藏喇嘛到克什米尔进修后引入了梵语字母(Sanskrit,即印地语的前身)这使它们看上去有些相似,然而这两种语言之间毫无联系:藏语属于汉藏语系而印地语属于印欧语系。
我们熟悉的汉语、日语和朝鲜语,由于后两者在中世纪时大量借用了汉字,人们一直怀疑它们之间有某种联系,然而至今为止尚未发现任何令人信服的证据证明它们之间有联系,实际上日语和朝鲜语与当今世界上任何已知的语言,无论是“活着的”还是“死了的”语言,都没有发现任何肯定的联系。
<Part2>
在研究了世界上一些主要语言以后,语言学家也象生物学家那样,把世界上的语言按相似程度分为语系、语族、语支和语种。世界上主要的大语系有:
语系代表语种占世界总人口比例(约)
印-欧英语、法语、俄语、印地语、波斯语48%
汉-藏汉语、藏语、泰语、缅甸语24%
尼日尔-刚果斯瓦希里语6%
亚-非阿拉伯语、希伯来语5%
马来亚-玻利尼西亚印度尼西亚语、马来西亚语5%
德拉维达泰米尔语3%
阿尔泰土尔其语、蒙古语、哈萨克语2%
除了上面这些“可以归类的”语言以外,还有几种所谓的“独立语言”:
日语(2%),朝鲜语(1%)和越南语(1%)。这些独立语言与所有现存的语言没有明显的联系,这当然也和它们研究得不够有一定关系。比如日语与朝鲜语可能有一些关系。具有讽刺意味的是,尽管它们都不同程度地采用了汉字作为书写语言的一部分,它们与汉语都没有联系。
当然谈到“世界的语言”,还应当包括几种“人造语言”,如世界语——Esperanto。尽管还没有人以它们作母语。
印欧语系是世界上最大的语系,覆盖了几乎所有的欧洲、美洲,和亚洲、澳洲的很大一部分。它包括两种伟大的古典语言:古希腊语和拉丁语;包括象英语德语,菏兰语(在比利时也叫佛兰芒语,Flemish)和瑞典语一类的日耳曼语族;包括象法语,意大利语和西班牙语一类的罗曼语族;包括象俄语,波兰语,捷克语和塞尔维亚-克罗地亚语一类的斯拉夫语族;包括象威尔士语和盖尔语(Gaelic,在苏格兰和爱尔兰)这样的塞尔特(Celtic)语族;包括巴尔的(Baltic)诸语言;包括伊朗的国语波斯语;包括诸如印地语、孟加拉语一类的印地语言;等等。
接下来我们可能会问:原始的印欧人生活在什么年代?是从何处“发迹”的?
现在不到原始印欧人留下的任何“书面材料”,因为人类使用语言的历史远比使用文字的历史久远。所以,最好的办法就是分析他们的语言。我们可以假定如果一个词在大多数印欧语言中都很相似,那就是一个他们已有的概念;反之就可以认为那是一个后来才知道的概念:这就是语言学重现“化石语言”所用
的方法。
通过重建古代印欧人的语言,我们大约可以了解到:原始的印欧人生活在寒冷的北方森林中一个不靠近水的地方,他们饲养的家畜有马,牛,羊和狗,他们知道的野生动物有狼和熊,他们知道的金属可能只有铜。许多人认为马和战车使他们在征战中能取得很大优势从而扩展到后来的辽阔地域。(玩过civilization的朋友们知道horse和chariot在古代战争中的作用:-)
一般认为原始印欧文明起自于公元前三千年,也就是五千年以前的东欧某地,大约在公元前二千五百年它分裂了,人们离开故乡分好几路向四面八方迁移。其中一路到了希腊,另一路到了意大利(这两路分别是古希腊和古罗马文化的起源)。另一路穿过中欧一直到达不列颠诸岛(他们是苏格兰人,爱尔兰人和威尔士人的祖先)。还有一路北上到了俄国,同时又有一路跨过伊朗,阿富汗最终到了印度。他们每到一处,就征服或同化当地的土著,把自己的语言传播到那里。应该说他们是一个出的民族。
<Part3>
许多语言可能是从一个祖先那儿演变出来的,这想法最早是在1786年提出来的,尽管早在十六世纪有人就注意到了梵语和意大利语之间的相似性。到了1818年,有五十多种语言归到了印欧语系中,然后在1854年,人们把独特的阿尔巴尼亚语也归了进来,1875年又加上了亚美尼亚语。如今在欧洲,只有芬兰语、匈牙利语、土耳其语、巴斯克语(在西班牙和法国交界处)
和前苏联境内的几种语言不属于印欧语系。
在亚洲,印欧语言出现在伊朗、阿富汗、巴基斯坦、印度和孟加拉等国家。值得注意的是,虽然在印度,印地语(Hindi)是最大的语言,但是操非印地语的当地原住民势力也很强大。印度有一百五十多种语言,但讲任何一种语言的人都不超过百分之三十。所以它在1947年独立时不得不同时采用印地语和英语作为官方语言——一半以上的印度人根本就不懂印地语嘛。在大约公元前一千年印欧人入侵以前,当地原住民所操的德拉维达语系(如泰米尔语)
和蒙达语系,如今在印度中、南部人口中仍占很大的比例。在巴基斯坦和孟加拉国大部分人讲印欧语言。他们都能在一定程度上听懂印地语,但互相之间却很难听懂。一个学法律的孟加拉朋友告诉我,他认为二十年前巴、孟分裂成两国,除了地理上的隔阂外,语言上的隔阂也是一个重要因素。
印欧语言之间究竟有多象?印欧语言与非印欧语言的差别有多大?看看几个“基本词汇”之间的比较:
英语month mother new nose three
威尔士语mis mam newydd nos tri
德语Monat Mutter neu Nase drei
瑞典语ma^nad moder ny na"sa tre
法语mois me`re nouveau nez trois
西班牙语mes madre nuevo nariz tres
意大利语mese madre nuovo notte tre
俄语mesyats mat' novy nos tri
希腊语men meter neos rhis treis_ _
波斯语mah madar nau bini se_ _
梵语mas matar nava nas trayas
芬兰语kuukausi a"iti uusi nena" kolme
文明用语有哪些词语匈牙利语ho'nap anya u'j orr ha'rom
土耳其语ay anne yeni burun u"c,
(记得去年网上有不少人与锺先生争论说世界语(Esperanto)不是世界语而仅仅是欧洲语言的代表,我们也可以看看它与印欧语言的联系究竟有多强。:-))
<Part4>
英语,作为当今世界事实上的国际社交语言,它取得的成功是史无前例的。从使用它的人口来说,以英语为母语的人数仅次于汉语而居世界第二位,大约有四亿多人。然而以英语作为第二语言、或者在一定程度上使用英语的人数,要远比这多得多,可以说分布在世界的各个角落、各个民族,在这一点上汉语是望尘莫及的。它是怎样发展起来的?
英伦三岛的第一批印欧居民是塞尔特人。原先岛上可能还有更早的居民,但是人烟稀少,所以没有留下多少遗迹。前文提到,塞尔特人是古印欧人的一支,大约在四千五百年前离开他们在东欧的故乡向西迁移,在公元前一千年时(相当于我国商朝末年、西周初年),他们成了德国南部、阿尔卑斯山北麓的一个强大民族。在公元前五百年左右(相当于我国春秋时期),他们开始向西迁移,后来到了英伦诸岛。这就是印欧人的第一次“入侵”。
印欧人的第二次入侵是在公元五世纪中叶,当时生活在现在的德国和丹麦交界处有两个部落,一个是石勒苏益格(Schleswig)的盎格鲁(Angles),另一个是霍尔施坦因(Holstein)的萨克森(Saxon)。石勒苏益格/霍尔施坦因现在是德国最北面的两个州,是第一次世界大战时德国从丹麦那里“取得”的。这两个部落从那里跨过北海,占据了英格兰,原来的塞尔特人很快地后退到威尔士、爱尔兰和苏格兰高地。English一词就出自Angles,原意为“角落”,意即他们来自欧洲大陆的一角。在古英语中Angle写作E
ngle,他们的语言叫做Englisc(在古英语中“sc”读如“sh”,如“sceap”——“sheep”)。顺便说一句,“塞尔特”(Celt)中的c可以读如s或k,所以也叫“凯尔特”,美国人中有许多来自苏格兰和爱尔兰,所谓的“美国腔”可能是凯尔特口音。波士顿不是有个著名的球队叫“凯尔特人队”嘛。
古英语一直发展到公元1066年法国的诺曼人入侵。在此以前,由于受北欧人和罗马人的影响,许多斯堪地那维亚词汇和拉丁词汇溶了进来。前者如egg,cake,skin,leg,window,husband,sky,fellow,skill,anger,flat,ugly,odd,get,give,take,raise,call,die,they,their,them;后者如street,kitchen,kettle,cup,cheese,wine。塞尔特语的遗迹大多留在地名中,如Thames,Kent,Dover。
诺曼人的入侵为英语带来了大量的法语词汇,这使得现代英语中存现大量的同义/近义词:shut/close,answer/reply,smell/odor,yearly/annual,ask/demand,room/chamber,wish/desire,might/power(英语词/法语词)。有一个有趣的现象是产肉的动物多是英语词,如ox,cow,calf,sheep,swine,deer,而它们的肉则是法语词,如beef,veal,mutton,pork,bacon,venison。大概持法语的多为贵族统治者,只注意他们餐桌上的肉,并不在意牲畜们叫什么。
另外在已有的英语/斯堪地那维亚语同义词基础上,如英语的wrath和斯堪地那维亚语的anger之外,法语又加了个ire。连我们汉语也贡献了几个词:kowtow(叩头),typhoon(台风),sampan(舢板),kaolin(高岭土),tea(闽方言),shanghai(不是地名:-))。
这些外来语使英语成为一个表达力丰富的语言。尽管溶入了如此众多的“外来语”,古英语仍然构成了它的核心——不到五千的古英语单词一直保持到了今天。在此期间英语逐渐向高层发展,1399年继承王位的亨利四世是第一个以英语为母语的英国国王。在十四世纪快要结束的时候,乔叟(Chaucer)完成了『坎特伯雷的传说』(Canterbury Tales),以伦敦方言为代表的现代英语终于开始出现:一个来自当年“角落”的语言。
<Part5>
在结束讨论印欧语言时,再顺便举个例子说明语言学研究对于其它学科的帮助,如史学和民族学。欧洲有个民族叫吉卜赛,他们是什么人?从哪儿来?这问题长期没有答案,好象他们自己也说不清楚,因为直到不久前他们中的大多数还是文盲,没有文字记载的历史。以前有人根据英语“吉卜赛”(Gypsy)
一词认为他们来自埃及(Egypt)。后来通过对他们语言的仔细研究发现他们来自印度——从他们的语言(叫做Romany)与梵语及后来的印地语的共同特征中得不出任何别的结论。吉卜赛人从公元(后)一千年左右开始向西迁移,途经的波斯、亚美尼亚和希腊都在他们的语言中留下了不同时期的痕迹。现在听到一些老美爱说“pal”,这词就来自吉卜赛语phral,意为“兄弟”。
好,终于轮到汉-藏语系的故事了。汉藏语系里有一个“大家伙”,不用猜就知道。它占汉藏语系总人口的85%以上。不过,对于非印欧语言的语言学研究都不如印欧语系那样深入,它的起源、发展、演变等
都有许多问题有待解决。
有一个笑话说,从前有个人认字只看个大概,一次有个不识字的问他路边一家铺子叫什么字号,那店铺上书:“天义斋”(用大五码看“天義齋”)。他看了一眼说:
“叫…大盖齐‟”。咱现在也只能来他个“大概齐”了……。
汉藏语系分四个语族:汉语自成一家;藏-缅语族,包括藏语和缅甸语这两大语种,以及彝、僳僳、纳西、拉祜、景颇、京等上百个小语种;泰-老语族,包括泰语和老挝语这两个国语,以及壮、布依、侗等几个小语种(壮语不应算小语种!有一千多万人讲壮语,比一些小的语系还大,他们不是还有自己的自治区嘛);还有一个苗-瑶语族,由苗语和瑶语组成。另外,不少人认为越南语与汉语有远亲关系,事实上越南语有一半的词来源于汉语,但是它们的关系仍有待进一步研究。
讲汉藏语言的人除了在中国以外,还分布在缅甸、印度、尼泊尔、泰国、老挝等国,以及在东南亚和世界各地的华人中。总之,持汉藏语言的各民族中,汉族生活在最北面。
<Part6>
汉语是论人口世界上最大的语言,有十多亿人以汉语为母语:这包括在台湾的二千万、马来西亚的五百万、泰国的五百万、香港的五百万、新加坡的二百万、印度尼西亚的一百万、越南的一百万等。汉语是
联合国1945年成立时的五种工作语言之一(1974年又加上了阿拉伯语)。
汉语有七种主要的方言:北方方言约占总人口的四分之三,所覆盖的地域包括中国的东北、华北、西北、山东、河南、湖北和安徽、江苏的长江以北部分、四川、云南和贵州的汉族人聚居区,在另外还有一些北方方言的“孤岛”在福建、广西和海南;吴方言,通行于江苏的长江以南部分、浙江和上海市,人口有七千万,是第二大方言;粤方言,主要流行于广东、广西和海外华人中间,约有六千万人;闽方言,通行于福建、台湾和东南亚诸国,约有六千万人,其中情形十分复杂,到了互不通行的程度,可能是汉人在秦汉时代南侵时与当地的语言交互的结果;湘方言通行于湖南;赣方言通行于江西,这两种方言的特征不太突出,受周围方言的影响较大;还有客家话,主要分布于广东、广西、福建和台湾。这些“方言”之间差别常常是很大——比如北京人听广州人讲话,决不比英国人听法国人讲话轻松,台湾人去听陕西话,也会听得一头雾水。是什么理由语言学仍把这些方言统统归为一种语言?除了长期以来的统一民族、统一文化和统一国家这些因素以外,还有一个重要的原因是文字——汉字。
从商朝的甲古文开始,汉字有三千多年的连续历史,三千多年来汉字的字形、字义的变化都是连续的。与大多数其它语言不同的是,汉字的发展经历了一条象形—表意—形声的途径。这条道路产生了两个主要效应:第一,随着文明的不断发展,语言所要表达的概念不断增加,使得汉字拥有了一个数量庞大的字符集(虽然现代汉语已经不用增加字符来表达新的概念,而是创造新词,这在一定程度上减少了使用的字数)。汉字的庞大的字符集使它显得非常复杂:难学、难记、难用;第二,历史上的汉字作为表意
文字(ideograph),文字与语音没有直接关系,无论用哪种语言或方言去读,意义没有变化。这是
发布评论