欧亚语系的源头可能是中国东北
原文作者:Peter Bellwood
一项基于语言学、考古学和遗传学数据的“三重认证”显示,泛欧亚语系的源头是约9000年前中国的一农耕者,而农业亦是支撑其传播的基石。
Robbeets等人[1]对语言学、考古学及遗传学数据的一项分析显示,泛欧亚语系在大约9000年前发源于中国的辽河谷地,然后在约7000年前开始向朝鲜与俄罗斯远东地区传播。这些数据表明,泛欧亚语最早的使用者是在辽河谷地种植小米、饲养猪只的一人,他们身上有古代生活在中俄边境黑龙江谷地的人的血统。这项研究还指出,这泛欧亚语的早期使用者与黄河附近汉藏语系(包括汉语)最初的使用者是不同的。
泛欧亚语系(Transeurasian language family)是现代世界上分布最广的语系之一。有一派学者认为,这个语系包含了突厥语、蒙古语、通古斯语(其使用者生活于中国东北和西伯利亚)、朝鲜语及日语这几个语族。在《自然》上,Robbeets等人[1]另辟蹊径,以解决围绕该语系起源与传播的长期争论。
如今,在亚洲8000多公里的广袤土地上,分布有大约80种泛欧亚语。这些语言的使用者西到伊斯坦布尔,东至东京与首尔,北达俄罗斯的萨哈共和国。后者的领土一直延伸到西伯利亚地区的北极海岸,那里生活着放牧驯鹿、讲突厥语的雅库特人(也称萨哈人)。如此可观的大范围分布,堪比诸如印欧语和汉藏语等其它广布的语系。历史上,说泛欧亚语的有成吉思汗与忽必烈治下的蒙古人、1453年攻克了君士坦丁堡——即今伊斯坦布尔——的奥斯曼土耳其人,以及清王朝时期统治中国的满族人(通古斯人的一支)。
很明显,那些说泛欧亚语的人在古时曾“行万里路”。因此,我们也许可以问,最初是什么因素驱动了他们的扩散行为。他们是不是像历史上中亚地区的突厥人、通古斯人和蒙古人那样,过着主要饲养牛、羊与马的游牧生活?或者说他们在生活方式上是否更接近于早期朝鲜人、日本人、甚至邻近的中国人(他们说的是与泛欧亚语系无关的汉藏语),是以种植谷物、豆类和养猪为生的定居农耕者?
Robbeets与她的合作者们一起组成了一支多学科的大型科研“多国部队”。团队关注的不仅仅是泛欧亚语本身,他们还将这些语言的部分可能使用者的古基因组也纳入了考虑,并评估了这些人留下的考古线索。此外,团队还试图揭示泛欧亚语最初使用者的起源之地、了解他
们的谋生之道、以及确定这些语言传播的途径与时间。通过来自语言学、考古学和遗传学三个领域相关研究成果的“三管齐下”,Robbeets等人解答了上述问题。
首先,研究团队检视了泛欧亚语系的内部历史和谱系树。语系这个概念假定它的隶属语言是从一个共同的原始母语那里继承一系列同源(即非借用)词汇的。为探究原始泛欧亚语的存在、并重建其中代表关键文化概念的词语的涵义,Robbeets团队用统计学方法分析了现有最全面的泛欧亚同源基础词汇和农牧术语集。这项语言学分析的结果让团队成员将泛欧亚语的“故乡”定位在了约9000年前中国东北的辽河谷地及毗邻的低地地区,那里有是世界上最早开始种植小米的农耕人之一,此外他们还养猪,并且拥有纺织知识[2]。
然后,Robbeets团队将通过语言学重构的早期泛欧亚语使用者的生活方式与亚洲东北部地区的考古记录进行了比对。他们分析的数据库里包含了255个年代在1700~8400年前的新石器时代、青铜时代和铁器时代的考古遗址。这项比较分析支持的泛欧亚语主要起源地,是某个种植小米、饲养猪只的新石器时代聚落,这一人大约于8500年前之后生活在辽河谷地(由考古遗址的放射性碳定年数据支持),其环境使得人口快速增长。该观点与今年发表的一项独立考古学评估不谋而合,后者对黍(Panicum miliaceum)的早期栽培作了年代学研究,并发现在辽河东支沿岸,人类至少在公元前4500年就已经开始培育这种作物了[3]。
最后,Robbeets团队对来自大量骨骼样本的古基因组作了比较研究,以确定新石器时代中国东北部地区人在遗传上可能的祖先。他们获取的基因组证据表明,辽河谷地早期农耕者的祖源来自中俄边境的黑龙江地区,这支血脉曾经广泛分布于中国东北以及俄罗斯最东部的区域。这项遗传学研究的结果与今年早些时候发表的另一项分析亚洲东北部古DNA的结果相符,后者证明,现代蒙古语和通古斯语使用者的祖先也来自黑龙江地区[4]。不过,目前我们仍缺乏年代最早的辽河谷地农耕者(约8500年前)的古DNA数据,这使得学界无法对他们的起源盖棺定论。
如果Robbeets团队的结论正确,那么其意义一定在于即使泛欧亚语和汉藏语的早期使用者从新石器时代较晚的时候开始发生过明显的混血,他们最初也是分别来自黑龙江与黄河地区的两个遗传构成不同、且在地理上分隔的源种。寻新石器时代东亚最早一批农耕者的DNA仍是学界的当务之急[5]。
Robbeets团队所青睐的历史重构,将泛欧亚语系的起源与笔者长期以来所认同、且得到广泛支持的一种关于农业和语言传播的假说联系到了一起[6-8]。该模型为世界上包括汉藏语[9]在内的许多主要语系最初的扩散提供了一个解释,即此类扩散与人类生活方式从狩猎采集到粮
食生产的行为转变过程中发生的人口大量增长有关。诚然,很多后来迁移到中亚更干旱地区的泛欧亚语(尤其是突厥语、蒙古语和通古斯语)使用者主要是牧民而非农耕者。但是,这些人的扩散得益于他们在公元前2300年之后与欧亚大陆西部人的大规模文化交流,此类互动驱使他们引入驯化过的牛、羊和马,并开始从事乳制品的生产[10]。
Robbeets团队的工作在至少两个方面作出了重要的贡献。第一,它从计算语言学的角度为一个统一的泛欧亚语系的存在提供了支持。对于这个概念,语言学家之间是存在分歧的:一部分人一直认为突厥语、蒙古语和通古斯语隶属于阿尔泰语系,而日语和朝鲜语则与之不同[11]。第二,它强调了亚洲东北部地区最初的农业发展是推动泛欧亚语扩散的潜在因素,而非中亚地区后来专门的畜牧业的发展。在围绕泛欧亚语系起源的争论上,Robbeets团队的研究是增光添彩的一笔。
封面来源:pixabay