我国汉语中介语语料库研究现状与热点透视——基于CiteSpace的可视化分析
蔡武;郑通涛
【摘 要】运用可视化分析软件CiteSpace5.0及文献计量方法,以1993年至2016年中国知网期刊全文数据库中汉语中介语语料库建设与应用研究的相关论文作为数据来源,对其进行统计分析;全面地梳理和考察了这些论文的发表年代、发文期刊、发文机构、核心作者及关键词聚类形成的研究热点,并绘制可视化知识图谱.这有助于理清当前我国汉语中介语语料库研究的知识结构和发展脉络,以期为未来该领域研究的深入与推进提供参考.
【期刊名称】《华文教学与研究》
吴彦姝个人资料介绍
【年(卷),期】2017(000)003
【总页数】9页(P79-87)
【关键词】汉语中介语语料库;CiteSpace;研究现状与热点;可视化分析
【作 者】蔡武;郑通涛
【作者单位】厦门大学海外教育学院,福建,厦门361102;厦门大学海外教育学院,福建,厦门361102
【正文语种】中 文
【中图分类】G250.74;H195
1995年,北京语言学院建成了中国第一个汉语中介语语料库。进入21世纪以来,随着汉语国际教育事业的不断深化,南京师范大学、中山大学、暨南大学等高校的汉语中介语语料库相继建成,汉语中介语语料库建设跨入了繁荣发展的重要时期。与此同时,口语语料库、多模态语料库、单国别及单母语背景学习者的中介语语料库、国内少数民族的汉语中介语语料库等不同形式的语料库也逐渐进入人们的视野(张宝林、崔希亮,2013);而与汉语中介语语料库建设热潮及形式多样化相对应的是,汉语中介语语料库的建设与应用给学界带来诸多新的课题。可以说,汉语中介语语料库不但为研究者探索汉语的语言现象提供了更多的语料资源,也极大地提高了汉语作为第二语言教学研究的水平(崔希亮、张宝林,2011)。
李毓芬承认整容20多年来,汉语中介语语料库相关的研究及学术成果不断增加。在这样的背景下,深入探究和挖掘当前该领域的研究现状与研究热点,是非常有必要的。为了客观地认识和把握汉语中介语语料库研究的真实情况,我们梳理了1993—2016年中国知网期刊全文数据库中汉语中介语语料库建设与应用研究的相关论文,并运用可视化分析软件CiteSpace5.0(版本为R1SE)及文献计量方法,对其进行统计分析。通过定量和定性的研究,我们全面地考察汉语中介语语料库建设与应用研究相关论文的发表年代、发文载体、研究机构、核心作者及关键词聚类形成的研究热点,并通过绘制知识图谱,用可视化的手段直观地呈现上述内容。本文的研究旨在更好地把握汉语中介语语料库研究相关领域的知识结构和发展脉络,同时为汉语中介语语料库未来研究的深入与推进提供参考。
迎奥运讲文明树新风2.1 文献来源
为保证研究对象完整,本文在中国知网期刊全文数据库高级检索中,以检索式“时间(不限—2016年)+主题(中介语语料库)+文献分类目录(中国语言文学)”进行模糊检索,共检索到188篇文献,又以检索式“时间(不限—2016年) +主题(‘汉语’并含‘中介语语料库’)”进行模糊检索,共检索到190篇文献,将两次检索的文献进行合并去重,剔除会议通知、新闻、会议综述、博士论文简介等,最终得到有效学术论文153篇。
2.2 研究工具
以往对某一领域研究的热点和前沿的研究大多采取传统的文献分析方法进行定性归纳。为了能更有效及客观地探测知识前沿,本文使用美国德雷赛尔大学信息技术与科学学院计算机与情报学教授陈超美开发的CiteSpace5.0可视化分析软件进行研究。该软件着眼于分析科学知识中蕴含的潜在信息并通过科学计量学以及数据和信息可视化的方法,揭示论文知识单元中的共现关系,如作者、机构、关键词的出现频次等(李杰、陈超美,2016:3)。该软件的一大特性就是可绘制知识图谱。知识图谱具有“图”和“谱”双重性质和特征,能显示知识单元与知识之间所隐含的复杂关系(陈悦、陈超美、胡志刚、王贤文,2014:16)。
目前CiteSpace可视化软件已经应用于二语习得研究、教育研究等多个领域(马晓雷、陈颖芳、侯俊霞、张宗波,2016;潘黎、王素,2011),以挖掘各研究领域的知识结构与研究热点,追踪其学术动态。我们根据在中国知网期刊全文数据库所收集的汉语中介语语料库建设与应用研究领域相关论文进行研究。这些论文时间跨度为24年,即1993—2016年,单个时间分区为1年,即共有24个单个时间分区。由于本研究文献数量有限,所以不设置节点阈值等限制条件,也不使用任何网络修剪算法,以保持知识图谱的完整性。
3.1 年代分布统计
文献的年代分布可以在一定程度反映某一领域的学术研究水平以及发展速度。我们绘制了我国汉语中介语语料库建设与应用研究相关论文的年代分布图(图1)。
从时间序列上看,汉语中介语语料库的相关研究起始于1993年,论文作者是储诚志和陈小荷,论文题目为《建立“汉语中介语语料库系统”的基本设想》。然而从1994—1999年这六年间,中国知网期刊全文数据库中并没有相关论文发表。直到2000年,中国知网期刊全文数据库中才开始出现第2篇论文。
从图1可以看出,从2000年到2004年这5年里,我国汉语中介语语料库研究领域论文发文数量较少,而其使用的语料主要来源于北京语言大学的中介语语料库。2005—2009年,发文数量开始增加,每年介于5~7篇之间。我们认为,除了越来越多研究者开始重视相关研究外,新的汉语中介语语料的建成也为该研究提供了条件。例如,王茂林(2005)使用暨南大学华文学院收集的“留学生汉语中介语语料库”对留学生“比”字句习得进行考察;林柱(2008)使用中山大学留学生中介语语料库对日本留学生在使用介词“对”时出现的偏误进行考察。2010—2012年,发文数量逐渐上升,基本保持在10~12篇。2013年开始,发文白梦妍为什么叫白鹿
中国四大奇书>电子商务策划方案数量急剧上升,但波动明显。其中,仅2013年一年就发文25篇,比2012年发表论文两倍还多,而2014年发文数量降到15篇,2015年又升至25篇,2016年再次回落到13篇。由此可见,伴随着汉语中介语语料库建设的蓬勃发展,汉语中介语语料库相关研究成果呈现急剧上升趋势,特别是2013年到2016年4年的论文数量为78篇,超过了前20年发文量的总和,但每年研究成果的发表数量还不稳定。
3.2 期刊分布统计
这153篇论文刊载在不同刊物上,我们将其按照期刊发文量进行降序排列,其中排行前8名的期刊如表1所示,这些期刊分别是《华文教学与研究》(原《暨南大学华文学院学报》)、《世界汉语教学》《语言文字应用》《海外华文教育》《语言教学与研究》《云南师范大学学报》(对外汉语教学与研究版)、《现代汉语(语言研究版)》和《汉语学习》。
表1列出发文量排名前8名的期刊,共发表89篇论文,是汉语中介语语料库领域研究文献的重要来源。依据布拉德福定律(邱均平,2007:105),核心期刊刊载文献量占文献总量三分之一。而通过计算发现,排名前四名的期刊发文量已经达37.91%,粗略估算,《华文
教学与研究》(原《暨南大学华文学院学报》)、《世界汉语教学》《语言文字应用》及《海外华文教育》四本期刊大致上形成了我国汉语中介语语料库研究的核心期刊。
3.3 核心作者统计
我们使用CiteSpace对这153篇论文的作者进行统计分析,共得到节点154个,即这些论文的作者共154位。在这些作者中,发文量最多的是张宝林,发表论文5篇;其次是崔希亮,施春宏、齐春红和张瑞朋各发表论文4篇;紧接着是杨德峰、肖奚强、邢红兵、刘汉武、萧频、苏向丽、李慧、石琳、李华等各发表论文3篇。
值得注意的是,这些作者不但发表论文数量多,且所发的论文多为高频被引论文。例如,在中国期刊全文数据库中,崔希亮于2005年发表的论文《欧美学生汉语介词习得的特点及偏误分析》被引量达218次(本文中被引量检索时间均为2017年3月26日),杨德峰于2003年发表的论文《英语母语学习者趋向补语的习得顺序——基于汉语中介语语料库的研究》被引量达184次,邢红兵于2003年发表的论文《留学生偏误合成词的统计分析》被引量为114次。我国汉语中介语语料库研究相关领域发表论文最多的作者共计发文5篇,根据普赖斯定律(邱均平,2007:193),将5的平方根再乘以0.749,即为1.67,取相邻最大
整数得到2。发文数大于或等于2篇的作者有33位,占所有作者数的21.43%。此外,这33位作者共发表论文86篇,占所有论文总数的56.21%,超过全部论文的半数,这些数据已满足普赖斯定律关于核心作者的条件要求。因此,我国汉语中介语语料库研究领域已经形成了稳定的核心作者。
此外,我们使用CiteSpace5.0软件可制作出该研究领域核心作者的合作知识图谱,如图2所示。从图2中我们可以看出,汉语中介语语料库研究领域的核心作者间存在合作关系。如张宝林与崔希亮、肖奚强与周文华、施春宏与张瑞朋、萧频与李慧、胡晓清与苏向丽、崔永华与陈小荷等均存在合作关系,组成学术共同体。而从节点分布来看,其他核心作者邢红兵、齐春红等也与他人合作发表论文。在154位作者中共有60对合作关系,我们认为这与汉语中介语语料库研究领域较新,已建成的汉语中介语语料库相对较少以及研究本身对技术和方法的要求较高有关。
3.4 发文机构统计
机构的发文量可以在一定程度上体现出相关领域的研究实力及影响力。截至2016年12月31日,中国知网期刊全文数据库中关于汉语中介语语料库研究的发文机构(按一级单位)中,
发文量超过3篇的机构共有10个。我们据此绘制了1993—2016年我国汉语中介语语料库研究发文超过3篇以上机构汇总表(表2)。
这十个机构都是高等院校,分别为北京语言大学,中山大学、北京大学、北京师范大学、鲁东大学、暨南大学、云南师范大学、南京师范大学、厦门大学以及四川大学。从表2中,我们可以看出,北京语言大学发文41篇,中山大学发文9篇,北京大学发文7篇,北京师范大学、鲁东大学、暨南大学各发文6篇,云南师范大学、南京师范大学各发文5篇,厦门大学和四川大学各发文3篇。这十所高校共发论文91篇,占所有论文总数的59.48%。发文量超过3篇的核心作者大多来自以上高校,并为上述高校在我国汉语中介语语料库研究方面贡献了绝大多数文章。
3.5 研究热点分析
关键词高度概括了论文的主要观点和研究主题,通过关键词我们可以对某领域的研究内容、研究方向和研究热点进行把握。基于CiteSpace5.0软件,我们根据关键词出现频次可以寻关键节点(研究的热点)以及计算节点的中心度(Centrality)。关键词出现的频次与研究热度成正比,关键词出现的频次越高,研究热度就越强(赵俊芳,安泽会,2014);
而关键词的中心度越高,则说明该关键词处于网络越中心的地位,在整个网络中的影响力和支配力就越强(尹丽春,2008:87)。我们以关键词为节点,时间分区为1年,绘制我国汉语中介语语料库研究热点知识图谱(图3)。
此外,我们根据关键词频次(3次以上)排序和中心度(0.02以上)排序的相关数据,制作了表3。结合图3和表3,我们可以发现,1993年到2016年间中国知网期刊全文数据库收录的153篇汉语中介语语料库相关论文中,频次出现3次以上的关键词共有24个。“中介语”是最大的节点,出现频次为33。其次是“偏误分析”“语料库”“中介语语料库”“对外汉语教学”“习得顺序”“汉语中介语”等。