本文系2020年度国家社会科学基金一般项目“武陵民族地区濒危传统技艺口述史料采辑与保护利用研究”(20BTQ037)研究成果。
收稿日期:2020-07-11图书馆特数据库建设实践与探索
———以“土家族口述史料”数据库为例
彭 燕,张心悦,何 轩
(吉首大学图书馆,湖南张家界 427000)
摘 要:以吉首大学图书馆“土家族口述史料”数据库建设为例,通过对土家族口传文化传承概况分析,探讨了“土家族口述史
料”数据库建设的意义与原则,详细介绍了该数据库建设中的主要策略与技术,旨在有效保护土家族口传文化,探索民族口述史料数据库建设新模式。关键词:民族文化保护;土家族口述史料;图书馆;特数据库建设中图分类号:G250 74    文献标识码:A   文章编号:1003-7136(2021)02-0024-05
PracticeandExplorationonConstructionofCharacteristicDatabaseinLibrary:Casestudyof"Tujiaoralhistoricalmaterials"database
PENGYan,ZHANGXin yue,HEXuan
Abstract:Takingthe"Tujiaoralhistoricalmaterials"databaseinJishouUniversityLibraryasanexample,thispa peranalyzesthegeneralsituationofinheritanceofTujiaoralculture,discussesthesignificanceandprinciplesoftheconstructionof"Tujiaoralhistoricalmaterials"databaseandintroducesthemainstrategiesandtechnologiesinthedatabaseconstructionindetail,aimingtoeffectivelyprotectTujiaoralcultureandexplorethenewpatternofna tionaloralhistoricaldatadatabase Keywords:nationalcultureprotection;Tujiaoralhistoricalmaterials;library;characteristicdatabas
econstruction
民族文化是某一民族历史积淀、精神所在与不断发展的动力,相关史料则是记录民族文化精神、反映民族历史发展的重要载体。民族地区高校图书馆除了为教学、科研提供信息服务之外,还肩负着保护民族文化、集藏民族史料的社会职责,随着数字技术的不断发展,民族特数据库建设是实现其职责的重要方式。相关研究方面:于爱君以鄂伦春族文化专题数据库建设为例,提出特数据库建
设是图书馆数字资源建设的重要内容[1]
;张旭等从图书馆实际需要出发,就西域民族文化资源数据库建设方案进
行了探讨[2]
祁兴兰对民族地区高校图书馆特资源数据库建设现状、问题进行了调查分析,提出具体对策建议等[3]。
民族文化是彰显地域特的重要资源,保护民族文化
就是保护一个地方发展的文化资源和文化资本[
4]
。如何对民族文化进行有效保护,已成为时代赋予我们的历史使命。武陵山片区位于湘鄂渝黔相交地带,境内有土家族、
苗族等3
0多个少数民族,是我国民族文化最集中、种类最多样的地区之一,但该区域很多民族文化濒临失传,相关
史料储藏分散、保存不一、流失损坏严重。吉首大学作为武陵山片区唯一的综合性大学,其图书馆十分重视地方民族史料的集藏工作,目前已征集大量与土家族口传文化相关的口述史料,成为土家族口述史料重要的集散地。本文结合吉首大学图书馆(以下简称:我馆)“土家族口述史料”特数据库建设的工作实践,对民族文化保护背景下民族地区高校图书馆特数据库建设进行探讨,旨在有效保护少数民族文化,更好履行图书馆特藏资源建设与共享的职责。
1 土家族口传文化概况
土家族世代居住在崇山峻岭的武陵山片区,人口约为835万人,是我国第八大民族。土家族有本民族语言但无文字,在漫长的历史发展中,土家人依靠口传心授传承该民族文化。因无本民族文字记载,
土家族历史上缺乏书面文化,致该民族传统文化均为口传文化,传承概况如下:
表1 土家族主要口传文化传承概况一览表
种类类别文化表现传承现状
民族语言北部方言以湖南龙山、保靖、永顺县为代表深度濒危南部方言以湖南泸溪县为代表深度濒危
宗教信仰祖先崇拜敬家先、祭远祖、崇拜土王濒临消失自然崇拜信奉山神、猎神、灶神、土地神、五谷神濒临消失图腾崇拜青龙、白虎濒临消失神灵崇拜重巫信鬼,盛行巫术活动濒临消失
风俗习惯传统建筑吊脚楼、转角楼、摆手堂、花桥濒临消失传统服饰
尚简朴,头缠青丝帕;男上穿琵琶襟,下宽
会议欢迎词范文挡裤;女上无领满衣,下穿大脚裤。
基本消失传统饮食炒米、糍粑、腊肉、酸辣子、糯米辣子部分传承婚姻生育哭嫁、满月、出月、挖周濒临消失丧葬亡人超度、做道场濒临消失
民族节日过赶年扫尘、打糍粑、炒炒米、煮猪头、送亮部分传承舍巴节奏咚咚喹、跳摆手舞等祈祷家
人团聚濒临消失六月六纪念土家英雄覃篨、晒衣服器物部分传承
工艺美术女红挑花、织锦、刺绣部分传承雕刻石雕、木雕、砖雕濒临消失编织藤编、草编、竹编濒临消失
文学体育民间文学故事、史诗、叙事、传说、谜语、谚语、曲艺濒临消失民族体育打飞棒、舞龙、硬气功、高脚马、打陀螺部分传承
音乐舞蹈民族音乐薅草锣鼓、梯玛歌、摆手歌、哭嫁歌、孝歌濒临消失民族舞蹈茅古斯、摆手舞、八宝铜铃舞部分传承
  从表1可以看出:土家族口传文化形式多样、内容丰富,但随着经济全球化的快速发展,在外来文化和现代技术的强势冲击下,土家族口传文化正遭受严重侵蚀与破坏;土家族语言已深度濒危,传统服饰基本消失(现代土家族服饰是经其他民族服饰改良而成),很多口传文化濒临消失,只有传统饮食与女红等在部分传承,迫切需要利用现代信息技术对土家族口传文化进行抢救性保护。
2 “土家族口述史料”数据库建设的意义
口述史料是通过有计划地访问当事人或知情人,根据他们口述亲历亲闻,而挖掘、整理出来的文字、图片、录音与视频等具有保存价值的原始史料或资料。土家族口述史料不仅是记录土家族口传文化的
重要载体,也是研究该民族历史文化最原始的凭证。我馆建设“土家族口述史料”数据库(以下简称:建库)具有如下意义:
2 1 有效保护土家族口传文化
民族口传文化具有的多样性、地域性和濒危性使其口述史料集藏具有重要的文化保护意义。了解与掌握土家族口传文化的人大多是年岁已高的老人,随着岁月的流逝,他们将逐渐衰老、逝去,所掌握的口传文化和口述史料也将随之消失。同时,愿意学习土家族口传文化的年轻人也越来越少,导致其文化传承面临后继无人的困境。在此情形下,如何有效保护土家族口传文化成为当前亟待解决的问题。建立“土家族口述史料”数据库,是利用先进数字信息技术,将征集到的土家族口传文化资源以文字、图片、音视频等形式进行数字化储存,再通过互联网发送与共享。这不仅能有效保护土家族口传文化,还能使对土家文化感兴趣的用户通过该数据库获取信息并利用,从而促进土家族口传文化更为广泛地传播。
2 2 实现土家族口述史料共享
征集民族口述史料必须利用民族学、图书馆学与口述历史等学科的理论与方法,为避免重复征集,征集者必须对前期相关研究和成果进行鉴定与分析,以获取珍贵的第一手口述史料。我馆自20世纪50年代建馆以来,一直致力于武陵山片区土家族、苗族等少数民族文献史料的收集与整理工作,目前
馆藏有地方少数民族文献20000余册。尤其自2010年以来,我馆对土家族濒危口述史料展开了大规模的征集工作,已征集相关口述文字史料700余册,口述实物图片3000余张,口述访谈音视频300余小时,照片2000余张等,形成了以土家族濒危口述史料为特的馆藏体系。以此为契机建库,对征集到的土家族濒危口述史料与原馆藏相关史料进行数字化整合、编辑、保存与呈现,将有助实现土家族口述史料的共享与利用。
2 3 有利土家族口述史料管理
特藏资源是一个图书馆独特价值的体现,国内外很多图书馆都很重视特藏资源的集藏工作[5],随着数字技术的不断发展,都开始将馆藏特藏资源进行数字化处理与管理。我馆非常重视地方民族史料尤其是土家族口述史料的集藏工作,征集到的土家族口述史料形式多样、内容丰富,如何对这些口述史料进行有效管理为我们提出了更高要求。首先,建库可对我馆馆藏和散佚于民间的土家族口述史料进行集中、系统的管理,最大限度增加馆藏特资源的集藏量;其次,数据库中的独立应用程序,不仅能为“土家族口述史料”数据库的运用、优化与扩展提供方便,也能提高该库稳定性;再次,数据库中的口述信息资源可随时进行更新与维护,使其整理更便捷、管理更科学,最终实现土家族口述史料管理的系统化和规范化。
3 “土家族口述史料”数据库建设的原则
“土家族口述史料”数据库建设,必须紧密结合土家族地区社会发展的基本态势与土家族口述史料集藏的实际情况,实现其民族性、系统性、前瞻性和兼容性的多元统一,应遵循的原则如下:
3 1 独特性原则
独特是建立数据库的第一要素,数据库如果失去特就会失去针对性和目标性,从而失去建库价值。为此,“土家族口述史料”数据库要以“人无我有,人有我优”为建库目标,突出所呈现口述史料的濒危性,以此凸显与提升该数据库的价值。建库时首先要避免信息资源的重复建设,重点突出征集到的第一手土家族濒危口述史料;其次要充分考虑民族、学科和地域等特,展现与土家族地区历史、文化、经济等密切相关的口述史料,使该库令人耳目一新。
3 2 实用性原则
建立“土家族口述史料”数据库目的在于更快、更好地利用口述史料,为广大用户提供一个专业的信息检索、参考和学术研究平台。因此,建立该数据库时要把用户需求放在首位,在内容构建和系统结构设计上除了考虑检索的方便性,还要考虑它的实用性。广大用户通过该数据库,不仅可以详细了解土家族的历史文化、政治经济与土家族地区旖旎的自然风光,还能快速、准确地获取所需信息,有效实现土家族口传文化的保护、传承与发展。史泰龙电影全集
3 3 规范性原则
规范化是建立数据库的重要保障,也是衡量数据库质量的重要标准,可为数据库提供标准、系统、兼容的构建依据。为此,“土家族口述史料”数据库建库时遵循规范性原则至关重要,其原则主要包括口述史料著录结构规范、数据元素和数据交换格式规范三方面。建库时要严格采用我国数字图书馆标准规范体系所推荐的元数据标准和特数据库建设等标准,并依据《数字资源的加工标准与操作规范》制作数据[6],以实现“土家族口述史料”数据库与其他数据库的相互对接与共享,从而保证该数据库信息输入的标准化和检索路径的便捷化。
3 4 共建共享原则
土家族口述史料作为一种具有地方特的文献资源,涉及内容繁多,流传与收藏区域广,但受传统观念、协调和利益等方面制约,部分收藏单位与个人保护主义与各自为政观念严重,给该数据库建设带来了一定难度。如何对散佚各处的土家族口述史料进行整合与利用,是各收藏单位亟待反思与解决的问题。为此,建库时要制定统筹规划,加强与土家族口述史料收藏单位及收藏者的交流合作,提高数据库共建共享意识;同时,集中专业人员对其进行联合整理与编目,以实现该数据库资源的共建共享,助推土家族口述史料的开发、利用与研究。
4 “土家族口述史料”数据库建设策略
4 1 数据库建设规划
在建立“土家族口述史料”数据库之前,根据馆藏情况做好数据库运行各环节的设计,是实现该数据库有效价值的关键,其步骤主要分为以下四阶段:
第一阶段:数据库的前期规划。数据库的前期规划是否准确决定了数据库建设的成败,建库是为了实现土家族口述史料的长久保存与共享,其内容在于精而不在于杂,建设规模也不宜过大,主要看展现的口述史料是否具有代表性。为此,在“土家族口述史料”数据库建设的前期规划中首先要注意数据库界面的设计能否突出建库的主题、意义和目的;其次对数据库的定位、风格、功能、排版与布局等进行全面规划与设计;再次对数据库的建设规模、所需软硬件、开发进度及成本等进行规划。
第二阶段:数据库的设计。数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,使之能够有效地存储数据,满足各种用户信息处理和应用的需求[7],好的数据库设计方案能极大地减少建库成本与实施时的工作量。为此,“土家族口述史料”数据库的设计首先要抓住“濒危、优秀”两个关键词来整理史料信息,通过筛选、甄别后,在数据库界面设计时予以展示,以满足不同用户的个性化需求;其次,根据我馆馆藏特,结合建库实际需求,嵌入土家族历史文化元素及地方民俗特;然后遵循数据库建立的相关原则,针对性地对数据库的逻辑结构等进行合理设计,为“土家族口述史料”数据库的实施奠定坚实基础。
第三阶段:数据的录入。本阶段是建立数据库的重要环节,主要包括土家族口述史料的数字化整编、数据库软件设计和后期标注等环节。在对土家族口述史料进行数字化整编时,既要注意数据库所展示史料的代表性和实用性,也要对数据库的物理存储方式和计算机软硬件环境进行设计和配置,其制作主要包括:①将土家族口述史料进行数字化整理与编辑,并在数据库中进行文字录入;②将征集所获实物、图片等进行拍照、剪辑等优化处理,再进行分门别类的录入;③对访谈所获口述历史资料进行数字化加工,并将录音、视频逐字逐句地配以文字等。在完成整编与软件制作后还要对口述史料进行标注,因为标注的质量将直接关系到“土家族口述史料”数据库信息资源的真实性与丰富性。
第四阶段:数据库的服务与维护。为用户提供服务是建立数据库系统最终目的和价值体现。为此,“土家族口述史料”数据库必须设计一个具备检索和利用等功能的综合性服务系统,该系统除了以Lucene全文检索引擎为架构,采用全文搜索、目录索引搜索和元搜索引擎为用户提供信息检索等服务外,还要尽可能提供更多便捷的检索入口并及时向用户提醒数据库的更新情况。为方便用户有效利用该库资源,可建立数据库用户身份认证系统,以实现对用户使用权限的合理控制。另外,还要对数据库系统设计纠错容错功能,以及时进行安全监督、问题排查和恢复及升级维护等[8],最大限度地实现“土家族口述史料”数据库的有效运行。
4 2 数据库内容的设计
与土家族口传历史文化相关的所有文字史料、实物史料均属口述史料范畴,本数据库设计了口述历史资料、口述实物史料、口述文字史料三大模块[9]。
(1)口述历史资料模块:该模块是利用口述历史研究方法对土家族口传文化传承人或知情人进行口述访谈,所产生的文字记录、图片、录音、视频等口述资料,涉及内容繁多。建库时,我们结合实际为该模块设计了五个主界面。用户如在该模块一级界面名称列表检索土家族挑花,二级界面就会显示与土家挑花相关的图片、音频、视频与访谈人物等列表;如点击访谈人物,三级界面就会显示传承人姓名、简介等列表;如再点击传承人姓名,四级界面就会显示访谈该传承人时产生的相关图片、音频、视频、访谈文字稿和传承人简介等列表,再任意点击各列表,五级界面将会呈现征集到的相关信息(如图1所示)。
(2)口述实物史料模块:土家族口述实物史料作为一种珍贵的物质文化遗产,具有较强的地域性、多样性和难征集性(如建筑、文物、个人珍藏物等)等特征,为此,我们多采用拍照和摄像方式征集。建库时为该模块设计了三个主界面,在各级界面对相关口述实物史料进行了分类与
编辑。用户如在该模块一级界面的类型列表(由土家族
建筑、雕刻、生活用品等口述实物史料构成)检索建筑,就会在名称列表看到摆手堂、民居、土王祠、冲天楼等信息;如点击摆手堂,二级界面就会显示摆手堂的简介、地点(征集地址)与相关图片
等列表;如再点击相关图片,三级
界面将会详细展示征集到的摆手堂信息(如图2所示)
。图1 
土家族的饮食
口述历史资料模块结构图
图2 口述实物史料模块结构图
(3)口述文字史料模块:土家族虽历史悠久,但1957
年才被确认为单一民族,随后开始通过土家人口述对该民族历史文化展开广泛研究,产生了很多丰富的口述文字史料。此类史料多为纸质并具有一定的连续性、系统性和研究性,建库时我们为该模块设计了三个主界面:一级界面主要分为序号、题名、作者、来源、类型与发表(征集)时间等列表,其中,类型下设期刊论文、手稿、著作、辞典、丛书、族谱、史志等类别。如在题名列表中检索罗仕松(著名土家文化研究者)手稿,二级界面就会显示该作者手稿的类型、来源、简介与发表(征集)时间等信息,再点击“在线浏览”即可阅读原始手稿内容(如图3所示)
图3 口述文字史料模块结构图
5 “土家族口述史料”数据库建设的实施5 1 数据库系统平台的搭建5 1 1 系统基本架构
我们将我馆的资源发布系统作为“土家族口述史料”数据库的发布平台,该平台主要以J2EE平台的多层体系结构为依据。系统使用M
aven通过本地仓库构建项目,前端采用bootstrap框架、jsp、ajax等技术,后端采用成熟的
Spring+SpringMVC+MyBatis开发框架。运用JDBC数据
库连接池技术,以提高数据库访问的性能,使系统具有跨平台、可扩展性、稳定性等特点。“土家族口述史料”数据
库系统平台的搭建采用M
ySQL数据库管理系统和性能稳定的ApacheTomcat作为Web应用服务器,系统架构主要
小制作方法分为以下4个层:(1)视图层(View):显示用户界面与用户的交互,在该层,用户可通过我馆,进入“土家族口述史料”数据库访问信息,进行信息的交互。
2)控制层(Controller):负责业务调度,通过接收前端传递的参数进行业务处理,并将处理结果返回给前端,如对土家族口述文字、口述实物史料等业务模块的控制。
(3)业务层(Service):负责网站模块的逻辑应用设计,“土家族口述史料”数据库系统的业务功能是在本层实现,提供了控制层和持久层交互的接口。
(4)持久层(Mapper):持久层主要是做数据持久化的处理,负责数据库数据维护,如数据的查询、数据的存取、资源调度等服务支持。淦是什么意思梗出处
每个层之间的关系如图4
图4 数据库系统各层关系图
5 1 2 系统数据模型
数据模型是数据库中数据组织和存储的依据,刻画了数据之间的关系。考虑到土家族口述史料数据之间关联紧密、集成性较高的特点,该系统采用关系数据模型来刻画系统内的数据,并对应采用关系数据库进行存储。在关系数据库中,所有具有关联关系的数据都被描绘成一张表,每个原子数据作为表中的一列,称为字段,表内的数据以行进行存储,每行称为一条记录。
为尽可能详尽保存与展示征集到的土家族口述史料数据,该系统设计了:tb_data_type(数据类型表)、tb_hu man_paper(相关文献表)、tb_oral(口述历史表)、tb_oral_human(口传文化传承人表)、tb_physical(口述实物表)、tb_physical_data(口述实物数据表)、tb_pic(图片表)、tb_text(口述文字表)、tb_text_content(口述文字内容表)等进行存储。现以tb_oral(口述历史表)(见表2)的概念模型为例,对该系统数据的表结构进行介绍:
表2 口述历史表(tb_oral)
字段名数据类型字段说明备注didchar口述史料编号主键
行路难行路难下一句
otypevarchar口述史料类型ointrovarchar口述史料介绍otime
date
材料收集时间
  表2是口述历史关系数据模型的一种实现,我们将字符串类型的口述史料编号作为主键,口述史料类型用于记
录数据的类型,口述史料介绍用于存储介绍的内容,最后的日期类型则保存了材料的收集时间。
5 2 数据库数据的加工
数据库数据的加工是一件烦琐而长期的工作,需要有专人从事此项重任。“土家族口述史料”数据库的数据主要由以下几部分构成:①通过走访相关单位及个人征集到的土家族口述文字史料;②通过田野调查征集的部分实物和拍摄的实物图片及视频;③对土家族濒危口传文化进行口述历史研究所获的口述历史资料;④与土家族口述史料相关的网络资源;⑤我馆原馆藏的土家族口述史料。囿于土家族口述史料形式多样,数据库管理员进行数据加工时,必须先将这些文稿、图片、录音、视频等进行数字化加工处理。为此,首先要进行人工审核与预处理,编制程序对格式进行统一处理(表3为处理方法汇总);其次遵循我国文献编目的相关规则对各模块口述史料进行规范化整理、编辑与著录,然后对外发布。
表3 数据处理表
数据类型人工处理部分程序处理部分
图片
图片内容审核
打标签与分类
规整图片大小
增强图片彩OCR识别图片文字
增加水印
转换并统一格式
视频视频内容审核与剪辑
打标签与分类
增强与压缩
转换并统一格式
增加水印
音频音频内容审核与剪辑
打标签与分类
音频噪音消除
增强与压缩
转换并统一格式
扫描文字稿文字稿内容审核
打标签与分类
OCR文字识别
6 结语
《普通高等学校图书馆规程》(总则)赋予高校图书馆积极参与各种资源共建共享的职责[10],特数据库建设已成高校图书馆资源建设的重要手段,及时总结建设中的策略与方法对推动该项工作具有重要意义。2019年习近平总书记在内蒙古考察时强调:要重视少数民族文化遗产的保护传承,加强少数民族文献史料的征集、整理与收藏,是当前保护少数民族文化遗产的重要措施,也是民族地区高校图书馆特数据库建设的重要方向。“土家族口述史料”数据库以保护土家族濒危口传文化为建库目标,以土家族口述史料集藏为切入点,探索我国少数民族口述史料数据库建设新模式,旨为相关数据库建设提供参考与借鉴。
参考文献:
[1]于爱君.民族文化专题数据库建设的实践与思考———以“鄂伦春文化专题数据库”建设为例[J].图书馆学刊,2006(2):67-75.
[2]张旭,解虹.西域民族文化资源数据库建设中元数据选择与结构设计方案[J].图书馆理论与实践,2007(5):101-103.
[3]祁兴兰.民族地区高校图书馆特资源数据库建设现状、问题及对策[J].图书情报工作,
2018(8):111-119.[4]彭瑛.民族文化保护视角下历史街区文化肌理的重建———以安顺历史街区为例[J].贵州民族研究,2014(7):73-76.
[5]张毅,李欣.面向数字人文的特藏资源揭示研究———以方志数据库建设为例[J].图书馆,2019(6):31-36.[6]高芳.党校图书馆特数据库建设探究[J].图书馆工作与研究,2015(9):46-65.
[7]于中远,王亚平.应用环境中最优数据库模式的构建[J].河南科技,2011(21):54-55.
[8]杨云燕,杨美玲.彝文古籍档案数据库的构建[J].数字兰台,2014(11):37-38.
[9]王敬斌.陕西汉水流域特文献数据库的建设与探索[J].电脑知识与技术,2016(9):14-16.
[10]教育部.教育部关于印发《普通高等学校图书馆规程》的通知:教高[2015]14号[EB/OL].(2016-01-04)[2020-07-03].http://www.moe.gov.cn/srcsite/A08/moe_736/s3886/201601/t20160120_228487.html.
作者简介:
彭燕(1973-),女,大学本科,副研究馆员,任职于吉首大学图书馆。研究方向:民族口述历史与图书馆特藏建设。
张心悦(1997-),女,吉首大学旅游与管理工程学院图书情报硕士研究生在读。研究方向:民族口述历史与图书馆特藏建设。
何轩(1999-),男,吉首大学软件学院软件工程专业本科在读。研究方向:数字信息技术。