前 言
随着信息技术的不断发展和应用,人类社会已进入信息化时代。信息化社会的重要标志是信息处理标准化、信息存储数字化和信息发布网络化。中文新闻信息作为社会信息的重要组成部分,迫切需要通过标准化进行规范,从而降低成本,实现新闻行业之间、新闻行业和广大用户之间的新闻信息交换、存储、处理和共享。
《中文新闻信息分类》(以下简称《分类》)的制订,是为了实现中文新闻信息分类体系的规范化、标准化,进一步开发和整合中文新闻信息资源。同时,也是为实现中文新闻信息分类自动化打下一个可靠的基础。由于传统的手工分类周期长、费用高、效率低,而且需要具有专业知识的人员才能胜任,所以难以满足信息成指数增长的今天的实际需要,实现分类自动化是中文新闻信息分类工作的必由之路。
《分类》是在分析研究国际、国内众多新闻媒体已有的分类方法、规则,总结国内主要传媒机构新闻信息分类的多年实践经验,以及对有关新闻信息分类理论探讨的基础上制订的。
《分类》是以GB 7027-1986《信息分类编码的基本原则和方法》为依据,借鉴和吸收《中国
图书资料分类法》、《中国档案分类法》,以及国外一些比较成熟的分类法中适合中文新闻信息特点的成分,从中文新闻信息的实际出发制订的。
《分类》的附录A、附录B、附录C、附录D和附录E均为规范性附录。
《分类》由×××联合提出。
《分类》由×××归口。
《分类》起草单位:
《分类》主要起草人:
《中文新闻信息分类标准》编制原则
1 范围
《分类》规定了中文新闻信息分类体系和分类代码。
《分类》规定了中文新闻信息分类方法的一般原则。
《分类》适用于通讯社(新闻社)、报社、期刊社、广播电台、电视台、网络媒体,以及各种资讯机构对中文新闻信息进行分类标引和编制分类目录。
2 规范性引用文件
《分类》采用下列国家标准,其随后所有的修改或最新版本适用于本《分类》。
GB/T 2659-2000 《世界各国和地区名称代码》
GB/T 2260-2002 《中华人民共和国行政区划代码》
GB 3304-91 《中国各民族名称的罗马字母拼写法和代码》
3 术语和定义
《分类》采用下列定义。
3.1 中文新闻信息 Chinese news
指通讯社、报纸、刊物、广播电台、电视台和网络媒体等,用中文对新近或正在发生的、对公众具有知悉意义的事实的报道,包括文字形式和数值、图形、图片、图表、图像和声音等非文字形式。
3.2 网络媒体
指利用互联网(Internet)发布或传播新闻信息的网站。和报刊、广播、电视等传统媒体比较,网络媒体在广泛性、即时性、开放性、共享性和互动性等方面更具优势。
3.3新闻信息分类News classification
指按照新闻信息的主题内容或其它特征,依据特定的分类标引工具(分类表),将它们分门别类地组织成科学体系的过程。
3.4 分类表
是对新闻信息进行分类标引和检索的工具,是分类法的表现形式。一般是将同一主题从大类到小类,按照逻辑系统逐级展开。内容包括类表(基本大类、简表、详表、复分表)、类目注释、编制说明及使用说明等。
3.5 类
指一组具有共同属性的事物的集合,又称类目。
3.6 基本大类
又称分类大纲。指分类表中列出的第一级类目。
3.7 简表
又称基本类目表。指由基本大类直接展开而形成的一、二级类目表,是分类表的骨架。
中国各民族代码表3.8 详表
又称主表。指在简表的基础上,将类目逐级扩展而成,是新闻信息分类标引的主要依据。
3.9复分表
又称附表、辅助表。指将详表中出现的共性子类目抽取出来,单独编列成表,供详表有关类目进一步细分时使用。目的是为了缩小类目表的篇幅和细分方便。复分表包括通用复分表和
专用复分表。
使用复分表进行分类标引时需遵守各表有关规定和总的组配规则,以保证标引的一致性。
3.9.1 通用复分表
指适用于整个主表的复分表,供对主表有关类目进一步细分用。附在主表之后。
《分类》有如下通用复分表:总类复分表、人物复分表、企业复分表、世界国家(地区)代码表、中国行政地区代码表、中国各民族名称代码表和新闻信息体裁表。
3.9.2 专用复分表
指适用于主表中某一类的复分表,供对该类有关类目进一步细分用。附在主表某类中。
《分类》有体育比赛专用复分表,农产品专用复分表等。
3.11 仿分
又称仿照复分。指后面的类目仿照前面类目所列出的下位类进行细分的方法。对具有共同
分类标准的临近类目,常常采用此种方法。例如“政治”中的“民主党派”
3.12 类目注释
是对类目的补充说明,它帮助分类标引人员理解类目,准确归类。《分类》类目的注释主要有:
指出类名含义。例如“科学技术”的“火炬计划”类目下注“中国高新技术产业的指导性计划”。
指明类目内容。例如“信息产业”的“电子政务”类目下注“政府部门办公自动化、网络化、电子化以及全面信息共享入此”。
指明类目间的关系和范围。例如“政治”的国家“地理概况”类下注“领土、领海、领空、专属经济区及渔业区、深海和外层空间资源享有、领属等入此。领土纠纷或边境冲突入‘外交、国际关系’”。
指出细分方法。例如“政治”的“地方人民代表大会”类下注“可依中国行政区划表”分。又例如“政治”的“全国政协常委会”类下注“仿全国人大常委会分”。
4编制原则
《分类》根据新闻包罗万象、时间性强、综合性强,既容易形成专题,又相互交叉渗透的特点,以政治、经济和文化等社会领域为分类体系的基础,以新闻主题为主要立类原则,同时注意吸收图书、档案等各种分类中适合新闻信息分类的元素,力求使《分类》既能反映新闻信息的特点,又能做到实用性和科学性、稳定性、可扩展性相统一。
4.1科学性原则
《分类》采用主题与学科相结合的立类方法,使分类体系具有主题的直接性和学科的系统性。
《分类》各基本大类都采取从总到分、从一般到具体的等级分类方法。
《分类》由主表和复分表共同构成完整的体系。
4.2 实用性原则
随着社会的发展,新闻信息内容变得日益广泛,内容重点发生重大变化,用户检索需求也日
趋多样化。《分类》在保证类目体系科学性、逻辑性的同时,把一些新闻信息量大、用户比较关注的内容跨越逻辑层次,作为基本大类列出,以期达到重点突出,降低分类难度和类目设置相对平衡的目的。例如,按照学科分类法处于“经济”二级类目的农业、工业、金融、能源、交通运输、信息产业、贸易、服务业等在本《分类》中均成为一级大类。
4.3 稳定性原则
《分类》在一、二级类目的设置上,充分考虑与国计民生、社会发展息息相关的各个重要领域,总结和继承我国主要新闻媒体数十年分类工作中积累的经验,吸收和借鉴国内外一些著名的分类标准,力求使其具有稳定性和兼容性。
4.4可扩展性原则
《分类》的可扩展性原则体现在两方面:
1, 随着社会的发展,新事物、新学科、新技术不断涌现,《分类》在类目扩展上预留充
足的空间。
2, 《分类》是为了适应各种传媒机构对中文新闻信息进行分类的共同需要而编制的。但考虑
到每个传媒机构在新闻信息的收集重点、分类粗细、数据库规模等方面存在许多差异。为此,允许各传媒机构在不破坏《分类》类目体系和标记规则的前提下,可以制定适合自己单位执行《分类》的使用本或分类细则。
4.5 《分类》在工业类目的设置上借鉴了GB/T 4754-2002《国民经济行业分类与代码》,在科学技术类目的设置上借鉴了 GB/T 13745-92 《学科分类与代码》。但根据新闻报道的特点对其中一些类作了调整,例如“工业”中增加了“家用电器及非电力器具” 类,将家用视听设备、家用摄录设备、家用制冷电器、家用空调器、家用通风电器、家用厨房电器、家用清洁、卫生电器、家用美容、保健电器以及燃气器具、太阳能器具等非电力家用器具相对集中。又例如,将“法学”、“军事学”、“新闻学与传播学”、“计算机科学技术”、“纺织科学技术”、“食品科学技术”、“交通运输工程”等分别合并到“法制”、“军事”、“传媒业”、“纺织业”、“食品、饮料”、“交通运输”等类中。
4.6《分类》根据新闻信息大多综合性强、内容层次较浅的特点,在农业、工业等经济门类
的类目设置上,一般将科学研究、技术开发、产品制造(生产)、市场销售等汇集在一起。
4.7 《分类》将交叉或具有双重属性的新闻信息两处列类,但其中一处只起参见的作用,其代码用[ ]表示,类目下加注说明。例如,“工业”的“[09001400600003]航天器”类目下注“宜入‘航空、航天科学技术’”,意思是把09工业中的航天器制造方面的新闻信息集中到“航空、航天科学技术”类。这样做的目的是使航天方面的信息从发展规划、科学研究、技术发展、航天器制造、发射等都相对集中。
4.8 《分类》中各类出现的分类层次和数量分布不均衡现象,是事物发展不平衡在新闻报道中的体现,是客观实际所决定的。
5编码方法和代码结构
5.1类目层次设置
主表的类目层次最多到5级。
复分表中,世界各国和地区、中国行政区划、中国民族名称的类目设置分别按GB/T 2659-20
00 《世界各国和地区名称代码》、GB/T 2260-2002 《中华人民共和国行政区划代码》、GB 3304-91 《中国各民族名称的罗马字母拼写法和代码》执行;其它复分表最多设2级。
5.2 类目代码
主表类目代码用阿拉伯数字表示。
主表采用十进分类法,每一级类目用2位阿拉伯数字表示(01-99)。二级及其以下类目代码由上位类代码加顺序码组成,顺序码前面加“0”,作为类目之间的分隔符号。
复分表中,世界各国和地区、中国行政区划、中国民族名称的类目代码分别按GB/T 2659-2000 《世界各国和地区名称代码》、GB/T 2260-2002 《中华人民共和国行政区划代码》、GB 3304-91 《中国各民族名称的罗马字母拼写法和代码》执行;其它复分表的类目代码设置与主表的作法相同。
5.3 类目代码结构图
本标准主表的代码结构图如下:
5.4标识符号
- 为总类标识符号。
< > 为国家(地区)标识符号。
发布评论