简化字和汉字的理据性
一  汉字的理据性
目前,对于汉字理据性的理解还存在分歧。孙剑艺认为:“要说早期的汉字‘有字理’是可以的。但是汉字发展到今天,它所记录的汉语发展到今天,社会发展到今天,汉字的‘六书字理’早已消失殆尽了,或者说早已不起多大作用了。……实际上,汉字本身的发展史,就是一部逐渐淡化自己‘字理’的历史。 ”[1]苏培成先生不同意这个观点,他认为“真正实用的文字都是有理据的。拼音文字的字母按照一定的规则拼合起来,就能表示出词的读音,这就是它的理据。汉字不是拼音文字,是语素文字,它的理据表现为部件和字音、字义间的联系。看到一个汉字,能够从它的部件联想到它的读音和意义。知道它代表的是什么语素,这样的字叫有理据。反之,看到了部件不能引起联想,这样的字就是没有理据。”[2]刘又辛认为,“从两种文字的性质来看,拼音文字是一种无理性符号;汉字则除少数表音(假借字)外,基本上都是有理性符号。”[3]这里对汉字理据性的不同理解,牵涉到对汉字系统规律的认识和对汉字发展演变历史的不同看法。至少涉及这样三个问题:
1.对文字理据性的理解
文字的理据性是指文字符号和语言成分的对应关系,既然文字是用来记录语言的一套符号系统,而语言又是音义结合的词汇语法体系,那么文字记录语言,就是使文字符号和语言成分建立联系。这种联系可以是语音的,也可以是意义的。拼音文字的字形(词形)直接记写语言要素的声音,而汉字中形声字的字形,则与语言要素的声音和意义两个方面发生联系。因此,我们说的理据性不仅仅指现代汉字是不是合乎“六书”,还指作为一套记录汉语的符号系统,汉字跟语言成分之间是否具有某种联系,换句话说,汉字的理据性是指其在记录语言成分的同时,是否体现出某些规律性的东西。从这个意义上说,我们同意苏培成先生的看法,任何实用的文字都是有理据的。汉字记录汉语,它的理据性就表现在汉字字形直接与语言中的音或者义发生联系。比如“众”,是由三个人组成的,用它代表“人多”的意思。“抬”两个偏旁,一个表义,一个表音。这样的字都体现出了汉字的理据性。不同类型的文字,它的理据性表现出来的方式就有所不同。表音文字用字母表示语言中的音素或音节,字母按照一定的拼合规则来表示相应词的读音。例如英语中的“book,look,cook,boot”等词,其发音就有一定的规律性,词形直接记写语言要素的声音。当然也有一些词不能准确表示读音,但从英语文字的整个体系来看,还是有一定系统规律的,因此我们承认它是有理据性的文字,至于多少词形表音,多少不表音了,那是理据度的问题。
为了把汉字的理据性加以量化,苏培成先生提出了理据度这个概念。理据度的计算公式是:
实际具有的理据值÷最大理据值=理据度
按照字符理论,现代汉字的字符分为三类,就是意符、音符和记号。意符、音符有理据,记号没有理据。他以《新华字典》的部分作了抽样测查,推测汉字的理据度在50%上下。[4]
2.古代汉字和现代汉字的理据性问题
所谓现代汉字是指记录现代汉语所使用的文字。它以形声为主要构字方式,以楷书为通用印刷体,基本上采取语素—音节原则来记录现代汉语。古代汉字是一个非常宽泛的概念,它至少可以划分为两个大的阶段,即古文字阶段和隶楷阶段。前一阶段起于商代,终于秦代;后一阶段自秦末一直延续到现代[5]。在时间范围的大跨度、字形演变的大变化面前,对于古代汉字的理据性也要做出具体的分析。如果说小篆以前的文字,基本保留了象形的特点,那么隶变可以说是汉字历史上的一次空前的大简化,它确立了汉字点、横、竖、撇、捺等现代汉字的基本笔画,也确立了现代汉字结构的基本雏形。在甲骨文里表示具体事物、动物的字形,一般都是描摹其外形或者外形特征,这些字形直接与所记录的词语发生联系,可以看作
是有理据的。然而,也不是所有的甲骨文都是能够“见形知义”的,因此,其理据性未必就比现代汉字高多少。汉字发展到了周代,特别是春秋战国时代,汉字造字方式发生了根本性转变,形声字增加的速度超过了表意字,形声字的数量也就占了多数。《说文解字》所收9353个小篆中,形声字的数量就占了80% 多。这时候,汉字的理据性就越来越强了。发展到隶楷阶段,尽管随着笔画的确立,象形、指事、会意字的理据性有所降低,但形声字的数量发展迅速,南宋郑樵对两万多汉字的结构作过分析,认为当时的形声字比重已经超过90%。因此,汉字的理据性不是削弱了,而是大大加强了。现代汉字中,大部分字形是对隶楷阶段汉字的传承,古今通用字仍是现代汉字的主体,简化字和新造字所占的比例不足20%,即使是简化字和新造字,也不都是毫无理据的,相反,有些字还提高了理据度。比如“态”、“证”、“递”等字就比原来的繁体字理据度高了。
3.个别字形和汉字系统
讨论汉字的理据,应该着眼于汉字的整体系统,而不应该拘泥于个别字形,尤其不应该就某个字或某些字的理据,特别是“六书”理据,来否定整个汉字系统的理据性。我们要看这些字是否构成对整个汉字系统的冲击,其冲击度到底有多大,是否到了足以破坏汉字理据的程度。
汉字的特点拿“木”字旁的字来说,从整个表意体系上看,汉字从“木”的字,大多还是与木有关的。我们统计了《新华字典》中18个常用形旁,结果发现2738个形声字的形旁表义率为90.03%。我们还就《最常用的汉字是哪些——三千高频度汉字字表》作了统计,1985个形声字中形旁有表义作用的1720个,占总数的86.65%,形旁没有表义作用的 265个,占总数的13.5%。所以从总体上看,现代汉字形旁依然保持着较高的理据度。声旁的情况就差一些了,汉字有多少形声字的声旁可以真正表音?即有多少形声字的声旁读音和整字的读音完全一致?周有光先生统计的结果是:现代汉字声旁的有效表音率是39%[6]。周先生的数据统计中是以“含旁字”所指,其含义比声旁要宽泛一些。李燕等对7000个通用字中的形声字的统计结果为,声韵完全相同的2285字,占形声结构的比例是40.54%[7],而事实上,越是生僻字其表音率越高,我们对常用字3500个统计的结果是32%。高家莺对倪海曙编著的《现代汉字形声字字汇》所收5990个正字进行统计,其中一音声旁所组成的形声字中,字音与声旁读音完全相同的1578个,占形声字总数的26.3%[8]。之所以出现这样的差距,原因在于所选材料及对材料的限制各有不同。不过,据笔者的统计结果,30%左右的表音率应该说接近汉字的事实。从这个意义上说,现代形声字摹写声音的理据度并不高。
二  简化字的理据性问题
有人认为,简体字破坏了汉字的结构,破坏了汉字的理据性。“简体字易写而没有字理”[9],这样的说法缺乏对简化字的全面分析,也往往是只看到了一些简化字的“树木”,而没有看到简化字系统乃至汉字系统的“森林”。诚然,简化汉字在“六书”的字理上,有它的缺陷,但80%以上的简化字还是可以进入汉字的理据体系的,它与整个汉字体系的冲突并不是想像的那么大。况且由于汉字本身的发展,同样也使古代汉字中大约20%的字游离出了汉字结构体系,这部分无理据的字是不能记在简化字身上的。严格要求简化字一定要符合类推规律、一定没有规则例外,是不现实的,是不符合汉字实际的。
首先,汉字系统本身不是科学定律,也不是一个严格的科学体系。因此,规则的不对称性和规律的不系统性也就在所难免。汉字不是一时一地某一个人创造的,而是经过长期的发展逐步形成的。在发展过程中,它不是以追求系统的完备性和科学性为主要目标,而主要是书写的简便性,它甚至并没有过多考虑记忆的方便性。再加上语言的发展变化,记录汉语的汉字也会相应的发生音义方面的变化。因此,就会在规则之外出现特例,出现游离于系统之外的汉字。比如从“竹”字头的字,一般说来都与“竹”有关系,但是有些字并不是这样,“笑、笨、答、等”等常用字,都已看不出跟竹子有什么关系了;有些竹字头的字“竹”是声旁,如“笃”,从马,竹声,本义为“马缓慢地行走”;“筑”是个会意兼形声字,从竹从“?(抱,用手拿。隶变
为巩)”。这些字的理据性都是要打折扣的。但从“竹”的另外127个字(根据张书岩主编《标准汉语字典》,汉语大辞典出版社,2000年12月)都可以看作与“竹”有关系。另外,形声字声旁的表音规律性就更差了,同样是“皮”作声旁的字,可以有:pī(披),pí(疲),bǐ(彼),bèi(被),bō(波、玻),bǒ(跛),pō(坡),pò(破)等等。所以认为汉字可以系统类推本身就存在认识上的错误。
其次,从整个简化系统上看,可以类推的简化字还是占多数的。《简化字总表》第三表所收的1753个字就是根据第二表的简化字和简化偏旁类推出来的。如“貝”简化为“贝”,貞、則、負、貢、唄、員、敗、貯、貪、偵、側、貨、貫、貴、賤……等中的“貝”统统简化为“贝”。而这些可以类推的简化字占了简化字总数的78.43%。所以我们应该承认汉字简化的类推规律还是存在的。至于第一表和第二表中出现的简化字更不应该成为批评简化字的理由。因为简化字中 80%的汉字是古已有之的[10],是在众中间流行了几百上千年并有广泛众基础的字,只不过我们整理规范了这些字,使它们取得了合法身份并成为唯一合法身份的字体。由此看来绝大部分简体字不是新中国创造的。其实简化字作为政府行为推广,早在1935年,当时的国民党政府教育部就公布了《第一批简体字表》,共收324个字。就是现在被人们广泛批评的“破坏六书”原则,被人们广泛举例的用“又”代替十多种偏旁,也是当时就有的。比如当
时的方案就确定了“觀”简化为“观”、“歡”简化为“欢”、“權”简化为“权”、“勸”简化为“劝”。所以台湾政府和有关人士完全没有必要背着这个包袱,认为简化字是大陆政治的产物。