五笔字型编码
汉字是一种拼形文字,它们是将一些构字的基本单位按照一定的规律组合成不同的汉字形体,构成相对独立的结构。五笔字型将这些构成汉字的基本单位称为“字根”。这些字根多数取自于传统的汉字编旁,少数是根据这套编码方案的需要而确定的。每个字根所对应于键盘上的字母称为“编码”。在计算机上要输入某个汉字,就首先要出构成这个字的字根,根据字根对应键盘上的字母编码,在五笔字型输入状态下输入这几个字键。
例如:“子”、“木”、“亻”、“氵”、“夕”、“月”等都称为字根。将字根按一定的位置关系拼合起来,就构成了汉字。如:
在五笔字型输入状态下,通过击键盘的PB和空格键,“字”就输入电脑;键入UEMC 键,“毅”字就输入电脑,同时屏幕显示输入的汉字。
五笔字型汉字输入方法既不考虑读音,也不把汉字全部分解为单一笔画,而是遵从人们的习惯书写顺序,以字根为基本单位来组字编码,拼形输入汉字的一种方法。这就是五笔字型编码方案的基本出发点之一。
1、汉字的笔画
殷桃的老公是谁
所有的汉字都是由笔画构成的,在书写汉字时,不间断地一次连续写成的一个线条叫做汉字的笔画。笔画的基本形式是点和线,点和线在汉字里的位置不同,有一些笔画变体。把笔画的基本形式和变形加在一起,就有许多不同的形体。而“五笔字型”只考虑笔画的运笔方向,而不计其轻重长短,将汉字的笔画分为五类:横、竖、撇、捺、折。根据这五种笔画在汉字中所占频率的高低,依次用1、2、3、4、5作为这5种笔画的代号。如表2-1所示。
汉字的五种笔画
在汉字的具体形态结构中,其基本笔画“一、丨、丿、\ 、乙”常因笔势和结构上的匀称关系而产生某些变形,一些基本笔画的大小,长短有时也很不一致,于是就派生出了各种各样的笔画变异。横、竖、撇、捺四种笔画中,都有相应的短笔画。提笔和撇“丿”外形相似,但笔画走向不同,提笔因其笔画走向为从左到右,因此提笔属于横。这种变异仍然保留了基本笔画的形态特征。
竖左钩属于竖,而竖右钩属于折。
一切带拐弯的笔划,不管有多少折笔,都归为折类。
主持人沈凌汉字的五种基本笔画“一、丨、丿、\ 、乙”不是编码的基本单位,只是起着辅助作用,而字根才是汉字编码的基本单位。
2、汉字的字型
五笔字型汉字编码是把汉字分解成构字的基本单位:字根。而字根组字又按一定的规律构成,这种组字规律就称为汉字的字型。汉字可以分为三种字型:左右型、上下型、杂合型,这些字型的代号分别为1、2、3。如表2-2所示。
汉字字型表
五笔字型只研究由两个或三个字根组成的汉字的字型。由一个或多于三个字根组成的汉字都不用研究字型就可以直接输入。一个字根形成的单体字有特殊的输入方式,即键名字根输入和成字字根输入法。而对于由四个或四个以上字根组成的汉字,其信息已够丰富,就不必再考虑汉字的字型。这就是后面将要学到的取“一、二、三、末”四个字根,且不足四码要追加末笔字型交叉识别码的原因。分析汉字字型就是为帮助研究那些字根少于4个的汉字的补充编码。这类字在6000个汉字中,除可以简化输入的以外,有589个,占汉字频度的5.74 6%。在应用文章中约占1.7%。因此,这部分在本章中不是重点。是为“末笔字型交叉识别码”这个难点打下基础。
1). 左右型汉字
如果一个汉字能分成有一定距离的左右两部分或左中右三部分,则称这汉字为左右型汉字。有的左右型汉字的一边由一部分构成,另一边由两部分或三部分构成。
如:“让、汪、谁、沿、别、谈、倍”等字是左右型汉字。
淳于珊珊个人资料2). 上下型汉字
如果一个汉字能分成有一定距离的上下两部分或上中下三部分,则这个汉字称为上下型汉字。也有一些上下型汉字的上面由一部分构成,下面由两部分构成。或者上面由一部分构成,下面由两部分构成。
如:“字、骨、专、坚、品、等、育、复、花”等字是上下型汉字。
3). 杂合型汉字
如果组成一个汉字的各部分之间没有简单明确的左右或上下型关系,则这个汉字称为杂合型汉字,即内外型汉字或单体型汉字。
如:“团、同、区、臣、半、习、连、屯、才、未”等。
3、汉字的结构
一切汉字都是由基本字根组成的,基本字根在组成汉字时,按照它们之间的位置关系可以分成四类基本结构。分析汉字的结构是为正确确定不同汉字的字型。
1).单
单是指基本字根本身就单独构成一个汉字。
如:“由、雨、竹斤、车”等。
这类汉字不再分为某种字型,在五笔字型中称为键名字根或成字字根汉字,有专门的取码规则。
2).散
散是指构成汉字的基本字根之间可以保持一定的距离。
如:“讲、肥、明、张、吴”等。
当对汉字提取左右、上下、杂合型字型信息时,正是以字根之间这种“散”的关系为前提的。因此,这类汉字的字型可分为左右型或上下型。
3).连
连是指一个基本字根连一单笔画。如“丿”下连“目”成为“自”,“丿”下连“十”成为“千”,“月”下连“一”成为“且”等。这类字虽然不多,但容易看成是上下型关系,它们的字型应该属于杂合型。
另一种情况是指“带点结构”。如:勺、术、太、主等。这种一个基本字根之前或之后的孤立点,一律视作与基本字根相连,这样的字一律视作“连”的结构。
连的关系只存在于单笔画与字根之间,字根与字根之间不存在连的关系。
4).交
交是指几个基本字根交叉套迭之后构成的汉字,如:“申”是由“日、┃”,“里”是由
“日、土”,“夷”是由“一、弓、人”交叉构成的等等。这类汉字的字型应属于杂合型。
在字根组字中,还有一种情况是混合型,即几个字根之间既有连的关系,又有交的关系。如“币”,是“一”下边连了一个“巾”,而“巾”又是由“冂”与“丨”相交形成的,自然这类汉字的字型也属于杂合型。根据上面的分析,归纳如下:
①基本字根单独成字,在取码中对它有专门的规定,不需判断字型。
2022年冬残奥会中国金牌数量②属于“散”的汉字,可以分为左右、上下型。
③属于“连”与“交”的汉字,一律属于杂合型。
④不分左右、上下的汉字,一律属于杂合型。
4、汉字的字根
汉字由字根组成,字根由笔画构成,笔画、字根、整字是汉字结构的三个层次。五笔字型汉字编码所选字根多数是一些传统的汉字部首,少量的选用一崐些不是部首的笔画结构作为字根,也硬造出了一些“字根”来。
五笔字型的基本字根有130种,加上一些基本字根的变型,共有200个左右。按照每个字根的起笔代号,分为五个“区”。它们是1区-横区,2区-竖区,3区-撇区,4区-捺区,5区-折区。每个区又分为五个“位”,区和位对应的编号就称为“区位号”。这样,就把2 00个基本字根按规律地放在25个区位号上,这些区位号用代码11、12、13、14、15;21、2 2..;51、52、53、54、55来表示,分布在计算机键盘的25个英文字母键上。
每个区位上有一个最常用的字根称为“键名字根汉字”,键名字根汉字既是组字频度高的字根,又是很常用的汉字。首先应熟记键名字根,以帮助各键位上其它字根的理解和记忆。下面是各区位上的键名字根,每个字根左面括号里的数字代码表示这个字的区位号。
1区(横区): 王(11) 土(12) 大(13) 木(14) 工(15)
2区(竖区): 目(21) 日(22) 口(23) 田(24) 山(25)
3区(撇区): 禾(31) 白(32) 月(33) 人(34) 金(35)
4区(捺区): 言(41) 立(42) 水(43) 火(44) 之(45)
5区(折区): 已(51) 子(52) 女(53) 又(54) 纟(55)
键名字根汉字的键盘分配见图
键名字根键盘图
5、汉字字根键盘分配
汉字输入是通过手对键盘的操作而完成的,由于每个字根在构成汉字时的频率不同,而十个手指在键盘上的用力及灵活性又有很大区别。为了提高输入速度,五笔字型的字根键盘分配,将各个键位的实用频度和手指的灵活性结合起来,把字根代号从键盘中央向两侧依大小顺序排列。将使用频度高的字根往各区的中间位置,便于灵活性强的食指和中指操作。这样做,键位便于掌握,代号好记,击键效率便于提高。字根键盘见表3-3。
五笔字型字根总表
200个左右的字根是输入汉字的必要工具。在练习输入汉字之前,要记住这么多字根及它们在键盘上的排列位置,是初学者认为的一大难关。但只要认真分析字根在键盘的分布规律。掌握字根之间的联系,记住这些字根就不会显得太困难。首先应熟记各区位上的键名字根。然后根据键名字根及其联想,掌握其它字根,在输入练习中加深和巩固字根的记忆。
字根在键盘上的分配规律首先考虑的是基本字根的首笔笔画代号,将所有字根分为横、竖、撇、捺、折五类,放在五个区上。各个区上有五个位,如何将同类字根分配在五个位上,这是字根键盘分配的第二个因素,这个因素既考虑各个字的组字频度,又考虑键盘的指法击键频度。这样,字根键位易于记住,击键效率便于提高。其记忆规则如下:
1.基本字根与键名字根形态相近。如G(11)键上的键名字根是“王”,形态相近的有“五”字根,键名字根为“大”键上有“犬”,“已”键上有“已、己、尸”等。
2.字根首笔代号与区号一致,次笔代号与位号一致。如“文、方、广”等字,首笔为点即捺,代号为4,次笔为横,代号为1,他们对应的区号为4,位号为1,故首、次笔代号与区位号一致。
3.首笔代号与区号一致,笔画数目与位号一致。如字根“三”,首笔为横,代号为1,笔画数目为3,“三”的区位号为13。“一”、“刂”、“彡”、“灬”等字根也具有这一性质。
4.与主要字根形态相近或有渊源。如字根“手”与“扌”在R键上,“夕”在键Q上,“四”和“皿”在同一键L上。
另外,有一部分字根的键盘安排不符合上述几条原则,主要是照顾到某些键上有一定的字根数量,以分散另一些键的击键强度,便于提高录入速度。如:“丁、力、心、车、乃、匕、巴、马”等字可以从相容性去分析。
为了帮助初学者更快地掌握各区位上的字根,五笔字型提供了一套“字根助记词”。每
一句字根助记词基本上概括了一个区位上的字根。使初学者能够很顺口地“读出”每个区位上的字根,增强了学习的趣味性,可以加快记忆速度。
第一区字根
在G(11)键上,键名字根“王”及“戋”的首、次笔都为“横”,代码为11。“五”与“王”字形态相近。“一”的首笔为1,笔画数为1,也放在11区位上。
在F(12)键上,键名字根“土”的首、次笔代号为12,“士、干”与“土”字形态相近。“二”字的首笔为1、笔画数为2。“十、寸、雨”这三个字的首笔为1,次笔为2,代号为12。
在D(13)键上,键名字根“大”与“犬”形态较近,且首、次笔代号为13。“三”字的首笔为1,笔画数为3。“石、古”形态接近,“石”字的首、次笔代号为13。
贺卡祝福语在S(14)键上,键名字根“木”字的首末笔代号为14,西字的首笔为1,下部象四,故放在14位。
在A(15)键上,“工、匚”形态相近,“匚”字首、末笔代号为15。“七、弋、戈”形态相近,且首、次笔代号为15。“廿、艹”形态相近,“廿”的首、次笔代号为15。
第二区字根
在H(21)键上,键名字根“目”首笔为竖,代号为2,形状与21键上的字母H相近。“上、止”首、次笔代号为21,且形态相近。“丨”笔画数为1,与“卜”形近。
聂磊老婆在J(22)键上,“日、曰、虫”字根形态相近。“早”是一个复合字根,解码时不能分成“日”和“十”。“刂”等字根的特征为“两竖”,其首笔代号为2,笔画数为2,他们的形态非常接近,应进行联想记忆。
在K(23)键上,键名字根“口”与字母K的发音接近,可产生联想。“川”的特征是3竖,所以应放在33键上。
在L(24)键上,主要字根以大框为特征。“田、甲”字型相近,“囗”为田字框。“车”的繁体字与“甲”形似。“四”首笔代号为2,字义为4,放在24键上,而“四、皿”等字根的字型又很相近,应产生联想记忆。“力”的读音为LI,因此放在L键上。
在M(25)键上,“山、由、冂、几、贝”字根的首笔代号为2,次笔代号为4,“山、由”两字根形相似。而“冂、几、贝”几个字根形近,与M字母的形相似。
第三区字根
发布评论