五笔有两个版本:86五笔与98规范王码(简称98王码,有人按86的习惯叫为98五笔)。但98王码的教程不多,网络上很不好找。这个版块贴过的几篇也很快沉下去了。为方便初学者,故把这些文章集合在一起。另外由于98王码大部分规则与86五笔相同,故这些文章很多都是比较其不同之处,即是说,按86五笔的教程学习,再学其不同之处,98王码也基本掌握了。 98版五笔字型与86版五笔字型的区别 必须指出,虽然WM9801种的老版本(86版)与其他五笔字型老版本的单个汉字与词组编码规则是完全一样的,但86版具有“抓屏造词”与“即造即用”等功能,又可以方便地维护词库与码表。所以,使用老版本的用户应该把正在用的五笔老版本升级成WM9801中的86版。 首先,王码可以输入繁体字。中国的汉字千千万万,康熙字典收入了47000多个汉字,汉字到底有多少恐怕就是文字学家也说不清,但万事不能没有一个“底”,于是就得人为地确定一个“底”,所以就有了几种流行的字符集,最标准的就是GB国标简体字,共有6763个字,在我国大陆的现代生活中这6763个字已经够用了,我国文字专家通过对7075篇现代文章的2162万汉字的统计,一共也只发现了汉字6300个(引用)。我们现在大量使用的多种输入法,大都只能输入这6763个字,当然86版的五笔字型也只能输入这些字。 不过事情有时不那么简单,有些字你可能天天碰到,但却打不出来,这大都是因为一些人名造成的,像“朱镕基”的“镕”,还有“冯喆”的“喆”,还有“弨”、“堃”等等,因为这些字都是GB国标以外的汉字。目前流行的绝大多数的输入法对它们都无能为力(全拼和标准郑码等除外)。作为专业输入的龙头老大,五笔字型是基于国标简体字而发明的,字根的设置在当时没有考虑到繁体汉字。而五笔字型的新兄弟“98王码”,却在五笔字型的基础上仅仅作了一点修改就可以简单地处理这些字了,甚至可以处理CJK大字符集的21003个汉字(这个字符集包含了古字和韩国、日本等国的一些汉字),所以即使你是个不识简体字的同胞,也可以通过王码轻而易举地输入繁体汉字了。 第二,码元的设置更科学。五笔字型输入的基本原理就是通过字根的“拼装”组成汉字,98王码则把字根称为码元,其意思是一样的。为了便于记忆,五笔字型把汉字笔划分为五大类(所以叫五笔字型),并把有同样或相似笔划的字根安排在这五大区里。但是你会发现像“力”、“几”等字根安排在了“竖”区内,不十分科学,而王码则把它们安排在了“撇”区,合理多了;“×”(叉)这个字根使用频率很高,但五笔字型把它安排在“Q”键上,所以在用五笔字型打字时,左手的小指会很频繁,这是配滚不符合键盘使用规律的,同时也造成了一些重码字。同样,“乃”、“舟底”、“臼”、“荒底”等字根也换到了合理、容易记忆的位置上。 还有,王码删除了少量不十分有用的字根。像五笔字型中有一个“戋”的字根,钱、线、笺等字都要由它组成,不过“戋”可以用“一”和“戈”两个现成字根简单地组成,所以在王码中这个字根被去掉了。 同时,王码增加了大量的有用的字根,像“夫”,有了它使得潜、扶、年、制等字特别好打;有了“甫”,使得浦、铺、簿、敷等字变得十分容易打;有了“甘”、“丘”、“未”、“母”、“皮”、“戊”……不用看,有了这些字根使得许多字变得更易于理解了,字根也看得更清晰了。五笔字型一共有余卖圆字根130个,王码达到了245个,更难能可贵的是仔细研究后会发现,这些字根都是繁体字的重要组成部分,使得王码可以轻松处理繁体字。另外,这些有用的字根的出现,使得重码字减少,像五笔字型中出现最多的重码字是YNKY有“赢、嬴、蠃、羸”四个字,而在98王码中,这四个字则不重码。98王码的重码字比五笔字型要少。 第三,“组”字的方法更为合理,更加考虑对文字的第一直观。作为一种笔型输入法,“组”字的方法有很多,比如一个“养”字,笔者可以用七种方法来拆分它,每一种都可以说出道理来,但只有一种是正确的,所以五笔竖塌字型规定了自己的拆字的规则和习惯,不过五笔字型由于发明时间早,所以在拆字有很多不科学之处。 像离、脑等字,规范地讲是“亠”和“×”的结合,并不是一个“文”字,但五笔字型却将它理解为“文”,严格地讲是不科学的。 像“曳”字,学五笔字型的人都会在这个字上“走弯路”,很少有人能“看出”这是“日”和“匕”的结合,而在98王码中,“曳”的组合方法就科学得多。 “余”这个常用字,和它配合又能组成不少字,但它的下面并不是一个“禾”字,而是“一”和“木”的组合。 “越”是个常用字,但是要把它理解成“土”、“止”、“右框”、“丿”总有些别扭。 “兼”字,要理解为“亦底”,没有一定的“水平”也看不出来。还有“丑”的下面也不是一个“土”。“予”的下面怎么也看不出是个“卩”底。 “延”字,是一个几乎每个人都容易写错的字,五笔字型把它理解为是“丿”和“止”,恰恰是错的,作为小学生,这个字千万注意不要写错。 汉字中的两个常用字“像”和“象”,中间都取了“日”字码,这本身无可厚非,要这样理解也可以,发明人可以有这样的“权力”。但同型字“免”、“兔”和“逸”等,中间却取了“口”字码,初学五笔字型的人在这里都会“犯错”。 再看一些细节上的,“求”的选码,两种版本不一样,98版选的是“一”、“水”、“点”,86版选的是“十”、“四点”、“点”,从发明人的角度看,哪一种都可以,不过五笔字型有一个规律,就是第一码和第二码有多种选择时,往往是“一小二大”,比方“生”第二码不是“土”而是“青头”;“来”选“米”而不选“木”;“不”第二码也是选“小”……,所以从规律上看98版更科学。 从取码的一致性上,86版也有问题,“万”字有三个重码字,如果认为这样取码是正确的话,那么像“敖”之类的字理解起来就有一定的困难,它的取码和“万”的思路不一样,初学者会走弯路。 98王码有些简化带来很大方便,五笔字型的高手最容易出现的错误是像“即”、“退”、“既”等字,因为这几个字分别是“VC”或“VE”,但一旦盲打快了,很容易错,98王码将两种并成了一种,决不会出现错误。 五笔字型的组字取码甚至有“错误”的现象出现。像“靥”字,毫无疑问,这个字的下面是一个“面”字,在五笔字型中“面”字的取码被规定为“厂”、“冂”、“丨丨”和“三”。如果这样取码的话,“靥”字的最后一码应该是“三”,但是这样你会发现“靥”字就和键名汉字“大”重码,由于键名汉字是不能有重码的,所以五笔字型就只好规定了“靥”的最后一码为“囗”(L)。 “蔻”字也常用到,笔者的一个同事的名字就有这个字。但不知是为了避免和“莞”字重码,还是避免和“劳动”两字重码,五笔字型也人为地将“蔻”的最后一码定在了“囗”(L)上。的确这样做重码字少了,但这样人为的规定就影响了五笔字型的科学性、一致性。如果你有兴趣钻研一下所有的五笔字型编码字典,有相当一部分都另外标出了这些字正确的取码,包括王永民自己编写的《王码字典》“靥”和“蔻”也分别标明的是“DDDD”和“APFC”,但如果你这样打的话是打不出这两个字的。 其实,在五笔字型里“囗”(L)这一码是另有特殊意义的,笔者研究了许多版本的五笔字型,在早期版本里,像在2.2版,为了避免重码,很多常用字是靠“囗”码来区分的,像“风和冈”、“去、支和云”、“仁和仕”、“太和丈”、“半和斗”等等;后来王永民是采用“默认第一字,空格键取第二字”的方法来区分的,像4.0版和4.5版。但仍有一些没有改,就是“靥”、“蔻”,即使是目前十分流行的“五笔字型教材”,也都没有指出“囗”的特殊意义和这几个特殊字的打法,更没有说明为什么这样打。当然话又说回来,即使王永民错了也只好“将错就错”,你所要做的就是记住,因为你用正确的取码方法反而打不出这几个字。(笔者新注:这段从今天笔者的感受来看,有些偏颇) 其它还有像“乐”、“乌”、“舆”、“戍”、“阑”、“鸟”、“行”、“步”、“束”、“凹”、“段”、“追”、“凸”等等一些字,这些字在五笔字型中的“组”字方法或是不十分准确;或是难以理解,不过这些在98王码中都得到了很好的改正,使之更加完善科学,更加兼顾了对汉字的直观理解。(笔者新注:此处笔者对原文有简化) 更难能可贵的是王码特别注意了笔���顺序,对于成年人来说,强调汉字的笔顺好像没什么必要,但对于中小学生来说,养成一个良好的笔顺习惯却很重要,中考一定有一道考笔顺的题目,查阅工具书没有正确的笔顺也不行。五笔字型因为发明时间较早,为了组字而去硬“凑”字根,从而形成了一些倒笔划,所以五笔字型不十分适合小学生学习。 像“非”的笔顺应该是“丨”、“三”、“丨”、“三”,五笔字型中是“三”、“丨丨”、“三”。 像“桃”的正确笔顺是“木”、“儿”、“四点”,但五笔字型是以“从左至右”的取码为原则,就弯成了“木”、“四点”、“儿”的倒笔顺了。 像“瓦”字,末笔应该是“丶”。但在五笔字型中却是“乙”。 另外,五笔字型本身的取码顺序也不一致,像“率”是“亠”、“纟”、“四点”和“十”组合,先取了中间的“纟”,但“燕”又是“艹”、“ 两点”、“口”、“四点”的组合,先取了旁边的“两点”,取码的顺序前后矛盾,没有一个前后一致的统一规范。98王码改正了早期五笔字型为“凑”字根而引起的不必要的倒笔划,所以98王码“开创了将汉字输入法大规模纳入中小学教学的新局面,标志着我国汉字输入技术进入了一个新的历史阶段。”(王永民原话) 第四,使“补码”更加完善。“补码”是五笔字型的精华所在,是减少重码,加快汉字盲打速度的最聪明的办法,应该说是王永民的智慧结晶。“补码”对不足四码的汉字以汉字的“上下”、“左右”和“组合”三种结构为原则,规定了一些取码方法。 但是应该说王永民在86年五笔字型发明的时候,补码的取码原则还不是十分完善,像“君”、“乏”等无论怎么看“上下”结构要比“组合”结构要更合适一点,同时也使“君”和“群”避开了重码。 “亏”字是常用字,没有补码打不出来,五笔字型认为这是个“三型”字,但要把它理解为“组合”结构的“三型”字总好像有些困难。 像“我”字的末笔在五笔字型中规定为“丿”,但是同样有一点的“甫”的末笔又是“丶”而不是“一”,这是因为五笔字型规定了“戈”、“成”、“戊”、“戋”等的最后一笔为“丿”,而其它结构的字却不作这样的规定造成的。 同时五笔字型还规定了“刀”、“九”、“匕”、“七”、“力”、“乃”等等字的末笔为“乙”。但如果你真这么理解的话,同型字“刃”字的末笔又是“丶”。所以许多初学者对于补码是大感头痛,连教五笔的老师都认为补码最讲不清楚,甚至可以这么说,连王永民自己都不能“自圆其说”。 这里笔者再仔细分析一下:比方说,“亍”字没有补码打不出来,而“亍”的补码五笔字型中定为“三型”,但同样的一类字“亓”字,没有补码也打不出来,但五笔字型中却把“亓”字定为“二型”,当然这是因为“三型”是一个常用字“井”,可能是王永民为了避开重码而作出的规定,那为什么同样道理的重码字“君”和“群”不用同样的规定分开呢(而98王码把这两个问题解决得非常巧妙)?如果大家有兴趣钻研一下王永民自己写的“最权威”的五笔字型专著《王码字典》里,关于补码这一章,除了几项特殊规定外,其余写得很“含糊”,这就使得初学者甚至是高手无所适从,“无法可依”。所以有的五笔字型的教材上甚至写:“对于五笔字型的取码,你不要去考虑为什么,你只要去花时间记住就可以了……” 但是这一切在王永民的“98王码”中用了一句话就迎刃而解,“补码的取码就取这个字笔划的最后一笔”,多么简单啊!可见王永民在十年中,对五笔字型的成功和不足是十分清楚的,但五笔字型的市场占有率太高了,有许多的高手,已经不允许再作调整和修改了,而这一切的问题都只能在“98王码”中一并解决了。 第五,简码的考虑更加完美。五笔字型和王码中有25个一级简码字,就是说像“的”、“一”、“中”、“国”、“主”、“产”、“不”、“为”、“工”等等只按一下键盘就可打出。同时又有大量的二级简码字,就是说只按两下键盘就可打出这个字。对于打字高手来说,完全掌握一、二级简码是提高速度的主要手段。 86版的五笔字型中王永民是以初学者为中心,所以有些简码设计得不完美。像在“U”键上,一级简码是“产”,但“UT”的二级简码还是“产”,这样就使得“道”这样一个高频字的二级简码被人“占”了,而“道”的三级简码又是“首”,所以“道”字要四键才能打出。 “已”是一个高频字,但在五笔字型中要四笔打出,因为在“N ”键上,“忆”字占了两个,而在98王码中“已”字只要两击就能打出。 “S”键上一击和“SV”两击都是“要”字,那么另一个高频字“根”字要三笔才能打出。 “P”键上一击和“YP”两击都是“这”,那么“亮”字的位置就被占了。 在“I”键上的是最常用的字之一“不”(五笔字型和98王码“不”字的取码也不一样),但是它的二级简码“GI”还是“不”字,这样处理使得“还”这个常用字要三键才能打出(98王码在这些地方设计得就巧妙得多)。这可以说是一种资源浪费。 98王码在简码处理上的一些细微改进也是颇具匠心的,举一个例子:“关”和“头”两个字前两码都是UD,作为二级简码是选“关”呢?还是选“头”呢?应该说很难说出这两个字哪一个出现的频率高,但是与“关”组成的词像“关键”、“机关”、“关门”、“关头”、“关心”、“关切”等等都可以用“连打”直接打出,而“头”字可组成的“连打词”则很少,只有像“头脑”、“心头”等等几个。86版五笔字型这里的二级简码选的是“关”,而98王码选的是“头”,虽然只是一个字的差别,但其中的滋味是很可以体味的,王永民在98王码中简码字“资源”的利用已经到了细致入微的地步。 由于86版的五笔字型的简码字已被人“钻研透了”,王永民已经到了“骑虎难下”的地步,自己也无法对86版的五笔字型的简码字进行修改了。而“98王码” 使王永民终于有机会对这一切进行修正,86版的二级简码字有570个左右,98版的二级简码有620个左右,三级简码字就更多了,使得简码资源得到合理利用。 当然,高标准的看,应该说98王码的简码字的有些改变反而不好,比如原来的二级简码“曾”现在改成了“闸”;“张”现在改成了“乡”, “进”字在98版中是“刊”,单从笔者的使用频率来看,“曾”和“张”、“进”都要比“闸”和“乡”、“刊”要高。好在类似的改变非常少。也有一些字的修改是“迫不得已”,像高频字“列”,86版只有两笔,但98中被“万”占了,只好三笔打出了, 第六,连打词更符合时代感。五笔字型要提高键入的速度另一个很重要的因素就是连打词的运用。短到“我们”、“邓小平”等;长到“中央人民广播电台”、“北大西洋公约组织”等都可以只用四键就打出来。五笔字型自身已经替你“安排”了一些连打词(大约有一万五千个左右)。随着时代的发展,这些安排好的连打词有些已经不常用了,像“克格勃”、“斯大林”、“姚依林”、“高干”、“政审”、“左倾”、“右倾”、“探亲假”、“党的十一届三中全会”等,98王码去除了这些不常用的词,同时又增加了一些富有时代感的词,像“再婚”、“斡旋”、“上岗”、“签约”、“媒体”、“社区”、“休闲”、“超市”、“投资公司”、“技术监督局”等等一大批,使连打词更有现代感。同时,多字连打词大量增加,“螳螂捕蝉黄雀在后”、“联产承包责任制”、“党和国家领导人”、“北大西洋公约组织”、“科学技术委员会”,包括最长的一个由十四个字组成的词――“香港特别行政区行政长官董建华”等都可以四笔打出,如果有兴趣对比一下“五笔字型4.5版”和“98王码”的“多”字连打词的话,会发现“98王码”要比“五笔字型4.5版”的多字连打词(是指四字以上的词组)多大约六、七倍,大大加快了汉字的输入速度。如果你的王码是可以造词的话,这个问题还不十分突出,因为你可以自己造,但你用的是捆绑的五笔字型,不能自己造的话,那你是会十分痛苦的。当然98王码有些词也没有,像“再见”,这可能王永民故意的,如果不是正版不能造词的话就不行,这只有自己想办法了。 最后,我们应该看到,五笔字型已经流行了十几年了,而98王码从问世到现在也只有一年多的时间,98王码的社会使用率在一段时间内不可能超过五笔字型,而且学五笔字型的人还在大量增加,更多的人还是不明白五笔字型和王码的区别。所以笔者建议,想学五笔字型但现在还不会五笔字型输入法的人必须以学习98王码为主;小学生只能学习98王码;会五笔字型但学得不好的人,觉得五笔字型有点难不易掌握的人,尽快改学98王码;而那些五笔字型输入水平颇高,甚至是高手的人就不必再改学王码了,因为高水平的五笔字型使用者对于字根的理解、拆字的规律、连打词的安排都要重新学习,这样做大约要一个星期的时间适应,方法是把汉字中关键的625个字,甚至是GB6763个字用98王码全部打一遍,笔者就是用这种方法熟练掌握了两种“不同的五笔字型”的,但是在改变的初期还是会感到不便,而改变后在相当长的一段时期内不可能有原来打得那么好,笔者用先学的98王码有每分钟键入90字的水平,但用后学的五笔字型就只能每分钟键入40多个字,过了大约一个月,就可以达到90字水平。98和86版王码,在常用字的选码区别比较大,像“不”、“还”、“万”、“夫”、“其”等等;有几个关键的码元有变化对高手不容易适应,像“广”、“几”、“乃”、“臼”等等,要成为“双枪将”这几个地方要有适应能力。 同时笔者还希望,现在出产的各种手掌型电脑笔记本,像“文曲星”、“名人”、“好易通”等,在输入法中赶快加入98王码输入法,因为“会98王码而不会五笔字型的人”会越来越多,谁先占领了98王码,谁就会进一步领先市场。 最后,作为98王码本身来说,也还有进一步发展的地方,比方可以挂接分类词库。无论是“98王码”还是“86五笔字型”的词库都是以政论性文章为主,就是说你打报刊文章时特别顺手,但在打专业文章时,大量的词是没有的,有些人恐怕一辈子也不会打“新华社香港分社”这个词,但一个简单的像“鼠标”这样的词却打不出来;有的人一辈子可能也不会打“王永民”这个名字,想打“鲁迅”这个名字却无能为力。虽然98王码可以自己“造词”,却同时又会引起大量的重码,自己给自己添麻烦。如果能设计出可以自由选择挂接像金融、化工、电脑、经济、法律、艺术等等分类词库的“王码”,既可以屏蔽自己不用的词,避免重码影响速度,又可以满足各类人群的需要,各取所需,各口“齐”调,大大加快汉字输入速度,免去自己频繁“造词”之苦,那将是多么“美好”的啊!