靠五笔阻止汉字“拉丁化”的英雄王永民

编辑发布:jack | 2018-01-03 18:47:40

【星网专讯】


(图1:发明家王永民)

在一代80、90后“中年人”的童年里,都曾日思夜想过一台“小霸王”学习机。只要在塑料外壳中,插上一张游戏卡,就能让人连玩三天三夜不停歇。那么问题就来了,你到底是怎么才让父母同意买下这么台“误人子弟”的机器?想必大家还是小学生时,就早就看穿一切——“妈,我想学五笔打字。”就是这么个一击必杀的理由,让多少“再穷不能穷教育”的父母中了我们的诡计。

然而,五笔输入法的出现,可不止是拯救了大家的童年。从某种意义上来说,它还真切地拯救过汉字,化解了汉字被废除的危机。

文字出现以来就一直处于不断的变化中,有的文字得到了传承,有的文字却悄然消失。而在近代的中国也有过一段,想以拼音文字取代方块文字的“汉语拉丁化”改革。特别是随着计算机时代的到来,拉丁字母更因易于输入,让方块字受到了前所未有的威胁和挑战。


(图2:汉字拉丁化产物)

正是发明家王永民,创造了“王码五笔”,缔造了汉字与26个西文按键的“无缝连接”,才化解了此次危机。只是现在五笔输入法已被拼音输入法基本取代,很少再有人提起王永民这个名字。

1943年王永民出生在河南一个贫困农家。但在那个年代,知识也真切地改变了他的命运。通过刻苦的学习,他以6门功课均分99.75的高分,考上了当时科技泰斗汇聚的中国科技大学。马大猷的电子学、严济慈的普通物理、华罗庚的数学、钱学森的力学,这些大师的课他都听过。在这人才济济的地方,王永民也马上向这些大师看齐,想争取在30岁前当上教授,为现代科学做贡献。

但人算还是不如天算,大学毕业那一年他就赶上了那个特殊的时期。按照指示,他种了两年水稻后,便被分配到四川永川山沟里的一家研究所工作。当时瘦弱的王永民,再加上水土不服,就染上了肝炎和肾结石。整整8年时间里,他就在病床上地躺了6年。而原本打算趁年轻打拼出一番事业的王永民,现在是人到34岁还一事无成。到1978年,王永民才被调回老家河南南阳,在科委当一名低调的办事员。

当时科委里面,就有一台日本人发明的汉字照相排版植字机。这台用于印刷的排版机,虽应用到了当时较先进的光学技术,但其本质还是与铅字排印无差。当时工人还是需要从硕大的字模盘上,逐字挑选汉字,确认无误后印在纸上制版。所以这种方式,也称为排字,分“采字”和“植字”过程,还不能称之为打字。此外,这台机器在输入汉字时还不能校对,只要一出错就要重新照相制版,非常麻烦。当时川光仪器厂是花了9万元,才解决了校对这个问题。


(图3:印刷业用的照相排版植字机)

但是负责改良排版机项目的王永民,却对这种大键盘深恶痛绝。当时他就对总工直言不讳地说,“能改错又怎样,谁又能记住24个字模盘中的上万个汉字,你能在上面找到自己的姓吗?”这话马上把总工激怒,他大骂王永民,“你想给我当徒弟,还得再学三年!”王永民好歹也是中国科技大学出来的高材生,他也受不了激将法,便心一横地想发明一种更简易的键盘。当时南阳科委就拨给了王永民3000元,先让他搞搞试验,找到好的汉字输入方案再从长计议。

那时,计算机初入中国,汉字还因难以输入电脑面临着生死劫难。因为计算机本来就是从英语世界发展起来的产物,其键盘自然也是按照西文思维设计,26个字母即能拼出所有英语单词。但是想要用它来输入数以万计的汉字,在那个时期几乎是不可能的。那时候,国内外就形成了一股强大的舆论称中国的方块字必将消失,中国文字注定要走上拉丁化道路。所以不少人也预言“计算机将是汉字的掘墓者”,而要用拉丁文代替汉字的呼声也此起彼伏。

当时怀揣着3000块的王永民,便踏上了将无数汉字塞进26个按键的奋斗旅程。那时他跑遍了上海、苏州、杭州等各个情报所查阅资料,但都收获甚微。当时,他能找到的只有美国电脑大王王安基于“三角编码法”的99键输入法。三角编码法是由台湾的胡立人等提出的编码方案,根据字形特点将汉字分为三个部分,取角顺序为从左到右,自上而下。而每一角对应三个基本符号(共六位数)。如“角”字用“72 78 41”表示。

虽然它只用数字键即可操作,但却并不是只用9个键就能完成输入,而是真的共有九九八十一个键位。而且它的每个键位都包含了好几个字根,还需要用辅助键的方式,才能精确选字。毫无疑问,王永民对这种键数庞大,难以记忆的输入法,并不决定采用。

当时王永民还找到了主编《英华大辞典》的郑易里,拿到了其研究多年的“188键汉字编码方案”。然而当他把《现代汉语词典》中的12000个汉字,根据编码图将字根分好类才发现,也竟有800对重码。

没有办法了,找不到现成的编码方案,王永民只能决定从零学起自己来做。他一头扎进各种文字工具书中,开始对12000个汉字的字源和结构规律进行分析研究。经拆分排列、反复检查,这12000多个汉字才化成了600多个字根。

把汉字拆成字根,尚算有章可循,在这之后的合并字根才是最繁杂最让人崩溃的。600多个字根,一个字根便代表着一个按键。只有把字根不断归纳合并,才能实现键位的压缩和键盘的小型化。然而每减少一个字根,王永民就得把国家标准的7000多个汉字重新编码并多次检查。而每压缩一个键位,他又必须把之前排好的数以万计的卡片推倒重来。此外,汉字输入法还不是单纯的将汉字和词根排列。

他除了要像人形电脑一样不断试错外,还需要在bug——重码出现的时候想出新的方案解决。例如“汪”跟“汗”字,最后的一笔都是横竖,而“只”跟“叭”只是组成位置不同。所以他就提出了“末笔字型识别原则”,在同一类字的最后加上一个“识别码”,让输入时不用选字就能实现盲打。


(图4:领导在视察了“五笔字型”)


(图5:1983年《光明日报》的报道)

138键、90键、75键、62键、36键……他用了整整4年时间,终在1983年摸索出我们熟悉的26键五笔数输入法。

这消息一出,马上引起了华人世界的轰动。在那个大多数人都在为汉字输入电脑造“新键盘”和“大键盘”的年代。王永民这堪称“中国第一软件”的五笔输入法就直接实现了汉字与26个西文按键的“无缝连接”。

五笔输入法虽名为“五笔”,但其实每个字最多只需四码便能完成输入。之所以叫五笔,是因为王永民将其字型按第一笔笔画“横、竖、撇、捺、折”分为5种,并在26个字母键上划分了5个区域。而他的最大的优点则是重码率低,几乎不需要选词,就可以直接实现盲打。

这个方案,是直接堵住了那些说要废了方块字,将“汉字拼音化”的人的嘴巴。在领导检验了“五笔字型”后,中央也直接否定了“汉字走拼音化”的道路。当时新华社还将五笔字型誉为,中华文化史上“意义不亚于活字印刷术”的重要发明。而靠着这项发明,王永民也获得了印刷界的最高奖——毕升奖。


(图6:五笔字型键盘字根总图与口诀)


(图7:五笔字型 利国福民)

在这之后,王永民则开始投入到五笔输入法的推广阶段。然而推广一项发明,可不比发明本身简单。他在北京租的一处地下室,有时连一天7元的房租都交不起。日复一日地,他都踏着破旧的单车,不厌其烦地登门各个机关、部门、工厂作宣传演示。因过度疲劳和营养不良,身体本来就不好的王永民也经常受到病魔的折磨。严重的时候,王永民还在兜里揣了一份6000字的遗书,以备不时之需。还是在1986年底,靠着美国DEC公司的20万专利款,王永民才搬出了阴暗潮湿的地下室。

在这之后,随着电脑业的迅速发展,“五笔字型”才得天独厚地迎来了发展的春天。最厉害的时候,其覆盖率达到了90%以上的用户,使全社会步入了全民学五笔的时代。当时王码还一度被嵌入了微软Office的组件中,且成了用人单位招聘的一项重要指标,大量五笔学习班也如雨后春笋般出现。就连那个自带五笔字根键盘的“小霸王”学习机,也颇受青睐,成为许多人童年的回忆。

所以上个世纪90年代,“王码”这二字倒过来念也是完全成立的,是毋容置疑的“码王”,普及程度极高。

然而达到了全民五笔的境界,王永民却越发感觉力不从心。在推广过程中,王永民就算日夜操劳他都不觉得有什么。毕竟身体上的累,怎么也比不上被盗版的心累。当时许多生产计算机和汉卡的厂商都预装了五笔,但就是不愿向王码公司支付专利款。而为了知识产权,王永民是打了近5年官司,最终都还是以败诉收场。

此外,由厂商们发起的“倒王永民俱乐部”还趁火打劫地,再次起诉王码公司侵犯了其荣誉权。结果竟也是王码公司败诉,并赔出了一大笔巨款。在这之后,王码便彻底地沦为“免费的午餐”。现在市面上的各种五笔,也绝大部分都是采用的86版本的五笔编码标准。从那时起,王码公司的经营也一落千丈,公司的银行账号、办公地点也被牵连查封。

当年流传着一句话“阳光、空气和王码,是中国三大免费使用的东西”,便是对此事最大的讽刺。而王永民也只能自嘲,“我是一介书生,不善于经商,不善于管理。”

其实后面王永民也苦苦挣扎过,更新到了98版、新世纪版王码五笔和靠单手输入的“王码鼠标”。但“86版五笔”已足够优秀,能满足日常需求,谁又愿意再多花一分钱去选择有专利的版本。而在免费使用“王码”时,谁又可曾想过其发明人的艰辛。到后来随着智能拼音输入法的出现,日常生活中也越来越少有人使用五笔输入。现在只有政府机关、银行和会计等领域中,五笔才是这些需要大量录入文字的专业人员的首选。

而早年意气风发喜欢用“中国的比尔·盖茨”来形容自己的王永民,到最后只能谦虚地评价自己:“我最大的贡献不过是参与了汉字渡过世纪难关的科研项目,并发明了五笔,使我们的汉字没有走入死胡同。”

(文/ SMETalk)