五笔应该用怎样的思路去开发
2009年12月22日
先说明一下,本人使用五笔已经近10年了,前前后后用过微软的王码86、五笔加加、陈桥五笔、万能五笔等等好多版本,最后还是锁定在五笔加加PLUS2.81上了。
做出这个选择有两方面的原因。
一方面是词库,五笔加加PLUS利用附带的工具可以自己选择和替换词库,我用的一个2.8万的词库,不多不少,感觉最好。之前用王码86感觉词库太少。
另一方面是界面,五笔加加的界面看着很舒服,可以换皮肤是一个次要因素,主要因素是简洁,上屏速度快,给人干练的感觉,字打快的时候非常舒服。
前几日一个朋友见我打字,问了一问题:五笔为什么快?
我不知道搜狗五笔的开发者(看到QQ五笔也发布了,感觉也没做到很好,所以也同时在想QQ五笔的开发者)有没有思考过这个问题。
答案是五笔的重码少,基本不用选字,大家可以想想如果你用拼音打字,你的大部分时间是花在哪里的,其实键盘的敲击时间是很短的,大量的时间是花在选字上的。王永民先生当年苦心研究的本质其实就是怎样去减少汉字的重码问题。
明白这一点,我们再回头来看搜狗五笔(也包括QQ五笔),能够不选字直接上屏的字词已经远远少于五笔本来的样子,因为加了太多的词库。这一点肯定是受拼音影响太深了,因为拼音有重音,词库越大,在一定范围内,几个音节联合起来得到期望的字词的概率也越大,而五笔本来就是一个以单字为主,辅以少量词汇的输入法,当你注入太多的词汇时,只能增加选词的负担。
所以我的观点:大词库是五笔的大忌,而不是应该拿来炫耀的!
当初搜狗拼音因为有搜索的统计,凭词库(当然还有语言模型)一夜红遍大江南北。但是这个思路放在五笔上是行不通的。
那么,五笔应该怎么走。我有两个观点。
第一,五笔本来是一个不太能再深挖的领域,速度已经接近极致,再快是很困难的,所以不妨在其他方面做做文章,比如用户体验等等,不要再纠缠词库和速度。
第二,如果非要加入词库,不妨借鉴拼音,加入语言模型的识别,也就是说,把五笔的单字输入模式(或者叫四码模式更恰当一些?)改成联合输入模式,就像当初的拼音,大家都在以词为单位时,微软的拼音是以句为单位的。比如“我是中国人”,编码为“Q W K L W ”,那么能不能改成“QWKLW ”(注意空格的区别)整体识别输出?当然,其中有些困难比如编码的拆分是可以预见的,但我想这个思路是不是可以试验一下,如果效果好,五笔的一片新天地又出来了。
还有一个,这种模式的速度与五笔固有模式的速度相比有没有优势?我没有答案。
长久积累的一些想法,供大家思考。也希望能得到有识之士的批评指正。欢迎讨论。
本文发布在搜狐五笔论坛,原帖地址:http://wubi.sogou.com/bbs/viewthread.php?tid=146582