
![]()
|议史纪
|议史纪
苹果做了几十年电脑;微软全球通吃,却没搞明白“王选”是谁。
全世界最顶尖的科技公司,一边发布AI大模型,一边却在中文输入法面前抓耳挠腮。搞笑的是,最早让汉字进电脑的,不是什么硅谷天才,也不是华尔街资助的科技大牛,而是一群中国工程师。
他们靠着剪刀裁纸、手绘字根、码卡片、烧脑编码,把全世界都搞不定的“方块字”,硬生生塞进了电脑。
![]()
汉字几十年被技术系统边缘化
这事儿放今天,可能就是某个国产大模型“多模态输入”里的一句补充说明,但在40年前,这是一场事关文字生死的技术突围。当时的世界共识是:中文太复杂,不适合电子世界。
现在的全球现实是:你能在任何一台设备上敲出“你好”,那是因为有人当年不信这话。
上世纪初,打字机席卷欧美,成为现代办公的象征。西方人用26个字母就能完成日常所有书写工作,一旁的中文却被当成“电子世界的异类”。
最早提出这个问题的不是程序员,而是清朝官员李圭。他在1876年费城世博会第一次看到打字机时,说出了那句后来被无数人引用的话:“惜不能印华文。”
![]()
这不是感慨,是技术与文化的真冲突。西方的字母系统是线性的、可拆解的,机械按键可以标准化。但汉字不同,每个字都是独立单位,结构复杂,笔画各异,根本没法像英文字母那样一键一字母地处理。到了20世纪初,日本搞出了全假名打字机,泰国也造出了本国语打字机,只有中文被全球一致判定为“打不出来的文字”。
中文打不出来,不是因为中国人不努力,而是因为整个信息系统从设计之初就没考虑让汉字进场。字母表、排版逻辑、编码方式,全是为拉丁体系服务的。这种排斥不是阴谋,而是默认。
更严重的是,这种技术排斥在1949年前后达到了一个极端:当时有中文学者建议联合国取消中文为工作语言,理由居然是“难以电子处理”。
这话听着像笑话,但当时很多人是认真的。更有甚者,在国内也产生了“废汉字”的声音。《新青年》杂志上的钱玄同直接表示:“不废汉字,必亡其种。”这不是危言耸听,而是他觉得中国要现代化,只能全盘西化,包括语言。
![]()
可问题是,语言不是说扔就扔的。汉字成千上万个,承载的不只是意思,还有文化认同、历史脉络。你可以学习拉丁字母,但你没法让13亿人都从此只说拼音。
于是,一条更难但更有价值的路出现了:既然你们的系统不接纳我,那我就自己造一个能接纳我的系统。
汉字的信息化命运
1974年,北大计算机研究所的王选启动了一个在当时几乎没人看好的项目:研发“汉字信息处理与激光照排系统”。
在那个拼命买西方设备、学外文代码的年代,王选选择了最难啃的骨头——让电脑学会“认识汉字”。
当时的计算机编码是8位,最多处理256个字符,英文+数字+标点绰绰有余,汉字常用字起步就是7000个,压根塞不下。更别说每个字都要有图形、结构、笔画,涉及的是图像处理,不是文字组合。
![]()
简单来说,英文是积木,汉字是雕塑。
王选的方案听起来有点“手工艺”:用剪刀裁字根、用黑纸拼图形、拍照扫描进电脑,再编程控制激光打印。
一个字一个字地“教”电脑认识汉字。这事儿放现在,连中学编程班的学生都嫌麻烦,但在那个没有字库、没有模板、没有AI的年代,这就是唯一的路。
1979年7月27日,第一张使用激光照排技术打印的报纸样张《汉字信息处理》问世。这是中国第一次用非西方体系完成的汉字排版输出。很多人以为这只是印刷更新,其实它改写的是语言在电子世界的“存在方式”。
到了1987年,《人民日报》全线采用王选团队的激光照排系统。效率提升20倍,成本下降大幅,印刷事故减少90%。更重要的是,这套系统100%国产,彻底摆脱了对西方印刷体系的依赖。
![]()
王选说了一句话:“别人用计算机搞英文排版是顺流而下,我们做中文排版是逆流而上。”这不是一句鸡汤,是当时中国工程师的真实处境。没有任何国家、公司、技术为你预留接口,那就只能自己硬拆墙。
王永民的“五笔”
电脑能理解汉字了,下一步是什么?显然,是怎么“打”进去。
拼音输入法听起来是个不错的解决方案,但一试就废了。原因很简单:中文同音字太多。“银行”“银杏”“迎行”都叫“yin hang”,电脑分不清,效率低得离谱。当时普通话普及率也不高,拼音输入根本没法大面积推广。
这个时候,南阳的王永民干了一件比王选还难的事:他要让汉字像拼图一样被打出来。1978年起,他用1800天,写下了12万张卡片,纯手工拆解常用汉字的结构和笔画,建立了一个“汉字结构周期表”,然后创造了五笔字型输入法。
![]()
五笔的逻辑是:把汉字拆成字根,分五个区,每个字最多敲四下键盘。比如“你”字,按“NTR”,每个键都代表一个结构单位。这不是死记硬背,而是结构识别。说白了,拼音输入是“猜字”,五笔输入是“拼字”。
1983年,王永民在全国公开演示五笔输入法,一分钟输入136字,直接秒杀所有拼音输入方案。媒体当时怎么说的?“这是中文输入的一次登顶一跳。”
1984年,中国引进11万台个人电脑,中文输入成了系统级难题。拼音还在实验室阶段,只有五笔能稳定输入,效率高、准确率高,成了各级政府、新闻机构、办公系统的首选。
全国掀起打字热潮,从高校到培训机构,人人学五笔,一句口诀“王旁青头兼五一”成了80年代的入门暗语。
五笔不是简单的工具,它是中文自己争取回来的输入权。没有它,中文用户得靠拼音打字、靠英文界面、靠西方系统设定的逻辑活着。王永民的意义在于,让汉字在输入层面拥有了话语权。
![]()
中文信息化的逆袭之路
进入21世纪,拼音输入法突飞猛进,智能ABC、搜狗、百度输入法等相继上线,语音识别、OCR扫描也逐渐成熟。
今天中文输入法超过1000种,几乎覆盖了所有可能的使用场景。但问题是,如果没有王选的字库标准、王永民的结构逻辑,这些新技术根本无从谈起。
说白了,今天你能在手机上用语音打“粤语+普通话+英文+火星文”,那是因为当年有人把“认字”和“打字”这两个最基础的问题解决了。
没有这些结构底层的技术突破,今天所谓的“自然语言输入”就只能是西方语言的独角戏。
而最值得一提的是:这些人没靠资本驱动,也没靠海外留学加持。他们用的不是AI,不是大模型,不是多模态,而是剪刀、卡纸、算盘、算盘脑子。他们的技术没有开源社区,没有开源代码,只有一个目标——让中国人继续用自己的文字工作、生活、表达。
![]()
这条路走了超过100年,从打字机时代被拒之门外,到今天可以用中文写代码、做设计、发推文、聊GPT。很多人不知道这背后的故事,但不代表它不重要。
这不是“电脑终于支持汉字”,而是汉字自己打破了技术壁垒。不是西方系统善意地开放了接口,而是中国工程师用几十年时间,把门给撬开了。
所以我们今天敲下的每一个“你”“我”“他”,都不只是一个字符,而是曾经被世界排斥的一种文明,在信息时代的自我证明。
全世界都说不行,中国人说:那就做给你看。
参考资料:错过了打字机时代的汉字,是如何进入电脑的?湃客:差评 2022-02-04
由于平台规则,只有当您跟我有更多互动的时候,才会被认定为铁粉。如果您喜欢我的文章,可以点个“关注”,成为铁粉后能第一时间收到文章推送。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.