西方专家:中国又打破不可能,让汉字进入电脑他们用了100年
我刷到这个标题的时候,真有点不服气,心里嘀咕一句:又来这种宏大叙事了吧,怎么啥都能扯成一百年。结果我一边拿电脑敲着汉字,一边把资料翻下来,越看越不对劲,手都停了半拍。

原来我们今天觉得理所当然的中文输入和中文排版,当年在很多西方技术圈子里,是真被判过死刑的。不是夸张,是那种很冷的结论:汉字太多,太复杂,没法塞进计算机这套体系里。你想想这句潜台词多刺耳,意思就是你这套文明的载体,进不了信息时代。

行,那就从我这个日常体验开始讲吧。现在我打开手机,敲个拼音,候选词自己跳出来,我打两个字它还能猜我后半句,甚至我打缩写,什么yyds、绝绝子,它都懂。我们嫌它不够聪明的时候,根本没意识到,几十年前的工程师们连让屏幕上出现一个像样的方块字都费劲到想撞墙。

汉字第一次撞上技术铁板,是打字机那会儿。

1876年,清政府官员李圭去费城世博会,看见打字机那一刻,人是震住的。英文二十六个字母,键盘一排,敲敲就能出字,效率爆炸。可他转念一想,中文怎么办?答案很干脆,不行。

这不是“还没来得及做”,是结构上就难。机械打字机的逻辑是一个键对应一个字符,英文字符少,能做成键位。汉字常用就几千,全部加起来上万,笔画还不一样,结构还不一样,你把它做成键位?键盘得做成一张桌子,操作员得像翻药柜一样找字。后来国内确实有人做过中文打字机,体积大到离谱,找字慢到崩溃,一分钟打十来个字都算勤快。那感觉很现实,现代化办公说白了就是效率,你效率上不去,别人就会说你落后。
更扎心的不是打字机,是计算机。

早期计算机按字节编码,一套编码容量就那么点,英文够用,中文根本没地方住。你常用汉字三四千起步,早期那点字符位塞啥?所以那时候出现过很刺耳的声音,有美国学者甚至建议联合国别折腾中文工作语言,理由就是处理成本高,自动化跟不上。听着像是“管理建议”,其实就是技术标准握在人家手里,你不符合他们的默认设计,你就得被边缘化。

我觉得这里才是关键点:当时说汉字不可能进入电脑,不只是“汉字难”,更多是“世界的规则不是为你写的”。键盘布局、编码体系、排版流程,全按拉丁字母来。你想进来,要么你改自己,要么你改规则。
中国走的是更硬的一条路:规则我也要改。

真正把汉字拽进电脑的,是两道坎,一道是显示排版,一道是输入。

先说显示排版。上世纪七十年代,王选团队搞汉字激光照排。你别被名字吓到,起步条件一点不豪华,甚至有点魔幻。他们干过一件现在听起来像段子的事:用黑纸和剪刀,把一个个汉字剪出来,再扫描进电脑做字形库。

我第一次看到这个细节的时候真笑了,笑完又有点酸。你想象一下,一群搞尖端技术的人,像手工课一样剪字。可这事不傻,它背后是一种思路:别老想着让汉字去迁就机器,为什么不能让机器学会汉字?你得先让计算机有能力存、认、画出一个汉字的字形,排版才谈得上。

1979年7月27日,中国第一张激光照排的汉字报纸样张出来了。那张纸可能不够完美,但它证明了一件事:汉字可以数字化呈现,而且能用工业化方式输出。1987年人民日报全面采用激光照排,这个节点其实很硬核,它意味着中文出版业从铅字体系跳进了数字体系,效率、成本、差错率都被重写。

显示解决了,输入就来了。怎么把字打进去?键盘就这么多键,你不能给每个汉字一个键。

王永民搞五笔,是另一种狠。为了摸清汉字结构规律,他搞了大规模的字卡,外界常提的数字是十二万张卡片。十二万张什么概念,我都不敢想那屋子得多乱。然后他用字根拆解的方式,把汉字当成部件组合,给字根分配键位,一个字最多四次击键完成。

1983年公开演示时,一分钟能打出一百三十多个汉字,现场是轰的。你要知道当年很多人一直在讲一个逻辑:汉字复杂,所以效率注定低,永远比不过英文。五笔那次演示有点像当场掀桌子,告诉你不是汉字效率低,是你没找到方法。

这里我插一句个人体验。很多年轻人现在没摸过五笔,觉得那是上古技能。我以前办公室有个老编辑,敲五笔像打游戏,屏幕上字跟流水一样,我在旁边看得头皮发麻。那种速度不是炫技,是一种很直观的结论:汉字输入不但能做到快,还能快到不讲道理。

再往后,就是标准和生态的问题了。你有显示、有输入,但如果没有统一编码,没有系统支持,你还是各搞各的。GB2312、后来的扩展,再到全球的Unicode,把汉字放进统一的字符体系里,这一步很枯燥,但它决定了中文能不能在软件世界里稳定存在。标准这东西不热血,可它是真正的地基。

到了移动互联网时代,输入法又变了一次。拼音输入法、云词库、联想、整句预测,语音识别、手写识别都成了标配。你以为你是在跟键盘打交道,其实你是在跟算法打交道。更有意思的是,当年被吐槽的同音字多、语境复杂,反而给了智能输入更大的发挥空间,它可以靠上下文做消歧,越用越准,甚至比英文还顺手。

所以这“一百年”到底在打破什么?我觉得不是打破汉字本身的难,而是打破那句默认的傲慢:规则只为少数字母服务,其他文字就得让路。

中国人干的事是,把门框硬生生锯大,把地基重铺,把整套链路补齐。王选那种剪纸般的土法,王永民那种堆成山的字卡,听起来都不优雅,但它们有一种特别中国式的狠劲:你说不可能,那我就用笨办法把它磨成可能。

讲到这里我又想到另一个事,很多人现在爱把“鸿蒙生态”“麒麟处理器”“发布会溢价”挂在嘴边,吵得热闹。可你换个角度看,中文信息处理这条路,其实就是我们在基础技术和生态标准上一次很早的胜利样本。不是靠喊口号,是靠把底层问题一个个拆开、做出来、推下去。那才是最硬的自信。
我最后留个问题吧,想听你们的真心话。
当年他们说汉字不可能进电脑,结果我们做到了。现在又有很多领域被人说这不行那不行,你觉得下一个最有机会被打脸的“不可能”会是什么?是芯片,是操作系统生态,是AI基础模型,还是别的?你会押哪一条,评论区聊聊。
