We're sunsetting PodQuest on 2025-07-28. Thank you for your support!
Export Podcast Subscriptions
cover of episode 中文打字机

中文打字机

2025/7/2
logo of podcast 阿司每日读书分享

阿司每日读书分享

AI Deep Dive AI Chapters Transcript
Topics
解说者:在19世纪末,当世界上的大多数语言都可以通过打字机进行处理时,中文却被排除在外,这使得中文在世界通行的文字处理系统中处于不利地位。这就像现在中文无法在电脑上使用一样,让人感到非常糟糕。即使到了今天,我们已经可以使用电脑处理汉字,但效率仍然不如其他语言。汉字在电脑上是“输入”而非“打字”,因为我们需要在同音字中进行选择。尽管输入法不断完善,但汉字在电脑上仍然需要选择,不是所见即所得。这一系列问题引发了我们对汉字信息化的思考,以及汉字与拉丁字母之间更深层次的矛盾。我们应该如何看待汉字,又应该花多少时间学习文言文和英语呢? 解说者:面对英文确立的技术标准,中文如何突破重围?这是中文打字机曾经面临的问题,也是我们现在和未来需要思考的问题。要解决这个问题,需要对汉字有一种全新的认识。外国人开始了这种认识,主要有三种路径:常见字、拼合和代码。在打字机的设计上,主要采用了常用字和拼合两种思路,而代码则无法进入打字机。在西方中心主义的语境下,周厚坤认识到中文打字机和英文打字机不可能完全相同,因此他以常用字的思路发明了自己的打字机。启轩则以拼合的思路发明了自己的打字机。这些努力都旨在解决汉字的信息化困境。

Deep Dive

Chapters
本章节探讨了中文打字机的发展历史以及中文在信息化时代面临的挑战。从19世纪末期开始,大多数语言都拥有了自己的打字机,但中文却长期缺席。这反映出中文与拉丁字母文字在信息处理方式上的根本差异,以及中文在技术标准制定中所处的不利地位。
  • 中文打字机从未进入家用阶段
  • 19世纪末,大多数语言都有了自己的打字机,但中文不行
  • 中文被隔离在世界通行的文字处理系统之外
  • 本书作者莫雷宁是美国斯坦福大学历史系教授,研究领域是中国历史

Shownotes Transcript

中文打字机从没有进入家用阶段现在我们用电脑输入汉字更用不上中文打字机了

但我们想象一下,在 1890 年代,世界上大多数语言都有了自己的打字机,都是根据拉丁字母打字机改造而来,泰国的显罗文也能用打字机打出来,中文却不行,中文被隔绝在打字机世界之外,也就是说被隔离在了一种世界通行的文字处理系统之外,这种感觉是不太妙的。

打一个不太恰当的比方这就像是现在我们的中文不能在电脑上使用这种感觉肯定是非常糟糕的

中文

中文打字机这本书当中有一幅插图是意大利奥利维蒂打字机 1950 年的一则平面广告画面上方是一块黑板写满了商周时期的甲骨文和金文画面下方是一排漂亮的打字机广告语是从古代到奥利维蒂

显然啊,商周汉字代表着古代,新型打字机代表着现时代 1900 年 1 月,旧金山一家报纸上刊登过一篇小品文说唐人街附近的一家报社里存放着一台中文打字机,配有一个长达 12 英尺的键盘其中上面共有 5000 个按键,需要一个打字机拿着喇叭发号施令

四个打字员在键盘上操作才能打出汉字来这篇文章还配有一张漫画来嘲笑中文打字机那时候中文打字机是一个讽刺性的比喻是空想出来的一种极大极笨拙效率极低的机器即使到了今天我们可以用电脑处理汉字了但其实处理起来仍然是不如其他的语言高效

我们可能还记得种种输入法夏里巴人输入法无比自行输入法全拼输入和双拼输入还有 SOGO 输入法等等请注意啊这个特殊的词汇输入我们在电脑上大汉字为什么不叫大字而叫输入呢

因为其中有一个挑选同音字的过程你打解读两个字可能出现两个选项一个是解读解除一种毒药一个是解读就是给您解读一本书你要挑一下哪个是你想要的结果随着输入法的完善这个挑选过程已经可以忽略但汉字在电脑上依然是输入而不是所打即所得这

这一系列中文在过去和现在的尴尬处境让我们不得不思考一些问题传承四千多年的汉字如何应对信息化呢汉字和拉丁字母更深的矛盾又是什么呢以及我们对汉字应该保持一种怎样的态度呢我们该花多长的时间学习文言文又该花多长的时间来学习英语呢

本书的作者名字叫做莫雷宁是美国哥伦比亚大学历史学的博士现任美国斯坦福大学历史系教授研究领域是中国历史他一直关注汉字的信息化打算写两本书一本讲中文打字机一本讲电脑时代来临后的中文信息化处理咱们先来解读这本中文打字机也希望他的那一本续作能快一点和我们见面

我的解读呢分成了三个部分第一部分我们来说说中文难在哪儿搞中文打字机又难在哪儿呢第二部分我们讲打字机设计者对中文的认识路径简单来说就是常用字拼合及代码第三部分我们来看看中文和拉丁文字之间更深的矛盾它在哪儿

如果英文确定了技术标准和技术进步的环境,那么中文怎么才能突围?这是中文打字机曾经面对的问题,也是我们现在和未来的问题。我们先来进入第一部分,咱们先来看中文打字机的难点它在哪儿。

汉语是不是最难学的语言呢这个事啊很难有确切的答案老外可能觉得四声啊实在是太难掌握了可我们学外语也会觉得变革太难掌握了一条鱼终身在水中游泳我们就在汉语的环境下长大

汉语的本质和历史

这本书是向西方人介绍汉语的开头就说对于习惯字母拼写的人来说写字就是分析发音并把一串音记录下来但汉字不同汉字最初不是表音的而是表意的象形文字

现在的孩子可能在幼儿园时期就接触英语 26 个字母以后遇见英语单词把字母一个个拼出来就算认识了一个词了但孩子学汉语不是这样的 1925 年我国的图书馆专家杜定友写过一篇文章叫民众简字心理略论开头讲了一个小故事

说一个小女孩问妈妈恋爱的恋字怎么写当时还是繁体字妈妈回答说当中一个言左右两旁各有一个角思下面再加一个心字

在日常生活中,人们口头描述一个汉字的组成部分,要描述其结构,传递出这个汉字是什么,比如说木子礼,栗草章。那拆一个汉字,我们有笔画,这是写这个字的顺序,有偏旁布手,这是检索方法,查字典用的。那我们平常说的木子礼,这是什么呢?汉学家周文龙说,

这种拆字方法是中国的笔体学汉字跟英文字不一样英文再长的单词也能一个个字母拼出来汉字就复杂多了讲字音字义字形孩子学起来不容易甲午战争失败之后中国的知识分子做过很多的反思反思我们为什么落后很容易就得出了一个结论教育落后那为什么教育落后呢又得出了一个结论汉字太难了当时

当时有很多人搞汉语拼音方案福建的一个读书人叫卢壮章在 1892 年完成了一套方案叫中国第一块切音新字他说用切音字能使国人读书无依不经是变通中国之大吉物放眼全世界除中国十八省及五子之生番而外

自于日月所照双路所坠莫不以千音为字千音字为普天下万国之功礼业

卢壮璋是在 1892 年说的这番话他既认为拼音文字能够在各国使用实际上啊 梵语是一门很古老的语言但 18 世纪后期连梵语都开始被用拉丁字母转写住音了西方人用他们那一套现代语言学的方法来处理东方语言有个叫艾德温

麦克法兰的人发明了第一台显罗文打字机让泰国的语言能用打字机来处理了艾德温麦克法兰出生在传教士家庭父母一辈子就在泰国扎根了他爸爸编写过显罗语字典也懂印刷术

麦克法兰面对的显罗文有 44 个辅音字母 32 个原音字母 10 个数字符号和 8 种标点符号很显然显罗文的字母比英文字母多字母多那用双键盘打字行不行呢当时还真的有一种双键盘打字机但在商业竞争中双键盘打字机逐步的就被淘汰了从商业上看这是一套标准的建立

单键盘的制造成本更低便携你显罗文 76 个字母也得按照可切换单键盘来重新的设计打字机但是从更深的逻辑上来看这是一个与现代的兼容性问题世界上的各种字母文字和表音文字按照其与现代的兼容性有了一个高低排序英文就是理所当然的现代标准法文西班牙文和意大利文

字母表和英文是高度重合打字机的键盘布局略做调整就可以了俄语对打字机的调整就复杂了一点需要把键盘改成包含 33 个字母的希里尔字母键盘

希伯来语和阿拉伯语就麻烦了这两种语言从右向左写跟英语是反着的阿拉伯文打字机最早是 1899 年设计出来的阿拉伯语有 29 个字母但有不同的字形和连接方式设计者改变了书写方式将字形总数量由 638 个减少到了 58 个不管

不管各种语言的打字机如何设计和改进,它们都有一个信条,那就是不能从底层质疑单键盘打字机,你再怎么设计,也不能改变打字机工厂的金属构件的压住,你要干的是改动最小化。作者莫雷宁总结,语言在工厂中,工厂制造打字机,世界上的语言得适应工厂,这就是现代标准。

我们不搭理这套标准行不行呢干嘛用打字机我们就用毛笔我们有书法文化其实啊也不是不行

但现代化的标准是成系统的比如说印刷和电报中国是发明了活字印刷术但明清时期我们还是用雕板印刷因一本书要在木头上刻出全部的文字来 1880 年大清就有了电报局用电码传文字比用码快多了我们用四个数字的排列组合来对应汉字也能打电报就是需要经过一道翻译

这套汉字电报系统用了一百多年也不算太耽误事儿

现代化的东西是可以普遍适用的就是麻烦一点但这个麻烦一点就是你和现代化的兼容性问题当时英语环境下发明的东西成为现代化的标准你兼容性越好离现代化就越近中文打字机面对的就是这个问题古老的汉字不适应英语所主导的现代化接下来我们来进入第二部分看看中文打字机该怎么设计呢

发明中文打字机需要对汉字有一种全新的认识这个认识是由外国人特别是外国传教士开始的认识路经有三种第一个呢是常见字第二个呢是拼合第三个是代码我们先来说常见字有一位叫做小斯当东的洋人翻译了大清律例也就是清朝的基本法律条文他对自己使用的汉字做了自评统计

发现大清律例最常用的汉字不超过 2000 个掌握 2000 个汉字就能读懂法律条文传教士到中国来一方面读中文经典一方面翻译圣经通过统计字品他们发现儒家经典论语用了 3000 多个不同的汉字

中一本就约全文 503663 个字但印刷所需的汉字是 3946 个先约全文 173164 个字只有 2713 个不同的汉字康熙字典中的汉字有 4 万多个但常用的三五千汉字就足够写文章搞出版了

统计字频这是一种科学方法我们现在学英语会接触到一个概念叫蓝丝值蓝丝值根据阅读材料当中句子的长度和书中的词汇在语聊库当中出现的频率来确定

简单说呢句子越短单词越常见这份阅读材料的难度也就越低像夏洛的网蓝丝值是 680 这就比较适合中学生看读经济学人杂志蓝丝值在 1200 以上这就是你出国留学时应该达到的阅读水准了有了这套标准就有了分级阅读的这个概念蓝丝值和蓝丝阅读分级系统就建立在自评的统计上

有了字品统计就会有汉字字库的概念搞印刷把一套中文金属活字排布的更紧凑就可以让牌子工人在一步之内失去所需的任何汉字其中 500 个最常用汉字放在一起会极大的提高工作效率最早的中文打字机就是以这个思路发明的说是发明其实只是有了设计稿并没有生产出来

设计者是美国的传教士叫谢伟楼他设计的中文打字机是一个大圆盘以同心圆的形式分成了 30 个圈他密密麻麻的排着 4662 个汉字越靠近中心是越常用的汉字整个打字机看上去像是一个小圆桌

这其实呢跟印刷厂剪字的理念是一样的,以挑剪而非输入来进行打印。基于这种理念成型的中文打字机,输入效率肯定是较差,你得经过很长时间的训练才能达到每分钟打几十个字的速度。清末去美国留学的周厚坤先生是学铁路工程和航空工程的,

后来他的热情放在了研究打字机上他发明的中文打字机也是基于字库的理念打字员要在选字盘上挑选汉字选字盘是一个滚筒

尺寸长 40 厘米到 45 厘米直径约 15 厘米上面有 3000 多个汉字经过良好教育的中国人一般掌握 6000 个汉字最常用的 2000 个汉字就覆盖了使用率的一半以上一般来说呢三四千汉字就够用了

我们再来看第二种认识路径拼合能不能把一个个的汉字拆解为各个不同组成的部分呢这就要研究汉字的构字方法最早的尝试者是法国的汉学家包铁和字体设计师李格昂

他们设计了一种拼合活字的理念将汉字拆分康熙字典里有 214 个汉字部首但是对汉字来说部首是一种检索方法是一种分类方法而不是一种构字方法比如时间的时我们说的是繁体字左边是一个日右边是一个寺庙的寺看上去是能拆但是早晨这两个字也都是有日写出来的两个字是截然不同的

跟时间的十里那个日也不是一样汉字是讲究整体性的另外有一些汉字是不能拆的比如无中生有的无繁体字的无包铁和字体设计师李格昂做了细致的工作把汉字分成可拆的

和不可拆的搞出了三千多个部件从设计原理上讲这样的打字机可以用但就是打出来的字太难看了把整体的汉字拆解破坏了汉字书写的连贯性整体性和美感

不过这一路径后继有人跟周厚坤同时代的留学生起宣就发明了以拼合为出发点的打字机在发布会上其效率也是让人哀叹两个小时打出了一百个字这可太慢了之所以慢呢是这种打字法跟我们从小将汉字作为一个整体来认识的那种思维是相反的

他要培训打字员也是比较麻烦的第三种路径就叫代码 1871 年上海与香港之间开通了电报通信两个外国人发明了中文电码选取 6800 个常用汉字按顺序编码为 0001 到 9999 的四维数在电码本当中预留将近 3000 个空位置以供电报员根据工作需要输入一些不常用的汉字

马尔斯电报用长脉冲短脉冲组合成发送字母和数字中文电报由数字传输再由数字转译是天然密电而不是明文电报大清在 1880 年设立了电报局这套系统此后使用了 100 多年虽然有点笨拙但是也比较稳定

在打字机上发明思路主要就是常用字和拼合的两种路线代码这个路径无法进入打字机因为代码是另一种的中间形式在当时西方中心的语境下周厚坤认识到了中文打字机和英文打字机不可能是一种东西他以常用字的思路发明了自己的打字机

启轩以拼合的思路发明了自己的打字机这两位设计的中文打字机都引起了商务印书馆老板张元己的注意

打字机是让语言进入工厂的,中文打字机也要大规模的商业化才算成功。周厚坤和启轩在报纸上写文章互相贬低,商务印书馆老板张元吉选择了周厚坤。商务印书馆是出版机构,周厚坤设计的打字机和中文活字印刷的逻辑是一样的。

但周厚坤在商务印书馆也没能大展宏图后来跳槽到了一家钢铁公司当技术总监商务印书馆来了一位新人叫舒震东他用长方形平面字盘取代了滚筒设计跟谢文龙最初的设计有异曲同工之处商务印书馆投入了大量的财力发展中文打字机部门办公室有 40 多间部门的职员有 300 多人

设备部件有 200 种以上制造的过程有多种工序签字铸造 字盘字表检查 机架组装等等从 1917 年到 1934 年间商务印书馆一共卖出了 2000 台中文打字机一年卖出去 100 多台中文打字机也催生了打字员这个职业北京上海开设了打字学校学生要反复的识别和记忆字盘的排布规则

需要经过训练才能达到每小时打 2000 个字的速度这种中文打字机有数以千计的案件不形成记录记忆是无法快速打字的

1947 年林语堂设计的名快中文打字机问世了这是最像英文打字机的中文打字机它有 72 个按键每个按键看上去都是汉字的一个字机打第一下打第二下都不会出字打第三下会出现八个汉字要从中挑出你要打的那个字这种交互模式不是所打即所得中间加了一个搜索的过程

现在我们所使用的输入法其实就是这种交互模式林宇棠先生开发这台打字机花了 12 万美元可以说把自己大部分的身家都扔在了上面他带着这台打字机去雷明顿公司演示那次演示失败了然而即使那次演示成功了恐怕雷明顿也不会推出明快打字机我们现在只能通过文字描述来猜想明快打字机的构造

用上下行简字法来设计键盘内部构建用星系式排列方法每分钟能打 50 个字听起来很不错但好像生产起来非常的麻烦

西方人提出更简单的思路你们不是有注音符号了吗用注音符号来打字只需要把键盘上的标记改一下就行了内部构造不需要改动西方的打字机工厂能迅速的生产注音符号打字机注音符号是当时民国政府弄出来的拼音是帮助国人学汉字用的而不是用来取代汉字的新中国采用的汉语拼音是汉字拉丁化的一种方法也是帮助大家认字的

汉语拼音也不能取代汉字中文打字机的尴尬之处背后正是中文和拉丁文字之间巨大的矛盾那最后我们来进入第三部分进一步的说说中文与拉丁文字在文字处理上的深层矛盾汉字有悠久的历史也有广泛的影响中国地域辽阔不同方言的人交流可能都听不懂但都认识字都能读文章就能有交流

日本韩国越南一些受过教育的人能和中国人比谈听不懂啊没关系认识汉字啊就好办了这就是文化的力量但到了清末到了现代

汉字文化圈受到了外来文化的冲击汉字的地位动摇了电报 电话 现代印刷技术 铁路 轮船新技术和新思想让使用汉字的人进入了一种表述危机我们来举个例子大家都读过唐诗对五言诗 七律诗这样的体裁不陌生但我们很难想象用七律来歌用火车和轮船再比如说女性第三人称

女字旁的那个他字是新文化运动当中造出来的新字我们以前没有专用的女性第三人称在新的文化冲击之下打字机这东西就比较微妙有一位英国的记者在民国初年就断言汉字只能用笔写不能用打字机这会影响中国的商业交流没有效率商业就不会发达交通也不会发达

历史学家李思纯先生曾经在欧洲留学他说汉字其他的缺点啊且不必说只是不能造打字机这一条就是废除汉字的理由提出废除汉字的知识分子大多曾经在欧美或者是日本留学对外文啊非常熟悉回头再看中文就能看出来中文的不方便

钱玄同先生说文言文看起来简洁实际上啊笼统粗疏含糊你看完之后要仔细的推敲才能明白白话文精密舒畅更为经济那经济这个词成为文字表述上的准则简单说就是方便不方便投入较少利益较大这可以说是新文化运动的一个思路

学古文太难白话文更简单语言是工具有了这个工具再去学科学建设国家而不是花太多的时间学古文弄清楚一大堆的典故这也是一种经济上的考虑

我们来看胡玉芝先生的一段论述,他说,

中国的许多文字已经成为不能兑换的货币甚至是给死人用的纸钱了这是胡玉芝 1937 年的一段话我们再来看瞿秋白先生的观点他说啊用纸笔来记录文字是手工业的方法现在的文字处理要用机器和科学国家要解决商业和交通的问题要解决沟通和沟通效率的问题国家要面对现代化

是否方便是否经济是否更有效率成为汉字的一个衡量标准我们不妨想一下现在你在网上或者是书上遇到了一个不认识的字你是怎么查它的读音和意思的呢你把它复制下来直接百度吗或者用木子里这样的拆字方法将一个生字拆成你认识的两个部分再去网上查吗

还是用原来上小学时学的不手查字法用新华字典现代汉语词典去查呢我们就会发觉查字典会慢几秒还是在网上直接的查更省时间那一百年前人们也意识到查汉字比查字母文字好事更多汉字检索在一百年前遇到的问题就包括了怎么编制中文电话簿怎么弄档案索引怎么整理各种的参考资料

查找和处理中文编写的信息太慢了 1960 年代周有光出了一本小书叫《电报拼音话》他在前言当中说方块汉字不便在电报上传送要把汉字转换为数码用四个数字代表一个汉字

手续繁速度慢成本高周又光希望达到一种所见即所得的效果对用打字机的人来说所打即所得也是天经地义的英文打字机是所打即所得以常用字为理念生产的中文打字机能胜出以拼合为理念的中文打字机也是它更像所打即所得

我们在网上直接的查生字不用指指字典周有光希望传中文不使用电码本都要省略二道中介都是要让所见直接导向所得

周有光他被称作是汉语拼音之父从甲午海战之后中国知识分子弄出了上百种潜音方案 1958 年周有光主导的汉语拼音方案公布之后电报拼音化的可行性似乎提高了他希望电报传输的就是汉语拼音

1983 年周有光还是主张废除汉字改用拼音到 1996 年他的看法发生了一些变化因为电脑时代来临了他修正自己的观点说拼音化的含义不是废除汉字而是利用拼音帮助汉字他说信心化不仅意味着从机械到电脑更重要的是从封闭到开放

周有光先生到了晚年他在一次接受采访时说我到如今还认为中国的文字不太方便在电脑上使用不能跟人家竞争我今天还主张要有一种很方便的中文但是可以保留原来的困难的中文让有时间的人去使用应该有大家不要花太多的时间就能用的语言文字

在新的时代要学的东西多得不得了你不能叫一个青年花大多的时间在语文上面周有光先生这段话出自深入心通国语运动与现代中国一书这是清华大学历史系的教授王冬杰先生的专著讨论的就是汉语与现代性的问题如果你想更深入的了解这个问题可以去阅读这一本书

关于汉语和现代性中国学者有过很多的反思但莫雷宁这本书中文打字机以打字机作为切口让我们从技术和发明的角度来思考语言问题我们前面说了关于汉字的信息化莫雷宁打算写两本书一本是中文打字机一本是电脑时代来临后的中文信息化处理中文

中文信息化处理可能会更多的涉及到中英文的深层矛盾中文是封闭的吗英文就是开放的吗我们很难这样的简单下结论但中文打字机的历史说明了一种尴尬的状态那就是英文确立了一种强势技术我们对新技术起初啊格格不入然后融入其中兼容性却始终的不够好我们要另辟蹊径也是不太可能

很难说我们现在就走出了这种尴尬状态总结以上就是我对中文打字机这本书的解读下面我们简单的总结一下首先 19 世纪英文打字机确立了一种现代化的标准单键盘打字机确立了市场主导地位上下的文字按照兼容性有了远近亲疏之分 1890 年代世界上大多数的文字都可以用打字机

包括西部莱文 阿拉伯文 显罗文等等日本在明治维新后致力于摆脱汉字的影响他们的片甲名打字机是以片甲名来处理日语表英文字都是按照英文打字机来调试自己的文字处理方式孤独的中文要融入到这种技术之中这是一个现代化的进程

其次对中文的现代化处理有三种认识路径常用字字频拼合以及代码代码用来处理电报常用字和拼合用来处理打字机留美学生周厚坤以常用字的路径发明了中文打字机另一位的留学生启轩以拼合的思路发明了自己的打字打字机

商务印书馆采用了周厚坤的思路中文活字印刷和中文打字机都是以常用字的逻辑来进行文字处理的这种状况持续到了 1990 年代电脑时代来临了激光照牌系统的发明让中文信息化发生了根本的变化最后我们今天在电脑上处理汉字已经感受不到太多的障碍了但中文

英文打字机这本书给我们提供了一个思考的角度英文打字机确定其垄断的地位之后其他语言的打字机就只能跟随了吗必须在英文打字机的键盘上去思考怎么处理自己的文字吗打字机是适于英语的一种发明那电脑是吗互联网是吗操作系统是吗

我们的手机和电脑自己的系统都好用吗中文打字机的故事是汉字应对现代化的故事这个故事啊其实远没有结束此外呢我还想提及的就是汉字太有文化内涵了陈延鹊先生说一个汉字的历史就是一部小的文化史鲁迅先生曾说汉字如结合细菌都在其中这两种看法啊截然对立我等徘徊在其间

周有光先生就说你不能叫一个青年花大多的时间在语文上面这种看法对不对呢恐怕每个人都有自己的答案

这两年我们时常听到有人讨论说要不要取消英语的主课地位要不要学英语考英语实际上这个问题非常的复杂每个学生要花多长的时间去学不在日常生活当中使用的文言文要花多长的时间学英语学电脑这不是一个新的问题这是 150 年前就有的问题