主题:【原创】简化字的使用效率 -- 钛坪樽逾
对于简化字的争议,关于字形美感啥的,可以说是主观因素,见仁见智。那么,关于使用效率,就可以客观地说说了。但仅是业余观点,希望能抛砖引玉。
首先,简化字的出发点恰恰就是为了提高使用效率。
我觉得汉字的使用效率大概可以从教学、书写、印刷和阅读这几个方面来衡量。建国初推广简话字,侧重点显然是为了易于教学、书写和印刷。考虑到当时的国情,要扫盲、提高受教育人口比例、占领文化宣传阵地,等等,这是正确的优先级。提到汉字书写的效率,当然不能忘了那只”忧郁的乌龟“了。
简化字形和减少笔划带来益处惠及这四个方面,比较容易理解。合并字形,比如“髮”和“發”合并为“发”,虽然增加了一个多义字,会稍微降低阅读上的效率,但是减少了必需的活字字模数量,这也是一种提高印刷效率的手段。再者,汉字历来就存在一字多义的情况,并非始于简化字。
减少活字字模数量可以降低成本,生产、运输、维护环节都受益。常用字少了,印刷机的字盘尺寸也可以减小,排字操作可以更快捷,工人也更容易学习。其实,排字工并不需要在意“发”字是用在“理发”里还是“发财”里。
除了铅活字印刷,以前还有很多刻蜡纸的简易印刷机。算算我小学时,每次考试的试卷都是老师自己用铁笔在蜡纸上刻出来的。刻写简体字,当然要比繁体字容易了,学生读卷子也更清楚。这个也是简化字带来的效率。记得卷子上老师的字迹也会大小不一,应该是为了让某些复杂难写的字不糊成一团。当然,这个兼有书写和印刷两个方面。
这些简化手段对阅读效率的负面影响,其实问题不大。人类在做阅读时,大部分情况下,并不是逐字逐词去读的。有人做过试验,包括中文,把一段文字抽掉或换掉几个、十几个字母或字符,大部份参试者都可以正确无误地阅读理解。就是说,人类大脑会根据上下文,对缺失、模糊的信息进行脑补和修正。我不知道这个理论是啥时候出现的,但我觉得搞简化字的那帮人应该知道阅读时上下文语境的作用。
说到“拔”和”拨“,这俩确实相似且容易混淆。本来读音和意思就接近,简化后的字形更是只差了一个点儿。但是呢,当你真阅读包含这两个字的文字时,结合上下文,其实不难区分。倒是书写时,容易错。在简化字出现前,汉字里已经有不少字形上很相近的,比如“日”和“曰”、“茶”和“荼”、“鹜“和”骛”啥的,简化后不多“拔”和”拨“这俩。而反过来,有些字简化后,还把容易混淆的某些繁体字在字形上区分开了,比如“裏”简化为“里”后,与“裹”在字形上的区别就很大了。所以,讨论简化字的阅读效率,不光要说“拔”和”拨“,还得说“里”和“裹”。
汉字通常的印刷和书写尺寸不大,在那么丁点儿地方里,要考虑历史传承和美感,能做的实在不多,进行字形简化有点儿螺丝壳里做道场的意思。
后来的数字时代,还有输入效率问题,倒是与一简无关。但是,在数字时代之初,简化字带来了一个意外的好处:对显示器和打印机的分辨率要求没那么高。我曾经用过 16 针的点阵式打印机打印中文,相同字号下,简化字要比繁体字清晰不少。字号稍微小一点,有些繁体字就开始变成墨团儿了。
能通用繁简的是各种基于发音的输入法。
汉字输入法的关键指标是编码效率,要尽量缩短码长,同时减少和避免一码多字。简化字相比繁体字到底是提高了五笔输入法的编码效率,还是降低了,还真不好说。
我不会五笔,只知道一些编码和拆字的原理。如果有谁会五笔,看我说的对不对。
字形合并后,总字数少了,会增加编码效率。但是,某些字笔划减少后,会不会使重复概率增大呢?比方说,“洒”和“酒”简体很接近,五笔拆下来,可能是重码。(用这俩字是假设他们重码)
而“洒”字的繁体是“灑”,“酒”字繁体不变。如果有繁体五笔,那么很大可能两者拆下来不是一个码。但是,繁体的“灑”拆出的五笔会不会又和其他字重合了呢?
最关键的是,五笔输入法就是根据简化字的字形、字根还有笔划归纳优化出的拆字规则和方法。这些规则和方法用到繁体字上,要得到最优解,可能还得变通、更改。可以参考这个知乎问答。
看起来,还真没法具体定量分析,除非有人真去试试。
大概就是这么意思,算是更正补充一下原帖。
- 相关回复 上下关系8
🙂【原创】简化字的使用效率
🙂仔细想想,简化字其实会影响五笔输入法的 钛坪樽逾 字1303 2021-01-07 01:55:36
🙂洒和酒并不重码 2 梓童 字318 2021-01-07 04:22:43
🙂谢解释。那“雲”应该不会和“去”重码吧? 钛坪樽逾 字0 2021-01-07 11:58:24
🙂仅仅从字型来看不会重码 2 梓童 字123 2021-01-07 18:54:24
🙂最典型的是网友嘲笑湾湾人”忧郁的台湾乌龟“梗 26 梓童 字346 2021-01-07 00:06:52
🙂湾湾好可怜的 7 白玉老虎 字629 2021-01-07 08:04:08
🙂没办法,他们智商就那么高, 几十年没变过 qianji 字0 2021-01-07 11:29:40