五千年(敝帚自珍)

主题:【原创】浅谈汉字与拼音文字的比较 (上) -- 人间树

共:💬169 🌺543 🌵7
全看树展主题 · 分页首页 上页
/ 12
下页 末页
家园 【原创】浅谈汉字与拼音文字的比较 (上)

首先得承认,这个题目不太严谨,感觉有点象燕子和哺乳动物的比较一样失衡,但暂时为方便的缘故牺牲一下严谨性还是值得的。汉字相对于其他的文字的讨论,历史已经相当久远,许多名家学者都发表过意见,能说的早已说完。我今天再来说一遍,并没有什么新东西可以讲述,而只是着力于把一些旧东西说清楚。

一 意义,语言和文字

语言和文字都是表达和传播意义的工具。这里所说的意义包括两种,一种与客观世界发生直接关联,如 apple和苹果与

其所指代的客观对象,另一种是语法意义,如but 和但是所表达的语气转折。

任何语言,文字的产生,发展乃至学习和运用,无外乎是对下图中的三种关系A,B,C的构建和把握。

点看全图

二 语言的优先性

在图一中,语言和文字是并列的,没有把语言相对于文字的优先性表达出来。事实上,这种优先性在集体和个体层面都很明显:

1 所有民族都是先有语言,后有文字。

2 没有文字而只有语言的原始部落到今天还有存在,而有文字无语言则是无法想象的。

3 所有人在识字之前必先学话,而不是相反

4 会说话的文盲比比皆是,而懂文字不懂语言则不可思议。

在进一步讨论文字之前,记住这一点很重要:

无论用什么方法建立关系B,C,意义与语言之间的关系即关系A 总是已经现成的。

三 由意义到文字的三种思路

第一,拼音文字

点看全图

根据图二所示,拼音文字放弃了意义与文字之间的直接关系C,而代之以

C = A + B

其中A总是现成的,而B由少量字母和拼音规则确立。

第二,象形文字

象形文字试图直接建立起意义与文字之间的关系,

点看全图

这种做法的好处是直观性,如

点看全图

外链图片需谨慎,可能会被源头改

点看全图

外链图片需谨慎,可能会被源头改

而坏处有两方面,一是很多意义无法用形来表示,而只能通过同音假借来解决,如第二人称的,用女性的女,莫要的莫,用日暮的暮来片借,这样做的结果,自然使得直观性完全丧失。另一方面是 关系 A,B(B由A,C比较而得),C全部分别构建,记忆负担太重。

第三,音形文字

音形文字的出发点是,既看到了拼音文字中语音与字形的直接联系,又对象形文字的直观性难舍难分,试图集二者之长于一身。

这种想法很好,但实现起来,很难说集二者之长,倒很容易集二者之短。

点看全图

如图四所示,关系B,C都是虚线,表示这两种关系的模糊和不可靠。

怎么会这样?

下面我们就以隶变之后的汉字为例来说明一下。

通宝推:墨虎,leqian,
家园 【原创】浅谈汉字与拼音文字的比较 (下)

四 汉字作为音形文字的缺陷

1 隶变使得独体字的直观性完全丧失

在论述象形文字直观性时,大家都喜欢以日月水火为例,而在隶变之后,日成了格子,月成了梯子,水火的象形更是无处寻觅。

那么,为什么要隶变呢?因为书写效率要求如此。形的因素在独体字的范围中可以忽略不计。

2 形旁分类功能的局限

直观性的丧失,使得独体字的学习成了完全的死记硬背。但常用独体字啃完后,就可以尝到一点甜头了。

当已认识的独体字作为一个生字的形旁出现时,这个字的大致含义就有个方向了。比如认识木字后,大致也可以猜到椴也是一种树名。

这是汉字作为音形文字所具有的一个很大的优点。

但是,这个功能是有局限的。

首先,形旁本身发生了很多讹变。如

肝肺脏腑,跟月亮没有任何瓜葛,月是肉的讹变而已。

玫瑰琳琅,跟王侯或姓王无关,斜王旁是玉的简写。

又如从页,从寸的字都与书页或尺寸没关系。

又如岀,岁,这两个常用字中的山都与字义没有任何联系。

如所谓的四点水,实际是火形,主要用于热烈烹煮,但点,燕,羔等字也四点,就容易造成混淆。

其次,在很多时候,已识字是声旁还是形旁并不明显。

如休和沐,雄和维,灶和杜,在完全是生字的时候,你无法判断,要,隹和土对字义有无贡献。

3 语言演变使得语音与字形的直接联系毫不可靠

在论证汉字优越性时,很多人喜欢强调语言的易变性和文字的稳定性,以我们更容易读懂古书来说明汉字对于保存文化传统的积极

意义。

这一点在某种程度上对的,(但没有那么夸张,这点可以以后详论)但这一点使得音形文字的出发点也变得摇摇欲坠。

形声字的初衷本来应该是以声旁表声,同声旁的字必同音,否则形声字就失去了意义。

我们来看下面的例子:

工,红,江,虹,缸,扛,杠。

这些字最初本来同音,而在语言的演变过程中,各有际遇,以至于在读音上本是同根生的一家人在读音上已经形同陌路,而字形上的面目相仿,反倒成了读别字的一大来源,学生认字认半边一直是小学语文老师挥之不去的恶梦。

4 好钢没有用在刀刃上

在任何语言和文字中,词汇都不是同等重要的,而可以根据使用频率分为常用和不常用的部分。

语言文字中的常用部分就是刀刃,任何语言文字的学习都要从刀刃入手。

原则上来说,形声字应该是构成声旁的字最常用,最先被认识,然后以它们为基础逐步扩展,去认识以它们为声旁的新字。

而汉字的形声构成常常违背了这个规律。

比如说,爸爸,妈妈,奶奶,爺爺,(简体更无规律。)

巴,马,乃,耶是声旁,当你一开始学识字写字时,这有意义吗?

谁是先认识巴,马,乃,后知道爸爸,妈妈,奶奶,爺爺的呢?

这并不是特例。

鸡狗,花草,太阳,月亮,星星

都是如此,既需要拆分,拆分又只是拆出更难更不常用的字来。

五 文字学习的现实场景

以上从理论方面对汉字作为音形文字与拼音文字进行了比较。

现在我们来设想一下文字学习的现实场景。

假定汉语和拼音文字(以下以英语为例)作为母语的学习难度一样,一个中国小孩小华和一个美国小孩tom在入学前都掌握了几百个

词汇,可以进行简单的语言交流,下面是他们学习文字的场景。

tom 首先学习字母歌,一堂课即可完成。随后是拼写规则,一旦学会基本的拼写规则,就可以没有大碍地读写他入学前掌握的词汇。比如读书 读到rose,根据规则拼出读音,马上就知道这是自己见过的一种花儿。

反过后,如果tom要写rose这个字,他只要 稍加注意,不要写成 wrose或roase 就可以了。

小华要先从笔划学起,然后是拼音,然后是已经丧失了直观性的独体字,然后是合体字。

如果小华读书,读到玫瑰,他打破头也读不出音,而读不出音,哪怕家里就种了玫瑰,天天都说,玫瑰真香,小华还是不知道那是什么。反过来,如果小华要写玫瑰这两个字,他无法从meigui的音得到任何线索,除了老老实实抄写几十遍之外别无他法。

这是常用字范围的情况。

这之外呢?

这之外大家都需要一个终生的老师——字典。

英语有专门的一个词lexical order,字典序,在英文字典中,排序是很自然的,按字母顺序一路排下去就好。

而对汉字来说,没有什么自然的字典序,这就造成了检字的困难。

通行的检字法不外乎部首法,拼音法和四角号码法。

部首法很麻烦,有时找准部首并不容易,字典中还常附一个难检字表。

拼音法以知道待检字的发音为前提,在学生字时几乎无用。有些人喜欢猜生字的读音,然后去查,但你用 准侪柜这些字试试 。

四角号码法需要专门学习,而且是人为规定,如果不是坚持使用,很容易又忘记了。

由此可知,在检索生字方面,汉字是很不利的,也就是说,对于自学是很不利的。

文字是一种工具,比较文字就是比较工具,那么比较工具有哪些标准呢?

以我看来,不外乎三个标准:

1 能干什么

2 易不易学

3 易不易用

汉字与拼音文字对比,在第一个标准上是不分高下的,基本是可以说没有什么是两种文字无法互译的。

在第二个标准上大幅落后,请注意,这就是汉字的最大缺陷,这不是某一个无关轻重的缺陷,而是一个无法忽视的决定性的缺陷。

这个缺陷的关键在于,没有充分利用语言与意义之间业已确立的稳定关系A。

最早的切音字运动者卢戆章说:“

窃谓国之富强,基于格致。格致之兴,基于男妇老幼皆好学识理。其所以能好学识理者,基于切音为字,则字母与切法习完,凡字无师能自读;基于字话一律,则读于口遂即达于心;又基于字画简易,则易于习认,亦即易于捉笔。省费十余载之光阴,将此光阴专攻于算学、格致、化学以及种种之实学,何患国不富强也哉!

在第三个标准上曾经大幅落后,

书写的繁难是汉字简化的基本理由。在电脑出现后,书写问题得到了缓和。

这也是现在一些人是重新鼓吹汉字优越性的的底气所在,但他们没有或不愿看到下面这些事实:

1 易用与易学的关联

所谓在游泳中学游泳,这话用来形容语言和文字的学习再恰当不过。

很少有不会说母语的语盲,因为任何人都时常在使用母语。

而文盲大有人在,就是因为难学而少用,少用而更难学。

在电脑时代,要真正学会字的写法,还是得一笔笔地重复。

书写的繁难意味着,同样的练习时间,tom可以得到比小华更多的练习

次数。

2 汉字编码输入不是从天而降的,而是无数人付出无数心血结果。

新时代甚至产生了一个新成语,万码奔腾。

这样巨大的社会劳动原本应该产生什么样的社会价值?

拼音文字的民族没有在输入编码上花一分钟时间,他们的劳动用在了别的地方,他们的科学继续保持领先。

3 汉字编码只是一种人工约定,与汉字并不完全相容

拼音输入我就不谈了,越成熟越是给汉字拼音话打广告。

形码,论市场占有率以五笔王码为尊,论科学性一般以郑码为最。

但用过这两种输入法的都知道,没有一种能做到真正地遵守笔顺规则。

要方便,在选取部件时就必须取大优先,而这就必然破坏原有的结构和书写顺序。

4 汉字编码的学习耗费了大量社会劳动

所有的形码作为人为规定必然难学易忘,没有几个月的上手时间,根本无法自如地写文章。

而一旦使用时间减少,又很容易遗忘。

5 汉字输入的扩展性很差

语言和文字的发展都是先创造基本单元对应客观事物,再以基本单元的组合来对应新的事物。

基本上,汉字和拼音文字都告别了创造时代,而进入了组合时代。

但是,创造的需要有时还会零星出现——而且,一旦出现,就必然万分重要。

比如Entropy,Fractal,前者我们也对应创造了熵,后者我们组合出了分形。

谁也无法预料,以后还有什么新概念,假如Entropy出现在电脑时代,我们就很可能得不到熵这个译名,

所有新元素的译名也同样如此。

这样,拼音文字还何留了创造,我们就只剩组合一途了。

王力先生说过一句话:

最难学的文字也不一定是最坏的文字,。。。譬如最难爬的一棵树,它的果子并不一定是最不好吃的。

只因难认难写就怪汉字不好,这完全是一种功利主义。

王力先生的这个比喻有一处妙味,大约是他自己都没有清楚认识到的。

假如说有两棵树结味道不同而营养值相同的果子,一棵很难爬,另一棵很好爬,

假如从果腹充饥的角度来说,我想人人都会冲好爬的去。

而从美食的角度出发,那就永远没有结论了,就为那滋味,我爬山涉水也乐意。谁能说什么?

如果只把汉字当作意义——营养的载体,那汉字拼音化是势所必然。

吕叔湘先生说:

说来说去,简化汉字只能是一种治标的办法。不管怎样简化,改变不了汉字的本质,仍然是以字为单位,字数以千计,无固定的次序,不能承担现代化文字工具的重任。有些人想在简化汉字上打主意,把字形简到不能再简,把字数减到不能再减,用来代替拼音文字,这恐怕是徒劳的。要真正解决问题还是得搞拼音文字。

而把汉字还当作审美——味道的载体,那对大部分人来说,付出辛劳就是心甘情愿的。

事实上,我们还是喜欢吃蔬菜水果,而不是图方便吃维生素片了事。

所以,要大大方方说为了汉字独有的文化韵味,我们愿意吃比别人更多的苦。

但不要自欺欺人地说什么科学性。

通宝推:墨虎,fighterbruno,
家园 好文章

但希望比较的还要全面一些

比如信息量,比如阅读理解的速度,比如对新生事物的适应能力等等,还有许多。

最重要的一个问题是,哪种语言更适应未来的发展,或者说,哪种语言有助于生产力的发展?

家园 举例也别拿英语举例啊

英语是言文一致的文字么

家园 本来该用德语的

但估计这里懂德语的不多,只好用英语了。

英语的确不是言文一致的文字,但相对于汉字来说优势仍然明显。

大致来说,英汉对比如下:

1 英语

字母集+ 拼音规则集 + 例外集

2 汉语

笔划集 + 部首集 + 独体字集 + 合体字集 + 例外集

bat back bake fat fade run wrong

这方面英语的确不如德语,同一字母发不同的音,同一个音来自不同的字母组合的情况较多。

但这些问题还是比较好把握的。

如一个开音节闭音节就可搞定很多问题了。

而汉语同声旁的字,在声母,韵母和声调上都可能大相径庭,没有类似于开音节闭音节那样的规律可寻。

另外很多违反规则的情况来源于外来语,这是任何语言都没办法的。

而汉字并不例外,

大月氏,龟兹,般若,南无

每个异读都得另记。

此外,外来语在拼音文字中是整体存在,

而在汉语中可以分为单字组合,而对意义产生误导。

如般若波罗蜜多心经,波罗蜜多本是彼岸的音译,而不了解的人总以为跟水果波罗蜜有什么关系。

我还曾亲眼看到有人在某论坛问歇斯底里四个字的意思都跟狂暴心理无关,如何能组合其义出来,

竟有人回答,这就是我们汉语博大精深之处。

在拼音文字与汉字的比较中,以英语为例,是在下让子棋了。

家园 拼音化把十亿人重新变成文盲的机会成本比字典难查高多了

高到不是一个数量级的程度。和qwert键盘一样,当初设计就是为了不让打字员打字太快同时打出常用字母造成机器卡键,结果就是qwert键盘是打字最慢的键盘字母排列方式。问题是就是有更好的键盘字母排列方式,原来的打字员要重新学习打字方法。已经掌握一种打字方法的打字员变回和新学者一个水平。大家要雇的都是熟练的打字员来打字,不是专门来验证理论上更优越的打字机。最后qwert键盘变成世界标准。所以是工具来适应人,而不是人来适应工具。

家园 QWERT键盘的故事是个myth

S. J. LIEBOWITZ 和 STEPHEN E. MARGOLIS 在Journal of Law and Economics Vol. 33, No. 1 (Apr., 1990), pp. 1-25 有篇文章The Fable of the Keys

外链出处

里面指出没有什么证据说明其它键盘设计优于qwert键盘。

Abstract:

This paper examines the history of the QWERTY typewriter keyboard, often put forward as the archetypical case of markets choosing the wrong standard. Contrary to the claims made by Paul David and Brian Arthur, we find virtually no evidence to support a view that QWERTY is inferior to DVORAK. Instead, using records of typing experiments, studies by ergonomicists, and examining the historical record of competition among different keyboard designs back when QWERTY first became dominant, we conclude that QWERTY is about as good a design as any alternative.

家园 那当初为什么不按字母ABCDE来排, 这是最容易记的。
家园 说两句

一直没人反驳,那我就说几句。如果能因此引来对汉语的更深刻的批判,就好了。至少我不会再死心塌地的维护汉语了。

先说明我的观点,在现阶段,世界上通行的几种语言足够用了,问题是,现在的语言能否适应将来的发展。

第二,语言,其流行程度,是国力的表现,和语言本身无关。

先说汉语的五条缺陷。

1,这是没有办法的事。

2、3、4,这三条,是形旁和声旁的问题。总之一句话,本来,形声是很好用的,但随着时间流转,言语变迁,形声不好用了。形旁不再明义,声旁不再示声。

现在不知道有没有这样的统计,即现在的形声字中,依然能够从形旁明义,从声旁读声的形声字,究竟有多大的比例。

形声字不再形声,这是语言发展的必然。作为一个存在了几千年的语言,有这样的语音变迁,很正常。

(另说一句,先学爸再学巴,是教学方式的问题,而且,之后,也能明白芭的读音;而艹,也能让人明白大概的意思。)

5,这一条,归根结底,是编码的问题。很严重的问题,貌似,也是现在无解的问题。

但查字典,就实在不值得大说特说了。

再来说语言的三个标准。

——能不能用。现阶段,都能用,还都挺好用。

——易不易学。汉语挺难。难处楼主已经说了。

但英语也不是楼主说的那么简单。

按楼主的说法,英语为母语的人,天然有义——音的联系,而音——字联系,又因为有固定的拼音规则,而易于学习。

但是——很多事情就怕一个但是——现在是一个知识爆炸的时代,常用单词很少,而专业单词越来越多,这些词,是需要专门学习的,至少,需要重新建立义——音联系。

在这里,汉语,即使在专门的科技文章里,也很少有僻字,在这里,需要建立的是字——义之间的联系。

====

(这里改一下,是字(词)——义之间的联系)

两相比较,孰难孰易?我不敢断言。

——易不易用。在这里,楼主的比较是很模糊的。

书写繁难,的确,写起来是累。但英语能够多快?

这里,必须保证书写的清楚和正确。

谁有英语和汉语写字速度的数据。个人感觉英语写起来要快一些,但不敢保证。

输入麻烦。这和查字典麻烦是一个道理,没有一个合适的编码方案。这的确是个大弱势。

但现在,把汉字输入计算机的问题已经解决的差不多了,换句话说,这已经不是一个问题了。

当然,五笔和郑码都需要大量时间学习,依然是个弱势。

拼音化,呵呵,韩语就是拼音化的吧,还有越南语。看看他们遇到的麻烦,就知道,拼音化的成本高到不可想象,还是不能轻易实行的。当然,这不代表汉语高明。

找到一种更好的编码方案,只能期待科技进步,或许,第一步就是以汉语为本位思考问题,而不基于英语。

这更困难,相当于重写科技史。

任何事物都可以一分为二的看。

比如,汉语可扩展性差的弱点,引出了汉语只能组合而英语可以创造的优点。

但,这也是汉语包容性强,和英语词汇量无限累积的征兆。

(在这里,大家也可以试试,是记住熵和分形更快,还是背下Entropy,Fractal更快。

也就是,建立一个新的义——字联系更快,还是一个音——义联系更快。)

引申出一个终极问题:英语究竟需要多少单词?

还有很多汉语的优点。比如更快的阅读速度,更高的信息表达量,这些,楼主都没有谈到。

实际上,这些也是汉语编码困难的反面。

复杂的书写带来了编码的困难和与二进制计算机的不兼容,但同时,能够高度的集成和高效的表达。

顺道说一句,王力好像是同意汉语拼音化的。

另外,美也是人类的追求。在比较两种语言时,美不应该被刨除在外。

我只是外行,希望楼主说说其他语言的问题,以和汉语做一个全面的比较。

家园 记住键盘对打字的帮助并不大

即使今天,你一下子让我说出QWERT的设计我也做不到,我得闭着眼睛,一个一个字母打,然后一个一个字母在纸上记下来。打字就是要做到见到单词,无意识地就知道指头向哪放。初学者即使记住键盘设计,还是不会瞬间意识到字母在哪个指头。键盘设计对学习速度没什么影响。

家园 你怎么知道汉语有更快的阅读速度

我的汉语英语阅读速度差不多。

我是先见到熵后见到Entropy,先见到Fractal后见到分形。我的印象里,汉语英语的记忆难度差不多。

汉语组合象"分形"也是新词汇。分、形都是极常用的字,但是我学过不少博士水平的数学分析,概率,微分方程的课,见到分形这两个字我还是不知所云。因此学到这个新概念,你还是要记一个新词,同英语没有区别。

关于汉语省纸,以前有人提到,为什么不回到文言文?关于汉字的美,回到繁体字不是更美?我觉得这些都不是关键问题.

家园 知道啥叫科学符号么

英国人看到123456是怎么读的?123456跟one two three four five six有什么关系?

+-,跟plus minus又有什么关系?

如你所言,无论中国还是英国的学生看见+-在写法上都无法跟jia jian和plus minus联系起来,只好死记无法从音得到任何线索,除了老老实实抄写几十遍之外别无他法。

家园 你别忘了

德国换正字法也就近几年的事

还不如用法语呢

家园 汉英阅读速度

呵呵,你应该是个特例。注意,你的英语比普通人好,而且好过你的汉语。

我之所以说汉语阅读速度超过英语,是因为汉语更高效的表达——即更短的读字时间。

当然,这需要统计数据的支持。

关于熵、分形和Entropy,Fractal,我是从一个普通人的角度说,即,背诵Entropy,Fractal这样两个单词,和记忆熵、分形这两个字(词),究竟是汉语可以更快的记住,还是英语?

也就是说,是汉语的字(词)——义的联系更利于记忆,还是英语的义——音联系?

汉字的美,只是比较的一个方面,而不是全部。

家园 不只如此呢

汉语是“活”了几千年的文字,有音形义的变化很正常,或者说,出现楼主所列的汉语的2、3、4三点缺陷,很正常。

而德语或者英语,历史太短,还比较符合“语法、词法规则”,不知道,数千年后,德语、英语的规则还能剩下多少。

全看树展主题 · 分页首页 上页
/ 12
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河