五千年(敝帚自珍)

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
全看分页树展 · 主题 跟帖
家园 新春愉快

我在给墨虎的有关语言编码效率的讨论中给出同音字的可能来源和消除的方法。

西方拼音文字也有同音词,尤其是单音节词,比如英语的:see和sea。但是双音节词就很少有同音词了。所以汉语消除同音字困惑的办法是多字词组。汉语多字词组造成现代汉语变长,但是语义变得清晰。

汉语面临现代社会的大量事物/概念,6000个单字不够,必然需要组成新词汇,单字词已经不够用了,只能用双字词/三字词/四字词甚至更多。

这样我们可以理解其实汉字单字符号就等同于拼音文字的字母符号,本身也记录语音,但是发音没有很严格规则,记录困难靠死记硬背,至少需要800个符号--我的“南辕北辙”那个例子证明汉语用拼音表达其实是很容易的事情---对已经使用汉字的成年人非常别扭,对从来不碰汉字的孩子和外国人,汉语拼音反而非常容易。

比如大家对悲剧的“杯具”表达习以为常了吧?那么“beiju”应该会习惯的。

韩国老年人对韩语中完全去除汉字感到不习惯,但是韩国孩子从小使用拼音,就没有任何困难。胡志明在1945年全面推广越语拼音化,2个月就使得北越扫盲成功--同样50年代的中国扫盲需要2年甚至更长。

汉字同音字和4声使得汉字拼音化出现困难,前者可以通过语言中大量使用多字词组来克服,后者可以用4声符号代表,越南语拼音就把5声符号包括在内,使得越南语共有90多个拼音符号----文字熵就稍微增加到5.8比特,同日文的文字熵差不多,--比英法德语的4.0比特要查,但是比汉语9.65比特要好得多。

使用拉丁字母的汉语拼音可以达到4.3比特-5.8比特的文字熵,应该是一项了不起的成就。因为汉语的文字熵将下降9.65-5.8=3.65比特。

设定大脑每识别/挑选一个汉字符号所需的能量为一个单位,那么汉语拼音化可以将中国人思维时所需的能量减少到1/14(2^3.65=14.4)。换句话说,中国人的聪明才智可以得到14倍的增加。

所以当有人在兜售“汉字是最先进的文字”的时候,其实他想要你愚蠢14倍呢。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河