五千年(敝帚自珍)

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
全看分页树展 · 主题 跟帖
家园 客观标准

从芝加哥去纽约有很多方式,可以步行,可以开车,可以做船,可以做飞机。究竟哪种方式好呢?我想这跟我们此行的目的有关。

如果以提高民族竞争力为目的,我认为好的文字在使用中,cost应该尽量低。

文字熵可以量化这个cost。

1. 中文文字信息熵9.65比特,英文文字信息熵4.03比特。假设我们用英文和中文传递同样的信息。用英文处理每个字母,大脑平均需要解决4个yes or no的question。用中文处理每个汉字,大脑平均需要解决9个以上的yes or no的question。

2. 1所计算的文字信息熵,只是抽象符号的信息熵。抽象符号和具体实际中使用的符号是不同的。比如在实际中我可以选择用“a”这个具体符号表示一个抽象的字母或汉字,也可以选择用“齉”这个具体符号表示,但是对脑力的挑战完全不同。西方人研究西方文字可以忽略这个问题,但是我们研究汉字就不能忽略这个问题了。我认为无论是“a”还是“齉”都可以缩减为一组像素,然后以计算文字信息熵的方法可以计算出每写一个字母或汉字需要几个yes or no的question。我不知道前人是否已经给这个东东起了名字,做了计算,我姑且叫他符号信息熵。我们假设写一个英文字母需要n比特的符合信息熵,写一个汉字需要m比特的符号信息熵。

假设书写一段同样的信息,英文需要x个字母,中文需要y个汉字,那么:

写英文的cost=x*n*4.03

写中文的cost=y*m*9.65 + 汉语拼音的cost

这里汉语拼音的cost的计算方法,同1,2.

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河