五千年(敝帚自珍)

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
全看分页树展 · 主题 跟帖
家园 如果只考虑文字,应该可以省略这一项

单独考虑语音。英文发音决策树解决的是,从抽象字母到音素的对应。中文发音决策树解决的是,从抽象字符到音素+声调的对应。中文多2比特,也就是用两个yes or no的question解决四声的问题,但是表达同样的信息中文使用的汉字会少于英文使用的字母。所以很可能就是对消。

所以全域的cost可以表示为:

写英文的cost=x * (4.03 + n + E)

写中文的cost=y * (9.65 + m + C + 2)

假设:

1.英文字母的符号信息熵为n,汉字的符号信息熵为m。

2.英文的音素信息熵为E,中文的音素信息熵为C。

3.书写一段同样的信息,英文需要x个字母,中文需要y个汉字。

-----------------------------------------------------------

这还只是决策过程的cost。训练和调用决策树本身同样需要巨大的cost。决策树的尺寸越大,建立,维护,和调用决策树的cost就越大。4.03和9.65这两个文字熵,量化了英语思维者和中文思维者,不同决策树的尺寸。

1. 语言决策树越小,就越容易训练。所以,英语民族的人读写比中国人早,心智成熟的比中国人早,小时候有更多的时间玩。

2. 语言决策树越小,能耗越低。语言决策树过大,必然挤占逻辑思维的能量,挤占逻辑决策树的空间。使用大型语言决策树的人,只有把语速放慢才能保证准确的逻辑思维。温总理的大脑一定在反复调用语言决策树和逻辑决策树,而且总理两个决策树都极其庞大,所以才会说的那么慢。

3,语言决策树越小,表达越精确。语言决策树越庞大,决策过程越容易出错,造成词不达意,甚至影响后续的逻辑思维。(纠错的cost也要考虑,不过那是另外一个topic了。)

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河