主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学
文字信息熵是个非常直观的概念,其核心就是猜出下一个字符需要回答几个Yes or no的问题。为了有效率,问的时候会先问常用字。问题一层一层排列出来就是一个决策树。
对于一个只有0和1的符号体系,只需一次问答,信息熵就是1。使用英文符号体系,决定一个字母平均需要回答4.05个yes or no的问题,信息熵是4.05。对于汉语符号体系,决定一个汉字平均需要回答9.65个yes or no的问题,信息熵是9.65。
-----------------------------------------------------------
信息熵大的语言,决策分支就多,决策树就大。这导致一些问题,比如:
1.决策次数增加,决策错误的可能性也增加,导致表达不准确。
2.交流的时候,把更多的精力放在语言本身,而不是语言背后的逻辑。
3.训练决策树的代价太大。小孩子迟迟无法开始阅读和写作。
4.训练出某种简化的决策树。好处是容易学,代价是表达的精度下降。
- 相关回复 上下关系8
🙂西方总是倾向于把中国的历史缩短 34 陈王奋起 字341 2015-03-17 10:31:08
🙂这个问题其实很简单,背诵一下乘法口诀表就行了 1 anne2607 字56 2015-02-27 15:10:08
🙂看来很多人对那个所谓的汉字信息熵还很不理解 4 假设 字5177 2015-02-27 00:05:33
🙂文字信息熵是个非常直观的概念
🙂英国人的研究证明用汉字大脑需要消耗更多能量 4 PBS 字608 2015-02-28 22:33:39
🙂呃,用英语表述一下 羊年 ? 帝企鹅 字171 2015-03-21 09:07:59
🙂能量不就是用来用的吗? pseudo 字56 2015-03-20 16:14:55
🙂这充分证明了汉语的优势 7 直到永远 字64 2015-03-01 02:45:07