五千年(敝帚自珍)

主题:中国文明只有63岁——《大目标》后记 修正技术错误 -- 马前卒

共:💬216 🌺1256 🌵22
全看分页树展 · 主题 跟帖
家园 原理上证明汉字编码效率低

汉字的熵值是9.6比特,英语字的熵值是4.0比特,一个ASCII码是8比特(提供256个字符),对付26个字母的英语足够了,而无法对付汉字(9.6比特>8比特)--汉字只好使用16个比特的码。

根据申农的通讯理论证明,一个语言的混乱度或非确定性同这个语言的熵值有关。熵值越高的语言,用其进行通信时发生错误的可能越大(容错率低,冗余度低),准确地学习把握使用这种语言也越困难,学习这种语言需要死记硬背的成分也越大,读写分离的状态也越明显。

也就是说我们在通信时要克服不确信度就是要减少熵,高熵值语言要克服的不确信度比低熵值语言明显要多。你要提供更多的负熵来克服不确定性,也就越吃力。

我们可以看到机器“学习”拼音文字使用8位地址的二进制码而“学习”汉字则要用16位地址的二进制码,明显机器“学习”汉字要背上一个长得多的包袱,占用更多的记忆空间和计算能力。

那么推广到人脑这个计算机上,是不是也显示了这个汉字语言系统也有这个特征呢?

有人说计算机技术突飞猛进,拼音字母和象形文字这些差异已经不明显了。

我同意这个计算机技术发展可以克服汉字占地大,运行慢的缺点,但是对人脑这个计算机来讲就不是那么简单了。

首先人脑这个计算机不是生来就是这么有效的---人脑是个随着时间不停进行软件和硬件同步升级的计算机系统--这就是我们所说的大脑发育。

我们的大脑容积随着年龄的增长而增大(也不是无限的),我们的情感逻辑分析能力也是在通过学习而增强,其中语言的掌握对刺激大脑本身的发育和逻辑理性分析能力的意义非常重要。

由于人类学习语言的最佳阶段是童年大脑发育时期,在这个时期如果将大脑置于图形化式的死记硬背某种语言的学习模式中,对人脑思维方式的固化形成有着巨大的负面影响(三岁看大,七岁看老)--敢想敢说敢干这样的勇于创新精神在死记硬背的学习条件下往往遭受夭折--很有可能造成依样画葫芦图形式的山寨文化。

你知道为什么至今汉字就再也不能产生新字(不是新词组)了?--提示一下,这个同占地过大有关系。

一种语言里连新字都无法产生,看到一个字无法读出来或听到一个字无法辨识和写出来,你怎么能要求一个使用这种语言的民族有兴趣去尝试自学,创新和升级呢?

字是语言里最小的完整组成单元,也是语言扩张的最基本起始点,放弃了这个要点,语言就不能进化或进化不快了。

小孩子“牙牙学语”,证明发音对学习语言的重要性,而汉字的非拼音图形化以及读写分离,使得小孩子从小天生具有的语音学习能力被扼杀了,等于把人类的学习能力的至少一半给割除了。

少了一半学习能力的民族,怎么会出现大师呢?

我相信我已经回答了钱学森之问--其实鲁迅先生早就朦朦胧胧感觉到了--救救孩子。

既然知道问题症结所在,当然解决之道就有了。


本帖一共被 1 帖 引用 (帖内工具实现)
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河