五千年(敝帚自珍)

主题:中国文明只有63岁——《大目标》后记 修正技术错误 -- 马前卒

共:💬216 🌺1256 🌵22
全看分页树展 · 主题 跟帖
家园 还是读过一些的

信源编码和信道编码是这样理解吗?

现代信息论的创始人、美国数学家商农(Claude Elwood Shannon)曾经提出了“ 商农信道编码定理” 。这个定理指出, 在一个非扩展的无记忆信源中, 用二进制代码表示的码字的长度不能小于信源的嫡。汉字的摘值大, 其相应的二进制码字的平均长度也就很大, 即使是一个最优的信道编码系统, 其二进制码字的平均长度至少也应与汉字的嫡值相等, 这就必然要影响到通讯的效率。从这个意义上说, 汉字的嫡值大对于信道编码是不利的。

汉字的熵值是9.65比特,恰恰超过ASCII码的8比特值,所以必须采用16比特码--现实中,汉字编码采用2个字节,每个字符的确占用16比特。

在中文信息处理中, 汉字的嫡值大, 也给它在计算机上的输出和输入带来很大的困难。尽管现在汉字在计算机输出和输入已经不成问题, 但汉字输出输入的效率比之于拼音字母的输出输入效率要差得多。中文信息处理不仅仅只是进行汉字的输出和输入, 还要开发人机对话、机器翻译、中文自然语言理解等高技术的智能系统, 这些工作必须编写大量的程序。如果用汉字来编写计算机程序, 而不用拉丁字母来编写程序, 这样的程序的运行效率肯定是不会很高的。从这个意义上说, 汉字的嫡值大对于中文信息处理也是不利的。

上面的回答是不是解释了你的汉字通信的信道和信源问题?

对于人类的大脑这个在发育时期体积和性能不停扩增的CPU来讲,被高熵值编程语言占领过的运算区域而造成的格式化和模式化,可能永久地影响了这些区域在未来的发挥创造性和逻辑性的功能--我实在希望这些影响将是积极的。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河