五千年(敝帚自珍)

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
全看分页树展 · 主题 跟帖
家园 中文的问题还是概念模糊

首先,是采样失真。一个新的概念被发现,需要用词汇加以定义。这个定义的过程是对客观世界采样的过程,也是下面逻辑思维的基础。

在数字移动通信领域,工程师针对话务设计了Speech codec。这种Speech codec不同于一般的audio codec。它是在统计的基础上,针对人类语音设计的。它的编码效率高,可以用有限的数据流量把人类话音传递的惟妙惟肖。Speech codec也可以用于encode and decode音乐,但是质量很差。因为Voice codec不是设计用来传递任何audio的,它是单单用来分析和过滤人类语音信号的。

外链出处

中文在设计思想上与speech codec非常相似。汉语的codec就是这上万个汉字,其中包含了农耕时代以及农耕时代以前,中国人通过实践和幻想所建立的全部概念。但问题是:

1.汉字不能无限创造。事实上,我们也没有大量创造汉字。

链接出处

链接出处

2.人类的大脑无力接受太多的汉字。一般人,5000字就是极限了。

所以当中国人面对各种新知识,新概念爆炸的时代,不得不用一套针对过去时代设计的codec采样。汉语一方面编码效率高,另一方面存在采样失真的问题,就好象用手机听音乐一样。当然,在日常这根本不是问题,但是对那些需要挑战智力巅峰的聪明人就是一种制约。

具体来说,当一个新的概念形成以后,我们会组个词来定义这个概念。

对于英语,这是个精确定义的过程。在今后的使用中不存在模糊的空间。如果不知道词义只能查字典。

对于汉语,存在两种可能:

1.不精确定义。组个词就当是定义了。汉语的词一般不长,很难做到精确定义。按照PBS的说法就是“取样步长过大,造成细微细节缺失”。

2.精确定义。但是每个汉字都是表意的,所以每个新的词语都存在两个含义:一个是字典上的精确定义,一个是字面含义。两个含义同时存在就是模糊,就是不精确。现实中,我们必然望文生义,因为表意文字的内核就是望文生义。

所以汉语的不精确在采样阶段就已经产生了。最终的出路只能是大量引入外来语,就是楼下陈经说的。其实从现实来看,中华文明目前在地球的地位就是“次生文明”,所以直接用原生文明的发音来指代是“最简单的方法”。过去我们这样做过,汉语中大量的现代词汇都是日语。

其次,中文是一种非常消耗脑力资源的语言。

1.楼主指出了,中文是“压缩存储”。压缩存储是要额外消耗CPU的。

2.中文是前置为主。前置需要表达者一次性组织整个句子,占用宝贵的内存资源。

3.中文组词容易,所以词汇泛滥。同样的程度的人,“中国人的词汇量比美国人大得多”。检索这么多的词,必然要额外占用CPU和内存。这个cost有时甚至超出临时组词的cost,所以中文表达者经常临机造词。

这些消耗不是没有代价的。逻辑思维同样需要资源。资源不够,聂卫平会走臭棋,诸葛亮会变成臭皮匠。如果不信,你用one,two,three代替1,2,3,看看同样的高考数学卷子是不是还能满分?


本帖一共被 5 帖 引用 (帖内工具实现)
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河