五千年(敝帚自珍)

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
分页树展主题 · 全看首页 上页
/ 102
下页 末页
      • 家园 从达尔文主义者眼中看去

        下面是维基百科的定义:

        文字的发展经历了“图画文字-表意文字-表音文字”这几个阶段。要注意的是,这几个阶段只是表现了各种不同文字出现的顺序及相互关系,并不等于后者就一定比前者优越。

        最后这句话反过来读,就是说这个顺序反映了人类文字的发展变化。咬字眼的话,达尔文不叫“进化”,叫“演化”,那么就是说文字的变化主要是因应人类不同文化中需求而演化出的不同形式。读过进化论的都知道,多样性是进化(或者演化)的一个重要因素。那么这个拼音文字的出现,应该是大量不同语言文字共同生活混合竞争的结果,就是发展程度差不多的文明之间经常相互碰撞的结果。

        中文大约经历的竞争文明多数是自身没有发展到出现文字的,基本上是“同化”对方的结果,因此这个进化的作用不显著,变异比率不高,因此始终是在最原始的图形文字的基础上没有大的变化。

        脑神经的研究得出结论,的确人(包括动物)对图像的观察与敏感度更高更细致,因此这个文字最初出现一律是图形文字是有道理的。相比来说,符号文字的出现应该是文字使用比较复杂或者语言比较丰富后的结果。比如说,拼音文字至少是在音节,辅音出现一个固定的范围之后才可能,而图形文字与音节没关系,因此理论上可以无限多,因此出现同音字的问题,甚至可以说图形文字很可能在历史上在许多文明中是与语言独立存在的,比如一直到近代仍有许多民族有语言但是文字只有简单的图形文字而没有普及,直到遇到中华文明这样比较完整的图形文字被取代为止。

        相对来说拼音文字可能就比较稳定,在一个文明中使用的频率与普及度会更高,与语言的同步发展关系也更紧密。比如许多我们现在叫做方言的语言如果是在拼音文字文明中,大概早就都发展出自身的文字系统成为单独语系,而不是被更为复杂的图形文字取代了自己的简陋图形文字,而不得不在方言与一个叫“普通话”的东西之间挣扎。

        关于文字信息密集度的问题,如果只统计信息量,而不关注信息精确度,那么就会无的放矢。一般短信中都存在场景因素,前提假设等,但是如果是不熟悉的人和事之间通讯,完整不被误读的表达,才是衡量信息密集度的指标。 由此引申,电脑互联网是01码基础上的编码结构,因此信息度可以简单为不同文字的编码量。但是从语言的目的去看,更重要的是这个信息量传递的思想,所谓人与人之间的默契很大程度上就是这个意思,因此完整表达一个思想从外延上去说是个很大范围的信息量,往往也不是一句话可以简单完成的。因此,真正衡量这个信息密集度应该从语义的角度上去做工作。

      • 家园 拼音文字的产生过程在“下篇”中进行了分析

        实际上就是次生文明在原生文明的影响下产生的。所有原生文明的主要文字都是象形文字(但也有拼音文字作为辅助)。所有次生文明的文字都是拼音文字。

        古汉语的信息密度,目前没有相关的研究结果,所以不好说。

    • 家园 偶认为语言不仅仅是通信协议和存储符号,同时也是思维的外壳

      楼主认为语言主要的作用有两个即传输的通信协议,和存储的符号。偶认为语言还有一个作用,那就是思维的外壳。大家注意过米有,偶们在思维的时候实际上在自说自话,或者说是用自己熟悉的语言在大脑里面说话。在通信和存储上面,汉语拥有绝对的优势,但在思维上面汉语是很吃亏的。

      前面说了,语言是思维的外壳,如果将人脑比作CPU的话,那么语言就相当于CPU的指令集。偶认为汉语是一种完全指令集,而英语这样的拼音语言则是精简指令集。西河里面的码农比较多,偶举一个大家都能看的到的例子来演示汉语的问题。就是大家熟悉的英特尔X86CPU的发展过程。

      于汉语的发展的过程类似,X86CPU开始选择的是定义很多的指令来尽可能的描述各种命令。这个过程发展到486以后发觉搞不下去了,于是设计了一个RISC的核心和解码器来运行。汉语也是这样,人们定义了大量的字来描述世界,康熙字典里面搜集了几万个字。这是典型的完全指令集的特点,但是后来人们发现这样既不好记,也不好用。于是人们开始不断的利用少量的常用字来造词。这个过程和X86系列用RISC核心来运行X86指令集的做法很相似。比如河南的古称是豫,用河和南两个常用字代替了一个专用字。

      拼音文字的特点和RISC芯片的做法相似,定义了有限的几个指令,用这些指令的组合来组成各种函数,来实现各种功能。

      汉语的以字组词和英语的拼音组词目的上应该是一样的。在这一点上于X86芯片的特点非常相似,都是CISC技术走不下去以后的折中办法。

      明白了这一点,偶们就会发现汉语的缺点了。X86芯片是目前芯片中发热量最高的芯片,米有之一。也就是说汉语是最为消耗能量的一种语言,在思维的过程中大脑需要消耗大量能量来维持汉语的思维,这对能量供应能力有限的人类而言是非常不利的。

      • 家园 你弄反了吧?

        你输入一个字母a,那代表了什么?就一注音符号而已,它什么也不是。

        ADD,才完整的代表一个指令。

        汉字,一个“加”就够了。

        你仔细想想这个a在汉语叫什么——字~母!如果按你的说法,字才算指令,字母充其量就一堆待加工的原材料,和指令什么的边都挨不上。

        再者VC里的预处理是干毛的。我怎么感觉汉语在这环节比英语有效率。

      • 家园 字母显然不是指令

        单词也不是指令。

        如果一定要说是指令的话,汉语才是真正的精简指令集,用有限的单词,实现无限的功能, 甚至组装成新的指令。

        英语非常无能,经常臆造出一个一般人根本不明白的单词。当然,现在英语有向汉语靠拢的趋势,类似于manmade, homework这样的组合越来越多。

        • 家园 字母记录的是声音,声音记录代表意义。所以字母就是指令集
          • 家园 字母未必记录的是声音,至少不是单一的声音

            确切的说是字母组合记录的是声音。比如英语里A单独读是ei,但在单词里A很少读ei,多是哦,哎。因此A只是这一类原音的一个记号。同理B读成bi,但在单词里实际发音是b,有时又不发音。其他字母也类似。在军语里有另一套单词来给二十六个字母重新定义发音,汉语拼音就更不用说了,虽然看起来也是这26个字母,但发音也大为不同。计算机指令里的字母应该都是单词缩写。

      • 家园 汉语用字组词后,不是已经变成了您说的精简指令集吗?

        相反,我认为拼音文字才是您说的完全指令集。汉语的常用字远小于英语应该没有疑问吧?比如主贴中的公鸡、母鸡。在英语中要用完全新造的指令来标示:rooster,hen. 而汉语只需要一个鸡相关的指令,还有公用公母指令,就合成了这个概念。相对指令数,英语表达需要2个。汉语只需要1.000002个(这个0.000002其实可以无限小下去,因为它被太多其他指令公用了)。

        您的指令集概念很有启发性。但结论是不是推反了?

        • 家园 你显然将指令集和函数搞混了

          偶认为汉字是汉语的基本指令集,就像字母是英语的指令集一样。而由字组成的词和用字母组成的词,都可以称为由指令集构成的函数。就像偶在帖子里面写的那样,汉语的多字词是复杂指令级搞不下去以后借鉴精简指令级的办法搞出来的折中办法。

          汉语的字同时兼有字母和词的双重作用,就像英语里面的单字母词一样,不过汉语里面的单字词比较多。

          • 家园 我不认为字母是指令,他们不承载意思,和汉字的笔画没有区别

            与汉字同等地位可以被看作简单指令的是英语字根,他们是最小意思单元,同时可以组成符合意思。比如lun是月的字根,与月有关的复合词大多有这个字根。但他们字根来源很复杂,组词方式也不规律,还处在从简单完全指令集向复合指令过渡阶段。这个字根的庞大程度一点不比汉字集小,而且还很重复,还有许多字没有按这个方式组。比如关于车的单词,就没有统一字根,每一个词都是相互没有关联的基本指令。

            你可以看出,汉语已经是完全的面向对象语言--.net了,英语还是VBA,有class概念了,但还没有大规模运用的初级阶段。

            通宝推:林风清逸,
        • 家园 偶不否认汉语在通信和记录上面的优势,

          偶认为汉字是汉语的基本指令集,就像字母是英语的指令集一样。而由字组成的词和用字母组成的词,都可以称为由指令集构成的函数。就像偶在帖子里面写的那样,汉语的多字词是复杂指令级搞不下去以后借鉴精简指令级的办法搞出来的折中办法。

          汉语的字同时兼有字母和词的双重作用,就像英语里面的单字母词一样,不过汉语里面的单字词比较多。

          通宝推:二手玫瑰,
      • 家园 弄反了

        汉语的基本词汇(指令)明显少于英语。

        举例来说,鸡蛋,鸡肉,你不能简单看成两个不同的指令。

        由于大多数汉语都是组合词,大脑可以预处理(类似指令预测)。所以,大脑在得到“鸡”的时候,

        就开始工作了。

        但是在英语种,在egg,chich完成之前,大脑并不能开始处理。

        就最基本得词意单元而言,汉语明显少于英语。

        • 家园 偶认为英语和汉语的词汇应该米有数量级的差别

          之所以感觉汉语的词汇少,是人们混淆了词汇和字之间的差异。实际上很多字本身也是词汇,很多词也可以被拆成字,严格意义上的词汇应该包含单音词和多音词。

          针对你提到的现象,偶认为那是复杂指令集的特点,即每个指令本身的能力很强大,精确。这为语言的使用提供了方便,同时也提供了非常庞大的指令集。相反的英语里面鸡肉和鸡蛋几乎是完全不相干的词汇,这本身是精简指令集的特色,指令本身米有什么意义,仅仅记录声音,声音才代表意思。

分页树展主题 · 全看首页 上页
/ 102
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河