五千年(敝帚自珍)

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
分页树展主题 · 全看首页 上页
/ 102
下页 末页
        • 家园 所以你是在说英文不好么

          数据都给你了,自己算。三个字母相当于一个汉字3x4.05=12.15>9.65。英文字熵更高,所以英文效率低。

          • 家园 你所说的效率其实是redundancy

            你所说的效率其实是redundancy。在通讯中为了纠错必须有redundancy。汉语redundancy少并不一定是好事。古文的redundancy更少,连标点符号都省了。可是真拿出来,我看大部分人断句就要学好几年。

            另外 Shannon计算过英文单词的单词熵,这个值是11.82。至于汉语的词熵,依我的看法,汉语没有空格,仅仅一个断词目前的计算机程序都搞不定(需要一个非常庞大的决策树),现在还不是讨论的时候。

            • 家园 那你到底觉得熵高好还是低好?

              给个说法呗。

              现代中文一样一堆标点符号,除了空格一点都不少。

              再说这和断词有个毛关系啊,先不说中文断词早就基本搞定了,英语word对应的就是汉字啊。

              至于冗余度,您倒是给个标准,到底多少才是“好”啊,没标准何来“未必好”啊。别来个只要是英语类的就是“好”,这种跪舔思想恶心的很。

              其实语义的冗余度跟通讯的冗余度完全是两码事,字少的未必就低。不过这个就不展开讨论了,说了估计您也不懂。

              最后,俺好像没说过神马“效率”,莫非您回错了贴?

              • 家园 效率是我说的

                我想他们搞错了。

                • 家园 哦,俺确实说了效率

                  不过那是引用某些人的说法而已。某些人不是说中文信息熵大所以效率低么?但既然平均三个英文字母才相当于一个汉字,那么按这种算法其实是英文效率低。

        • 家园 一个汉字对应一个英文音节

          根据一个英文音节为辅-辅-元-辅-辅,其中元音由一至二个字母构成,一个英文音节为一至六个字母,按你的理论决定发音和意思英文单词以平均两音节,熵值为28.35,而对应汉字词语也以平均双字词,熵值为19.65。按你的理论推出汉语比英语效率高1.5倍。

分页树展主题 · 全看首页 上页
/ 102
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河