五千年(敝帚自珍)

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
分页树展主题 · 全看首页 上页
/ 102
下页 末页
      • 家园 不行

        我之前曾經基於筆劃做過一個orc的算法討論,後來發現真的超級複雜.

        不能只有筆劃,還有位置.順序等等等等...這個和字母基本上就不是一個維度的事情--笑.

      • 家园 汉字是5个笔画构成的3维图形,英文是26个字母组成的2维

        虽然基本笔画少,还是不容易。

      • 家园 不太对,

        实际笔画也很复杂。

        只能说对于汉字来说,由于是画,实际包含了更多的信息,是拼音文字不能提供的。

        另外,几千幅画对于大脑而言,完全不是问题,占用的大脑资源知是微不足道的比例。至少相比于拼音语言而言,不需要死记好几千个多音节组合出来的互不关联的词。

        写到这里,我感觉音节在拼音语言里的作用和汉字里笔画的作用有点类似。

        • 家园 笔画其实可以类比于字母

          只要是语言,就都是指说话,而说话的唯一表现形式就是发音。不论中文还是西文,只要说话就都是通过发音来表现的。唯一的区别在于中文一字一音,西文一字多音,但是要表达出一句话的内容,中文西文都是一大堆发音堆叠在一起。而且不论中人还是西人,作为人类,其基本发音都很类似。

          西文是不同的字母凑在一起,凑出一个读音/早期的简单词语/某个含义(比如“a” “the”),然后几个读音凑在一起,变成一个更长的词/某个含义(比如“responsibility”)。只要一口气憋不死,这个读音堆积就可以持续进行,一直长到一口气念不下来为止。

          中文也类似,一大堆笔划凑在一起凑出一个读音,另一大堆笔画凑在一起变成另一个读音。中文是方块字,在简化字之前,只要一个方形空间没有被填满,理论上就都可以继续造字,直到肉眼无法区分为止。比如“忧郁的台湾乌龟”一类的繁体字。当然啦,汉字还有一个不讲理的地方在于局部乱缩小,比如“系”“敏”都变成了“繁”的一部分,这个现象不太按常理出牌。

          • 家园 每年都有字母新组合出的新词,新字有几个?
            • 家园 词不能和字比

              推出新词,核心在于新的读音组合,而不在于新的字母组合.如果要和中文对应,那么也是新的读音组合(词),而不是创造出从未出现过的读音(字) .你不觉得现在中文领域每年新出现的读音组合都很多吗?

              • 家园 所以说应该是汉字类似于字母而不是更低级的笔划类似字母啊
                • 家园 汉字是有语义的,而字母没有

                  多字词应该跟组合词或者固定短语比拟才对。汉字系统和字母系统肯定不能完全类比,而汉字笔划和字母对比窃以为也是欠妥的,要说相似性,应该是汉字的偏旁以及某些笔划组合和字母的相似性更大。所以,按左上,左下,右上,右下划分汉字功能区窃以为是比较妥当的,功能区的组合可以和英文的字母组合类比。

                • 家园 这个不对

                  汉字可以类似于字母组合,而不是单个字母.一个汉字代表一个独立音节,一组字母才能代表一个特定音节.所以特定汉字中的笔画,可以类比于特定音节中的单个字母.

                  • 家园 但是很多缩写就是纯字母组合

                    我从来没听说过那个汉语概念的缩写用笔划组成一从未出现过的新字

                    • 家园 本来就是不同的语言体系,各层面之间肯定有差异存在

                      但是我们应当从宏观差别看所划分的总层数,然后再来一层一层对比,对应字母这一层的肯定是汉字下面的层级而不是汉字层级,你所说的差别只不过是层级本身的高度差而不是层次序数的根本差别。

                    • 家园 古琴谱就是您说的汉字笔划重新编码

                      你可以去搜一下古琴谱,挺有趣的,全是方块字,但是这些方块字里都是几个笔划加上一两个数字的组合,数字表示琴弦的位置编码序号,笔划表示指法。

                      不要低估汉字的可扩展性。

                    • 家园 拿p大师打个趣

                      pbs,脱离上下文,这是什么?就算是人为规定pbs必须是首字母(这纯粹是约定俗成,凭什么不是尾字母?),除了3个纯粹的读音之外,你还是不知道PBS是什么。

                      好了,如果这样的话,我创造一个写作“丿丿一”,读作“撇撇横”的词来代表PBS所能代表的一个意思(pork beef steak,猪牛扒),可不可以呢?我看没什么不行。中文环境里大家觉得这么用太傻,不代表理论上不可以这么用。撇撇横和PBS一样,本身都没有任何意义,都是所代表词的第一部分,都具有独立的读音。仅此而已。科技文章需要有缩写列表,或者首次出现的缩写必须配全词,这样就纯粹是人为规定,我用aab代表prok beef steak也完全无所谓的。

                      回到PBS的一些正规意思“phosphate buffer saline(佛死废特 爸否儿 塞懒)”,原词是21个字节+2空格的8读音词组;或者“Public Broadcasting Service(怕爸里克 不饶得卡斯汀 色维斯)”25字节2空格的13读音词组(其实还要额外再加上重读标示),简化成PBS就是3字节3读音词组,其实就是原词组太复杂后的一个简化而已。中文对应的磷酸盐缓冲液和公共广播公司,都是12字节6读音(无重读)的词组,如果硬要简化,那么就变成“横撇”和“撇点撇”也是无所谓的,原理是一样的,只不过简化前后优化不大甚至更麻烦而已。

              • 家园 所以我觉得笔画也许更类似于音节,

                从没有意义组合出了意义。对于(拼音)文字来说就是特定的字母组合。

    • 家园 【讨论】

      编码可以加2个维度么,就是音调和多音词,可以更准确分析汉语,那么编译处理的复杂度虽然升高了,但是可编译理论程度升高了。

分页树展主题 · 全看首页 上页
/ 102
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河