五千年(敝帚自珍)

主题:【讨论】龙芯什么时候能配上中文计算机语言编译的源程序? -- 唵啊吽

共:💬151 🌺373 🌵4
全看分页树展 · 主题 跟帖
家园 中文(汉字)还是比较特殊的,那就是她是表意文字

当今世界大规模使用的表意文字估计只有中文了(按现在的说法,是音形义的高度统一)。而偏偏对中文的这个特性目前研究非常不够,至少在计算机科学领域是如此。

可以说,目前的计算机语言理论和实现里面也完全没有考虑到中文的这个特点,只考虑到了表音语言。(其实这句话也不是很正确,C++教主前几年发表过一篇文章,谈到在C++中扩充标识符字符集的问题,比如可以加入一个小人符号,笑脸符号,电话符号等等,这样“人打电话”这样的语句,就可以用“小人.电话”或“小人->电话”来表示。这篇文章我是在《程序员》杂志上看到的,当时的感觉还是很震惊的,还好又仔细看了一遍,才发现原文是4月1号发表的。)

当然也可以反过来问,表意符号的表意部分到底能不能有效编译成计算机程序,或者“编译”的可不可以改成“理解”?

下面是一些个人的感想

----------------------------

俺的理解是,作为表意文字,使得古代汉语天然排斥纯粹的符号,比如字母和标点符号(除了空格以及由空格演变成的“O”)。就连两仪、三才、五行、八卦、十天干、十二地支之类更适合用符号表达的东西也要配上汉字作为名字。

汉语的这个特点可能是极其重要的。按《中国古代的语言和逻辑》(Chad Hansen)的观点,表音语言天然需要“抽象”,也即类似柏拉图“理念世界”里的“理念”,“理念”代表语言的实际意义,比如horse(或其他字母组合)必须对应到马的理念,否则没意义。西方哲学很大程度上都是建立在这个基础上。(还有一个例子就是集合论,“集合”几乎就是“概念”的数学版本,也即现代数学也可以说建立在柏拉图的思想基础上,这点有好几个著名数学家都表示过类似说法。那么其实现在的计算机科学也是建立在柏拉图的思想基础上的,因此编译过程对汉字不友好似乎是应该的);而汉字似乎天然不需要“抽象”,汉字“马”(尤其是象形文字的马)本身就可以表示马的意义,而不需要抽象出一个马的“概念”,这似乎也是“白马非马”之类汉语悖论的根源,现在那种使用“概念”“外延”“内涵”来解决这个问题的想法有点像当然了(从某种意义上说,全体汉字就相当于柏拉图的那个永恒、不变、完美的“理念世界”,怪不得说“仓颉造字鬼神惊”)。

在目前关于汉语本身的特点还搞不清楚的情况下(很多人还是认为拼音化或者线性化才是汉语唯一出路),真正意义上的“汉语编程”,到目前为止几乎没有任何理论上的突破,如果真的“拼音化”了,也许就永远不会出现了。


本帖一共被 1 帖 引用 (帖内工具实现)
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河