主题:【原创】试论汉字的科学性(二) -- 大西洋14
好的地方,像你说的单个汉字包含的信息量大,自然打印文本看起来就少。
坏的地方,每个汉字的笔画数就要增加,换句话说,就是识字成本在增加。
在信息化时代这就意味着汉字的信息量过大,就意味着单个汉字需要使用双字节以上的编码方案,结果就是从gb2312发展到gb18030,到目前为止仍无法解决问题(历史上的常汉字可能在三万个以上,全部加起来六万个也不稀奇)。
对汉字的这个特点,是好是坏的很难定论。
http://ling.cuc.edu.cn/htliu/feng/01-01.htm
现在要做这项工作,非常简单,只有要语料库即可。比如说这个:
http://www.fanren8.com/simple/index.php?t20030.html
如果说现代汉字的数字化还算好办的话,古汉语则基本上就是灾难。极限熵根本没法计算。
另外,英国人如果不是半文盲的话,莎士比亚应该还可以看懂的……
- 相关回复 上下关系8
🙂只要能在河里用中文发言的 小木 字288 2010-08-17 11:48:11
🙂这是另一种"简洁" 韩信点兵 字668 2010-08-17 11:09:02
🙂能用通俗易懂的语言表达复杂的概念代表了一个人的文化水平 杜撰 字24 2010-08-20 21:17:35
🙂关于这篇的主题,其实是单个汉字所含信息量的问题,
🙂常用汉字的笔画不一定比常用英语单词更多吧? 杜撰 字34 2010-08-20 21:21:53
🙂我知道你想听到什么,不过拿单个汉字与英文单词作比并不恰当 2 蚂蚁不爱搬家 字536 2010-08-21 00:26:28
🙂说了半天就是。。。。。 杜撰 字46 2010-08-21 16:20:53
🙂你想反驳什么?所有的这些工作和结论都是汉字信息化的产物, 6 蚂蚁不爱搬家 字1026 2010-08-21 23:52:39