五千年(敝帚自珍)

主题:中国文明只有63岁——《大目标》后记 修正技术错误 -- 马前卒

共:💬216 🌺1256 🌵22
全看分页树展 · 主题 跟帖
家园 无稽之谈

记得以前跟你讨论过这个问题,所以这次直接砸蛋伺候了。

计算机从本质上是二进制,也就注定了从本质上而言,任何文字系统,实际上都有文中所列举的那些问题,包括字母,甚至字母表现得更突出,不信你去找找英文技术论坛和论文,看看历史上有多少人为了英文的处理,费尽脑汁。中文即使再差,最笨的方法就是逐个编码(目前就是这种做法,真是简单粗暴),也可以实现完美效果,但字母在处理大小写、空格、词长等方面的复杂程度,都可以让很多发明语言和学程序的人崩溃。

举个例子,汉字的编码长度是一样的,但英文的词编码长度却千变万化,这样的结果,在存储上就很不方便,从而导致存储、查询效率相对固定长度的差——换种比较容易理解的说法:汉字是“标准化的构件”,而字母组成的词是非标准化构件,标准化构件怎么放都可以和其他部分嵌入很好,而非标准化构件就不能随便放,而需要精心的布置,不断的磁盘整理——这样的结果的,当然效率差了,这在“人工智能”上表现尤其明显。

汉字输入?你看看现在手机上,输入汉字容易还是字母容易再说了。——我这个用手机写了三天程序的人,深有体会,其输入效率之低,远不及当年用智能ABC输入汉字。如果以方不方便输入为标准,那么手写触控时代,所有字母语言都应该废止。

……

其他的好像都有人驳过了。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河