五千年(敝帚自珍)

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
分页树展主题 · 全看首页 上页
/ 102
下页 末页
                    • 家园 谁发现这种现象无所谓,第一个和最后那个字母决定是确切即可

                      拼音文字还有一个特点是汉字象形文字无法具有的:就是字母符号可以另行规定,只要存在规则即可:

                      点看全图

                      外链图片需谨慎,可能会被源头改

                      你能读出上述英文文章的内容吗?

                      摩斯电码的发明就是上述现象的系统化。

                      你可以参看我写的现代发报和手机输入

                  • 家园 用这种特例比较你还真是坦然

                    我输入一个from,你能想到我原来想打的是form么?

                    我输入一个head,你能想到我原来打的是ahead么?

                    我输入一个claim,你能想到我原来想打的是clam么?

                    很难吧,在这些情况下,你所说的那个结论就失效了。

                    要比较中文和拼音文字的纠错能力,万万不能搞田忌赛马的把戏,只有当错误的元素是平权的时候,比较才有意义。

                    中文中和字母平权的文字元素应该是笔画,字母和笔画都是组成文字的最基本要素,除少数特例外这两者都是不能够单独用来示意的

                    中文中和词根平权的文字元素则是偏旁,这两者的相同点在于词根和偏旁已经含有一定的意义,比如ache必然是代表疼痛的意思,带钅的文字肯定和金属有关,但是词根和偏旁一般而言也是不能独立表意的,因为它们所带的信息量依然太小,还需要和其他的词根或偏旁组合来表达确定的意思。

                    中文中和单词平权的应该是字和一系列的固定词语,它们都是为了描述确定的事物而存在,具有固定的意义。

                    如果我们要往下谈,我们起码要在这个对应关系上达成一致。不过这方面可能有一些难度,因为你一贯是不把中文词语当作和英文单词平权的元素来看待的,关于中文的讨论中你最喜欢引用的就是9.6bit信息熵和12366个汉字这两个数据,关于这方面的东西我后面回复你了,这里不多说。

                    我最上面举的例子只是为了说明一点,在没有上下文的情况下,单词中出现了字母级别的错误(无论是移位,缺失还是增加)是有可能无法恢复的,我就经常在使用词典软件的时候由于输错几个字母而导致查出来的意思天南地北。之所以一般情况下我们可以做到单个单词的纠错,那是因为单词的拼写方法是固定的,拼出了一个你不认识的单词可能性更大的是拼错了。这个方面中文也是一样,虽然对于一些复杂的汉字你可能写不出来,例如饕餮,但是如果哪个笔画漏了多了还是写错位置了,一般人立马就感到难受,因为虽然一般人不可能认识所有的汉字,但是汉字的偏旁相比而言则是有限的,且大多是由常用汉字变化而来。

                    中文中差一笔就不对的例子不是没有,比如衤和礻,已和己,拨和拔,这些东西从小到大不知要被语文老师提醒多少遍,但该错的还得错,可是这类错误经常一个不留心就没有看出来,这差不多是中国字特有的优点了。相对于拼音文字,图形化的中国字在认识记忆和辨识的过程中是忽略细节而只关注总体形状的,这是由人类视觉系统的处理功能所决定的。以前读书时做小抄的时候就有明显的感觉,中文字即使缩小到小六号依然有辨识度,可以直接读取,把中国字倒过来看,读取记忆的效率也不会下降多少;英文的话,短的常用单词还能缩小到小六号,长的复杂单词最多缩小到六号,再小的话就一眼看不出来,只能一个一个认字母了,如果把单词倒过来,那估计连hello这样简单的单词都要辨认半天。这就是因为除了常用的简单单词,拼音文字的认读必然涉及一个分解的过程(不论是像中国的外语学习者一样分解到字母还是像拼音文字使用者一样分解到词根),导致无法进行整体记忆。

                    汉字的纠错能力,很大程度上就来自于这种整体记忆的机制,有些复杂文字哪怕写得一塌糊涂,但只要有一个大体形状,就己经能够让人辨识(看那些小学生默写就爱干这种事请)。要注意我说的是单字的情况下,拼音文字中有多少单词能够做到首位两字正确,中间全部乱序,在没有任何上下文的情况下还能够高速辨识的(也就是你说的这种情况),peslae?

                    顺带一提,我上面的那个其实打的是己(ji)经,能瞬间反应过来绝对是神一般的存在——当然,电脑为我助攻了。

                    像你提到的太平天国的例子,我认为大多数人还没反应过来太写错了,太平天国已经进入记忆了,根本就不会关注那一点是否存在,只有在被人提醒或者回过味来的情况下才有可能发现。相似的例子还有“由漆末干”,这个相对大平天国已经错得很离谱了,但是很多人一眼扫过,记在脑子里的肯定是“油漆未干”(不过人大多数人写出来应该还是会写成由漆未干),这已经不只是整体记忆的功效了,还有一点就在于油漆未干是一个固定短语,因而对大多数人来说对这四个字的记忆更应该说成是接受了刺激,而后从脑中检索到了已有的“油漆未干”,而非将这四个字原原本本记入脑中——不过,附近要是有把刷着漆的椅子,刺激效果会更好。

                    元宝推荐:铁手, 通宝推:林风清逸,履虎尾,道白,潮起潮落,strain2,打铁的,于同飞,旧时月色,特里托格内亚,天涯睡客,曾自洲,纹石,人在旅途,东方射日,方恨少,光明守护者,jent,铁手,
                    • 家园 离开上下文的纠错能力?

                      拼写的错误与笔画的错误上的纠错都有一个限度,from/form, 王/土,是一样的例子,你为什么就只看到英文不意识到相同的问题一样存在于中文中呢。实际上,单独一个字的时候,谈纠错是不靠谱的,因为任何语言的特点与优缺点都需要从整体语言体系上面去比较。

                      我的经验是与你们两个都相反,就是在存在上下文的时候,这个纠错能力我认为英文有比较有优越性,包括你说的常用词组的现象,在中文中英文中都存在,都对纠错的上下文有很大作用。事实上,对常用语的掌握对一个语言的掌握有很大关系,字面意思全认识,但是意思却是望文生义,这个许多学外语者是个很常见现象。

                      你看看这段英文对阅读有多大的影响呢: It deosn't mttaer in waht oredr the ltteers in a wrod are, the olny iprmoetnt tihng is taht the frist and lsat ltteer is at the rghit pclae. The rset can be a toatl mses and you can sitll raed it wouthit a porbelm.

                      很少有人会认为这样的拼写错误对阅读有多大的影响,但是你能想象一段中文文字在笔画残缺的时候的影响么。而更重要的问题是在电脑输入时代,中文笔画不会出错但是错别字的几率大增,这个纠错率才是需要认真考虑与比较的。

                      通宝推:arcpoint,
                      • 家园 估计你没看过火星文

                        吙煋攵输扖法外挂,涐嗳吙煋攵

                        这几个字你能理解吗?困难吗?

                        • 家园 前半句看懂了,后半句完全摸不着门

                          “火星文输入法外挂,”看出来了,是“我爱火星文”,这个有点难度,但还算有规律,就是把偏旁拿去。

                          这样的错别字(或者叫火星文)不按读音而是按笔画,纠错还有可能。但是一般常见中文中尤其电脑输入使用拼音的情况下,如果是音对但是完全不相关的用音字,纠错就是另一回事了。对人来说还相对容易点,因为默读的话说比较容易纠错的,但是电脑反而从解意上去理解比较困难。而火星文这样的文字,已经超越这里所讨论的纠错问题,进入密码学的范畴了。

                      • 家园 中文笔画残缺的影响只有更小...

                        要举例子, 前面不是还有人贴了遮掉一半中文照样不影响理解的图么

                        而且在电脑输入时代几乎不存在这个问题, 错别字错别字, 电脑输入几乎只会出现别字不会出现错字, 而且在拼音输入越来越普及, 输入法越来越智能, 别字就算有也基本都是同音字, 对理解的影响更小

                    • 家园 真心喜欢这样的文章!

                      好!

                  • 家园 咱们西西河论坛上的笔误非常多

                    咱们西西河论坛上的笔误非常多,你看那些大牛的文章,那个没有错别字?但并不影响咱们的阅读。

                    这是不是冗余的一个例子?

                  • 家园 英文改一个也有歧义啊,Nouth America

                    我都不想举这种极端例子

                  • 家园 弹式,就蒜措程这杨,这巨化不是也还能毒吗?

                    盈余哪点微末的苯令有什么可跨要的呢?

                    活着,泥给我招招子星错误导致历届错误的句子?

                    大叔你是没听说过90后的火星文吧。

                    通宝推:李根,
分页树展主题 · 全看首页 上页
/ 102
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河