主题:【原创】浅谈汉字与拼音文字的比较 (上) -- 人间树
首先,我前面后两项疑惑,他们解决得不错。
但是我不清楚为什么没有加进别的control variable,比如性别,年龄,专业等。女性一般认为比男性更有语言天赋,中国学生的女性比例(52:74)高于美国学生(52:59),加入性别后,不清楚结果会是什么样子。
第二,原文没有列出选用文章涉及的内容。HSK我不清楚,托福文章,知道背景文化科学知识对阅读速度和答题都有帮助。由于中美学生的背景知识不同,这一点可能影响结果。
第三,在美国,学生参加试验应该是自愿报名,中国是什么情况不清楚。因此有可能参加试验的学生并不能代表大学普通新生。
第四,文章最后提到,中国进入大学的比例大大小于美国(文章写于九十年代末),假设中国人和美国人平均智商没有差别的话,中国大学生的平均智力很可能高于美国学生。因此这个实验结果可能高估了中文的阅读速度。
总之,从试验结果,我的看法还是中文和英文阅读速度差不多,即使有也很小。汉语、英语优劣的争论上,阅读速度不是一个重要因素。
关于性别我觉得没什么好考虑的,如果男女阅读速度有显著区别,那么这种比较实验要比中文英文阅读比较实验容易做得多,这方面的文章应该更多。如果没有这方面的文献证据,在这里讨论时,性别因素可以排除在外。
第二点背景文化科学知识,也难说是谁的优势。受测人员都是大学生,而这种考试的阅读材料都是面向一般人的文章,这个因素影响也应很小。
第三点的如果说有优势的话,那么也应该是自愿人员有优势。因为潜意识中,较有阅读优势的人更会倾向于自愿参加阅读测试。
第四点则是一个有效的观点。不过我认为对简单文章的阅读速度和训练量更有关系。
我觉得这篇文章倒是支持了我前面在明日枯荷包:其实拼音文字在这方面也差不多中的观点:
至于你说的7%的优势只是statistically significant而非economically significant,这个我同意。这个优势不足以说明应该将拼音文字用汉字来表达,不过谁都没有这个愿望不是?但是现在有人是想扯拼音文字比汉字的优势是economically significant的,这就好笑了对不对?
正如文章中所说
相比现代的科学实验,那种搬出吕叔湘甚至卢戆章的话来论证汉字对拼音文字的劣势的做法,就一文不值了。
我就不多讨论一些统计学的细节问题了。另外,语言学研究的标准我不知道,从经济学研究的角度来说,很多重要信息他们没有披露。比如他们是如何找到实验参与人的,在实验前对参与人的指示是什么,参加实验是否有物质奖励,多少,怎么奖励等等。实验经济学的论文没有这些信息是发表不了的。
不过我觉得你最后一段话过了。吕叔湘等从理论上比较汉语、英语的工作还是很必要的。知其然但是更重要的是知其所以然。没有理论指导的话,单纯的经验以及实验工作的结果很难interprete。另外,社会科学实验有许多与生俱来的问题,实验方法的说服力远没有在自然科学里那么强。因此“现代的科学实验”这几个字,并不意味着实验可以取代理论,作为我们决策的唯一依据。
另外,人间树是引吕叔湘讨论汉语的学习困难,而不是阅读速度。对学习问题研究,作random experiment即使不是不可能,困难也是极大的。比如self-selection的问题比这篇文章更大。
生物和医学文章的统计信息要比实验经济学的论文的要求还多,经常还要求双盲,但这不意味着实验经济学的论文不提供这些信息就没有价值了。同样的道理可以应用在语言学研究上。
我最后一段可没有指责吕叔湘,甚至没有指责卢戆章。前人在探索过程中有错误有缺陷都是正常的。既然你知道“实验方法的说服力远没有在自然科学里那么强”,空口白牙没有实验数据的“理论”的说服力,到反而强了?我批评的是,在如今有现代科学实验的情况下,还想通过引用几句前人的话来当证据,作出即便是有现代科学实验数据的情况下都不敢作出的那么强的断语来。如果现代科学实验数据的说服力算是不够强,那么那种引几句话画几个莫名其妙的图的“理论”,就是一文不值了。我前面最后一段话的意思无非如此,并不过吧。
您就知道, 其实打字的时候是来不及思考哪个字母在什么位置的, 而是靠长期的训练养成直接的肌肉反射。
1)作者可曾考虑到改变成拼音文字的经济和社会成本。 举个近的例子, 米帝现在还在用落后时代潮流的英制, 一大原因就是改制的成本太高。
2)作者可曾考虑, 保留汉字对于文化认同感, 民族认同感的意义。
3)第三点是抬杠, 那就是, 汉字确实难学, 但是, 正是由于在5-10岁这段对于人类大脑发育至关重要的时期就必须和如此艰深的文字搏斗, 奠定了我中华民族今日笑傲全球的人均智商。
确实我读下来没啥障碍。 Huamn Mnid is amaezing!
说实话,你说的问题,我相信论文作者已经想到并处理了,如果没办法处理,那么一定会在文章种列出;否则,这就是一篇有缺陷的论文。但不能说没有价值。
毕竟你我都不语言方面的专业人士,就不要在语言专业上和作者较真了。即使我们提出问题,作者也没办法回答不是?
那篇论文太长,看着太累~~~看了几段就放弃了。
说一下我的看法:
1、汉语阅读确实快于英语。这不必否认了
2更快的阅读速度是有价值的,这意味着知识的更快传播。但这价值有多大,见仁见智吧。
我估计你也不是专业搞统计学的。因此,这些专业问题我就不合你多讨论了。
“1、汉语阅读确实快于英语。这不必否认了”
我已经说了,7%的区别很难说是economically significant。因此即使认为这篇文章完美无缺,这个差别也是很小的。它的t-statistics是3,是statistically significant。但是我对它的实验设计,以及统计方法有很多疑惑,真正的t-statistics肯定比3小。而且我有点怀疑它是data-mining,因为象性别,年龄等数据他们有,做个regression只需要1分钟,为什么不把结果公布出来呢?因此读完全文,我的结论是汉语英语阅读速度没有什么区别,即使有,也很小。
你提的问题,是举出了几个论文作者没有想到或没有计入的情况,因此质疑作者的结论。但是,这些情况真的足以影响作者最基本的结论吗?我很怀疑。
其次,论文作者讨论的是最一般的情况,这种讨论本身就是很困难的,只能尽量多的模拟各种情形得出结论,而这个结论,至少有一定的借鉴价值。
因此,相信我,这里每一点都有可能推翻原文的结论的。甚至可能得到相反的结果:英语的阅读速度statistically significantly高于汉语,当然,真正数字上的差距我觉得还是会很小。
文章中作者提到,他们只是研究大学新生这个特殊的群体,并不是“最一般的情况”,他们也承认这一研究的局限性。而且他们也提到中国大学生的平均智力可能超过美国大学生。你在前一贴说“无可置疑”,说的重一点,就是原文作者也会承认这几个字很没有科学精神。
现代有所谓的科学精神,所有的研究都是按照一定步骤来的(这些步骤在各个学科上差不多),我觉得,甲能想到的,乙也会想到,尤其是在这些专业论文上,外行是很难跳出错误或纰漏来的。
当然,那确实不是“最一般的情况”。我说错了,应该是“一般的情况”。可能说一般情况也是错的。
我想强调的是,在论文作者所论述的范畴里,作者得到了结果,即阅读汉语快于英语,这可能不适合于所有情况,但确实适合一部分情况。至于“最一般的情况”,还缺少研究。
3%的差别,意味着,同样是萨缪尔森的宏/微观经济学,汉语学生可能要比英语学生少用几天到一个月的学习时间(当然,因为中文是译作,可能这个优势会被翻译拉平)。扩大到大学四年甚至一生的学习中,3%的优势确实不小。
呃,至少,论文作者的结论,在大学生中适用吧。
可靠性比自然科学差得多。经济学是所有社会科学里最向自然科学的规范模仿的,使用最复杂,最先进的统计学方法,但是包括在最好的经济学刊物上发表的论文,可靠性都不是很大。只能说一些比另一些强一些罢了。我对我自己论文的结果(我有好几篇论文发在很好的刊物上),自信都不是很大。但是写论文时,如果明言论文结果不可信,审稿人一定会拒稿的。但是即使有一定问题,只要比其他研究做得好,做得更严谨,审稿人也会谅解的。因此,不要让“现代科学实验方法”几个字吓着。社会科学经验研究结果,无懈可击的几乎没有。
呵呵,这些研究自然不是那么可信。社会科学嘛,变量太多。经济学,好像还是解释的多,预测的少。呃,这是听来的。说点个人感觉哈,每当看到经济学中的“前提假定”,我就觉得这些东西无法用到生活中~~~
那个论文有一定借鉴意义就好。没必要全信。
比如sun可以对应‘日’,但是sunlight就必需对应‘日光’了。
非要对应的话,中文的字应该对应英文的词根。