五千年(敝帚自珍)

主题:关于《字表》我也不得不说几句 -- 类反词典

共:💬38 🌺88
全看树展主题 · 分页首页 上页
/ 3
下页 末页
家园 语料库没有任何意义

我也没有要求把语料库作为附件。我要求的是把从语料库里面提取出来的数据作为附件。语委自己有语料库,那个所谓的“平衡语料库”就是。这个是公开发卖的,好像研究机构价是6万元,有手工标注的部分3万元。还有其它一些数据,也是差不多的价。语料库这种操作方式是可以接受的,但为制定这个字表提取出的数据必须公开。最简单的字频表、词频表如果都没有,如何让人相信他们是在做实事?何况这个字表项目肯定是国家或部委项目,经费是纳税人的钱,这些成果理论上都是全民所有的。

家园 我刚才有点误解你意思

你说的对. 我已经改了. 说句好听的, 提升的空间还很大.

家园 3721 ^_^

确实, 说的不错.

家园 我不大相信他们有这样的材料

由于“王宁”这个名字太平凡,用“王宁”+“北京师范大学”在万方找到80多篇论文,其中绝大多数是没有任何定量研究的。我认为比较有价值的一篇是《3500个常用汉字理据测查》。这是一篇硕士论文,数据充分,结论也不错。如果他们能有3-5篇这样的论文覆盖字表的大多数修改内容,我也就不说什么了。不过这是唯一的一篇,但作者的导师不是王宁。不知道是否是隔代弟子。在此姑且仍算作他们的成果,因为里面引用了王宁的理论。

另一个可以使用定量分析的非常好的题材《外国留学生错讹字的理论分析》,但通篇没有看到任何相关的定量数据。根据其内容分析,他们还是收集了大量原始数据的。但为何就不把定量数据拿出来?这个要是有定量数据,是可以对字表修改有很大支持的。

王教授牵头发表的论文《论母语与母语安全》,同样这个如果用一些定量数据进行支持,可以是非常好的论文,而且可以对字表修改提供强有力的支持。但很遗憾,仍然没有见到任何有意义的定量数据。

他们的纲领性文件是《再论汉字规范的科学性与社会性——关于制订规范汉字表的思考与建议》,同样没有任何定量数据支持。

以上数据肯定非常不全面,因为(1)“王宁”的平凡性;(2)我和这个专业完全不搭界。但是以上例子仍然说明,他们根本缺乏定量研究的意识。

  • -- 系统屏蔽 --。
家园 技术问题而已

首先,真要拿出来蒙你,也是很简单的

然后,以Google为例,躏字少,囧字多,恐怕无法成为证据

毕竟在正式书籍、文件、材料中,恐怕结论刚好相反

最后,统计学本来也是可以用来骗人的

家园 这个你说对了

这些专家的专业原本就不需要定量分析这样的研究方法

王宁教授是章黄学派第四代传人,搞训诂学出身的。

  • -- 系统屏蔽 --。
家园 对不起,我不懂训诂学。只知道这个名词

做个文抄公:(中文Wiki)

训诂学(“诂”音“gǔ”,同“古”)是中国传统研究古书中词义的学科,是中国传统的语文学——小学的一个分支。训诂学也在译解古代词义的同时,也分析古代书籍中的语法、修辞现象。他从语言的角度研究古代文献,帮助人们阅读古典文献。

所谓“训诂”,也叫“训故”、“故训”、“古训”、“解故”、“解诂”,用通俗的语言解释词义叫“训”;用当代的话解释古代的语言叫“诂”。“训诂”连用,最早见于春秋时期鲁国人毛亨注释《诗经》的书,书名叫《诗故训传》,“故”、“训”、“传”是三种注解古文的方法。训诂合用始见于汉朝的典籍。

家园 你没有看懂我的意思

1、我以“囧”举例,显然不是真的要求把这个字放到一级字库。这字进不进字表,与我何干?但制表者是否对此类现象加以关注和说明将点出很多问题。

2、以你的意思,这个字表竟然可以无视口语和论坛、网页的需要,只要符合正式书籍、文件、材料就好了?如果是这样的话,我只能说这个观点出自腐儒认正朔的理论。很遗憾,从理论上来说,我国现在人民才是正朔。也许你并不是这个意思,但我相信做这个表的人一定有很强的这个意思,支持这个表的人亦如此。可怜毛倾举国之力数十载,却仍未革去这腐儒之气,让它死灰复燃。

再说说统计学。

统计学可以骗人,在学术界混的人谁都很清楚。咱博士论文附了20篇论文,对cooking data之技也算是略知一二。但是,这是一个道德底线。西方学术界那么多年,难道他们不知道这个问题?他们仍然采用这套程序,只能说明目前尚没有更好的办法。

无论你如何cooking data,毕竟说明你仍然是依据客观规律在做事。大家都不是傻子,你搞出来的数据是否合理、哪里用了技巧一看便知。但是如果你连这最后的遮羞布都不要了,连cooked data都不给,这能说明什么问题呢?对真正有良知的人来说,数据和统计都是狗屎。但我到哪里找有良知的人?我有如何确认你是有良知的人?

我已经说过,他们只要有3-4篇数据充分的论文覆盖字表修改的大部分内容,我就不说什么了。至于如何cook数据、最后字表修改成啥样,与我何干?我的专业和这个在第6-7杆子的时候才打得着。

对王教授的定性研究我无评价的资格。依据其发表的论文著作和别人的评价,我还得承认,她在该领域的定性研究方面是数一数二的。但是,作为一个影响十多亿人的政策的依据,仅仅是定性研究是远远不够的。定性研究不可避免带有人的偏见。以定性研究为依据的政策,必然是人治。我们号称现在是法治社会。法治,不仅仅是法律那一张纸。现在已经是21世纪,很多事情都是在优化小数点后多少位。在这种情况下,不用精确的定量分析来指导法律和政策的制定,如何能够有好的结果?

家园 看了这文章我气儿不打一处来!!!

竟然已经被人通宝推荐过了...

还有地方讲理嘛???!!!...

...我想宝推!可怎么办呀?...

家园 说得没错!

现在这些所谓的“砖家”真是没救了。

要指出你文章中的错误是很困难的,因为你从一开始就几乎没有对的地方

这句好。

家园 说得好,从专业的角度进行分析,花一个。
家园 专家开始后退

外链出处

现在好奇的是前段时间那个67%的谣言是怎么造出来的,究竟是有人NC无极限,还是故意黑教育部的?

另外:

谢谢:作者意外获得【通宝】一枚

鲜花已经成功送出。

此次送花为【有效送花赞扬,涨乐善、声望】

家园 67%不是谣言,是王宁教授在《新华访谈》亲口主动说的

[王宁]这次的意见从总体来讲是这么一个状况,根据我们从正面搜集来的意见的统计,赞成的占67%,反对的大概占6%,其他的也提了一些不相干的,但是跟字表也有一定关系的意见,我们都对意见进行了整理,大概集中在这样几个方面:[08-2110:41]
外链出处

全看树展主题 · 分页首页 上页
/ 3
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河