五千年(敝帚自珍)

主题:关于《字表》再“表表态” -- 端娘

共:💬92 🌺189
分页树展主题 · 全看首页 上页
/ 7
下页 末页
  • 家园 关于《字表》再“表表态”

    有人说我这个帖子链接出处是表态贴,我自己可没觉得。我所要说的很简单,有意见你好好说,不同意也很正常,骂人算什么本事?

    不在的这一周,被发配去一个地方开会。会上我讲的题目跟简繁问题的争论有关。会上会下,都有人来问:你对这个事什么态度。很无言:我的态度就在论文里,跟踪和研究问题的产生发展,预估可能的结果,如此而已。非要政治站队吗?非要旗帜鲜明支持某一方反击某一方吗?虽然并不是说在简繁问题上,在字形问题上我就没有自己的看法,但是看法不能影响正在做的工作。

    话说回《字表》。第一,就我了解到的情况,《字表》的研制是认真的、负责任的,如果说有什么压力,不见得是政治压力,反倒是必须照顾50年来已经形成的用字习惯,不能完全搞成合乎所谓“理据”的东西。所以,随随便便就批评字表研制如何轻率,是用臆想歪曲事实。第二,目前针对字形的意见,反映的是民众希望保持用字稳定的心态,无可非议;但是过程中暴露的粗劣风气,恐怕有眼睛有良知的人都不能否认。我想问问,既然都在呼吁民主,当给了这样的机会,给了一个正常渠道,为什么不走?为什么一定要搞成大字报小字报甚至厕所文化的德行?这算不算自轻自贱?《字表》征求意见的公告,给出了邮箱,给出了下载字表和相关材料的网址,看一眼然后再说话就那么难?把话说给想听的人就那么难?据我了解到的,负责任的来信者都会留下自己的真实姓名,所提出的也都是切实的问题。在网络上随便发言的隐身者,我反正不认为他会是一个负责任的人。充斥在网络上的人云亦云还少吗?第三,关于《字表》的诸多问题,我没有权利和资格解释,我不是研制者,不能主观去解释他们的研制思想,何况我对《字表》的诸多方面本来就持保留态度。比如允许表外字使用繁体字形,这是不是政治上的什么问题我不知道,但是至少会造成部分领域出现简繁体在印刷出版物上并存的局面。恢复的那些字细加斟酌也有问题,比如“锺”,恐怕现今姓“钟”的没几个愿意遵照《字表》规定改成“锺”,反倒是“锺情、锺爱、一锺酒”等词语出现,造成使用混乱。第四,请关注一个这两天带有“政 治”性的事情,就是所谓30位文字学家反对《字表》这件事。这些人,恕我直言,配得上文字学家之称的寥寥,而且其中支持使用繁体字的大有人在。我不知道有关方面将如何应对此事。鉴于“有关部门”应对舆论一贯的表现不佳,这次恐怕也不乐观。

    《字表》研制者并未就《字表》将起到的社会作用进行很好阐释,我想说说自己的想法,根据的是这些年所了解的一点情况。一点也不专业,因为本来这也不是我专业。

    《字表》若能顺利实施,将成为社会各领域用字的一个统一平台,对于信息化程度的提高是一个完善基础的善政。鉴于《字表》所收字在超大规模现代汉语的平衡语料库和《四库全书》这样的古典语料库的验证中均达到了可观的覆盖率,前者在99.99%以上,后者也有98%,对于社会用字而言,是一个可以适应多领域多层次需求的字表。举例来说,公安、金融、民航等系统的客户服务端采用这个字表,可以在极大程度上解决目前电脑字库不通用、字库收字不够用带来的问题。

    有人说,有超大字库,10多万字,还用字表干吗?想一想,8300字的效率已经达到99.99%,再补充十多万字仅能补充最多0.01%的效率,有意义吗?带来的运转冗余也太浪费了吧?你有合适的输入法来支持吗?我倒是会这样的输入法,但是并不想替换掉现在写帖子用的google拼音。另一方面,目前字表的字已经有很多超出了一般通用领域之外。曾经有人推测说认不全8300字,应该重新接受教育,这是无知的说法。大学毕业能认5000字,已经足够;完成9年制义务教育,掌握3500字就不妨碍交流。不要以为认字越多越厉害,那是孔乙己时代的想法。所以,从两个方向来看《字表》,对某个领域来说,已经足够,对一般人学习来说,选择一、二级字就好。

    最近有专业人士跳出来批评字表与电脑字库的矛盾之处。这恰恰应该是《字表》要解决的问题之一。现行电脑字库的设计,基本是在文字学界缺席的情况下完成的。考虑到历史条件,必须肯定计算机界在这个问题上的成绩,令短视、窄视的文字学界研究者汗颜,另一方面也必须说,其中存在诸多不符合国家政策、文字学原则,与国际标准不接轨的地方,比如作为国标GB2312的收字不尽合理,将《印刷通用汉字字形表》为代表的新字形也采用类推的方式,造出一堆无用新字,在等同采用国际标准ISO10646的国标GB13000.1之外再制定GB18030并不分应用层次的需要强制全面推行,造成信息产品“闭关锁国”的局面等等。跨界的合作一向困难,这次字表若能融合双方智慧,良好协作,是百姓之福,是汉字之福。至于码位、各编码标准的一致等问题,我是咨询了懂行的人才敢说话。令人不由担心,工信部有可能为了局部利益,为了行业标准垄断的地位,反对《字表》的实施。

    以上就是我的态度和想法。

    关键词(Tags): #通用规范汉字表通宝推:梦里胡笳,胡丹青,萨苏,
    • 家园 别改太多了。。。

      不然做中文笔画识别的兄弟就倒霉了,老的模式库和新的模式库要不停融合。。。还不知道哪天可以把老的模式库删除。。。

      BTW:Apple最新的Snow leopard已经包含了中文手写输入。。。

      • 家园 中文手写输入

        我猜测是跟楼下爱吃肉的老虎兄所说的矢量字体更为相关。

        • 家园 不一样

          现在的手写识别都是走HMM,书写习惯直接影响识别效果。

          当然如果都是微调问题不大,但是如果不是微调,模式都要有所变化。收集数据,训练数据,数据调优都是费时费力的工作。当然也是折腾创造GDP的工作

    • 家园 改动一下也可以大力拉动鸡地屁,促进内需

      改动之后

      字典重出

      教科书重印

      参考资料重印:增加最新汉字考点

      通知N多

      出版系统全面更换字库,进行系统升级

      门头牌匾字牌路标要换

      政府部门公章等等

      身份证等证件之类的户籍等等部门也可以借机让老百姓换换

      还有银行:您这身份证对不上,还真没准不让您取钱

      再加上照会外国使馆宣布

      俺们字库换了

      以后写地名和公文不要用旧字库鸟

      以上等等

      都可以极大扩大内需

      拉动鸡地屁

      中国就是屁大点事也能折腾个鸡飞狗跳

      俺不懂语言文字知识

      只是从拉动内需来侃侃

    • 家园 我不懂文字学,门外汉的胡说八道而已

      但我记得汉字简化的一个重要原则上约定俗成,很多简体字要说理论也没有多少,就是历史上草体或者民间已经这么用了,简体字把它规范下来而已。那么现有的简体字或许在文字学上不尽合理,但这几十年用下来了,是不是也有一个约定俗成的因素在里面呢?或者说,不改有什么坏处?歧义是最典型的理由,但这44个字里,到底有多少在实用中造成歧义的?或者说,这歧义是理论上的,还是事实上的?

      • 家园 字形调整不涉及歧义

        按照专家说法,考虑的是照顾宋体字字形系统的统一,将原来带有楷书笔意的字形调整一下。但目前为止,印刷用宋体与楷体应该是什么关系学界也有争论。一派认为宋楷应趋于一致,比如下面的木带钩实际上是楷书的书写习惯,另一派认为宋楷不能一体,宋体的特征就是不带钩。而且字表的调整本身并未做到完全统一,比如“琵琶”第四笔横变提也是楷书笔意。

        约定俗成原则,近些年被批的有点臭,主要是活动恢复繁体字的人群,认为俗成的东西不如原来的有意义。

        歧义这个事,比较复杂,若要讨论的话,还需要词义学、语义学和有关调查作为支撑。简单说说我的感觉,现代汉语与古代汉语的一大区别就在于以词为单位表意的特点,古代汉语单字表意,需要在字形上带有较多信息,以词为单位,构词的字义互为补充,造成歧义的机会大大减少。汉字发展史上的批量简化,莫不伴随着民间文化的兴盛,比如唐俗讲,宋以后印刷术的普及更是引发了白话文学的大发展。某种程度上,汉字的简化是与书面语靠拢口语的趋势一致的。这也是为什么上世纪初汉字改革运动与白话文运动相伴而生的原因所在。

        简化字究竟造成什么无法容忍的歧义,目前为止我没有看到有说服力的例子。最常举的“下面”、“白面”这种例子,首先并非简化字独有,繁体字照样存在,甚至并非中文独有,各种语言中都存在,这是需要在语流中做出意义判断的。我还没有追踪过这些观点的来历,但是推测是与中文信息处理需要进行词标注,自动切分时出现疑问有关。在口语和传统印刷书面语中,很难对此类歧义有感觉。至于“后-后後”“发-髮 發”,也是在简体转为繁体时出现问题,作为记录语言使用,不存在歧义的问题。

        字表调整的6个字,“噁”的调整顺应专业术语用字,我觉得应该保留。“锺”之类,恐怕并无必要。

        关键词(Tags): #简化字#歧义#词#字
        • 家园 宋改楷不改,小学生学哪个?

          下次我教我家娃儿写“琴”,那一笔是写横还是写提?

        • 家园 单单问下俗定约成原则为什么被批,理解不能。。。

          无论附加了什么意义,但是字的终极本质不就是一种用来交流的工具吗?当然以最为大家接受的样子最为优先。

          • 家园 呵呵!

            大体来说,就是认为俗体本来就上不得台面云云,现在有种说法“识繁写简”比较行得开,也有这个意思:高级文化还得看繁体的。

            我也有点理解不上去。MM不要难为我了。

            • 家园 识繁 并不需要特别训练啊

              看简体的东西怎么就不“高级”了?

              不能理解这些高级人士读过书吗?

            • 家园 嘿嘿,懂姐姐意思了。。给花
          • 家园 约定俗成。。。

            置专家们于何地?

            只有没有知识的人才会约定俗称。

            专家的任务就是反“约定俗称”,所以什么“每况愈下”啊,“相濡以沫”啊。。。解释这些成语本来的意思的时候,是不是有一种特别有学问的优越感?

            当然,在事实上,一般听了解释隔夜就忘了,该怎么用就怎么用;专家们呢,每次都想着今天谁又用错了。

        • 家园 抛开立场不论,这篇看得挺舒服,花之。
分页树展主题 · 全看首页 上页
/ 7
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河