主题:【原创】汉语和英语的比较 -- 颜赤城
科研版
你听着听着就会顺耳的。偶刚到河里时就有在水风老道的念经中感到沉重的挫败。
走自己的路让别人去说吧。不过常常听听别人出自善意的反调,是会对自己有所裨益的。养成倾听习惯后,更是自己人生的财产。
恭喜:意外获得【西西河通宝】一枚
谢谢:作者意外获得【西西河通宝】一枚
鲜花已经成功送出。
此次送花为【有效送花赞扬,涨乐善、声望】
[返回] [关闭]
我就很喜欢你的这个帖子!强烈支持你继续写下去!
引起大家的思考就是件很有意义的事情,帖子本身的学术价值倒是在其次了,更何况兄台写的初衷就不是发表学术论文。
没有觉得会更难,话都是要结合上下文来理解的,汉语遇到的,英语恐怕也躲不过。很多人觉得汉语难,实际上是说让非汉语背景的人学汉语难。而对于计算机,它本来就没有任何语言背景,因此接受汉语会容易。
我这一篇还是题外话。
我的习惯呢,是写一篇的时候大概想想下面一两篇的话题,搜集一下素材,准备些例句,讲些心得体会和平时产生的有趣的想法。我倒是希望这些东西对学习英语的人有所裨益。这样写呢,也能一篇一篇写下去。但是我认识到这样效果不好,不能这么写,真的不能这么写下去了。
我以前说过,就我个人经验,中文论坛是大家围绕主帖讨论,英文论坛是一个人起话头其他人加入。那么我换个方式。我知道大家都有很好的想法,我这次只起个话头,提几个问题。我在这里看得多了,自己再偷偷摸摸整理出一篇去别的地方招摇撞骗。嘿嘿,说笑了,如果我看不懂你的帖子或者不同意你的帖子,我是不可能据为己有的。那叫抄袭。只有我消化吸收了,我才敢说。
我下面三篇的计划是
十三、脏字:我们是怎么骂人的
十四、委婉语:我们是怎么不会说话的
十五、句读,标点符号
说实话,我在网上吵架,用中文骂人的时候少,用英文骂人的次数多,但是都不涉及脏字。但是脏字作为研究对象是个非常精致巧妙的东西。有没有汉英俱佳的朋友讲一讲汉语和英语脏字的相同点和不同点,举一些例子,出些习题什么的。
如果想跳到委婉语和标点符号,也欢迎。
尝试一下,不知道效果会如何。
在某些表示同一个意思的地方,中文的说法往往很大很抽象,而英文却很小很具体。比如“一箭双雕”“一石二鸟”“一举两得”等等。或者历史方面的电影、书籍方面的“大历史观”和“小历史观”的比较。
反正是随笔,多写点也无妨。
写得好。
一口气追著读。是一篇难得不带偏见的比较文章。
我总认为, 汉语的文法研究都是沿习英文的文法研究成果, 比如说词性的划分, 时态等等。 更加极端的例子是计算机输入法。 明显是从26个字母的编码方法上发展来的, 输入速度当然不如英文, 复杂性更要翻倍。 如果ASCII码按部首编,怎么会乱码呢?
对与汉语的研究我们还很缺乏, 很初级。完全取之于英文本身的研究成果。 虽然语言很多相通之处, 毕竟还是不一样的。
原来发在新兵营的:
http://www.cchere.com/article/1068471
一里提到如果ASCII码按部首编,就不会有乱码。他所指的细节我不太明白,不过计算机编码对汉字的影响我以前倒是想过。这里面不单是一个如何处理现有汉字的问题,而涉及到编码如何适应汉字发展的问题。本来这一篇是留在最后作展望的,顺序乱了,不管了。
计算机深刻地改变了我们使用语言的方式。比如我们以前写字会写错别字,现在用电脑了,错字绝迹了,你根本没有机会输入错字。但是别字泛滥,大家为了敲字快也顾不了那么多了。别字到了成灾的地步。前面也有有心人给我挑出了帖子里的别字。
新的词汇层出不穷。电视广告里新的产品有新的名字,专业期刊里有新的术语,时尚杂志里有俚语跟踪。对于英文来讲,新词的产生只是个拼写的问题。汉语的新词汇产生,就现在的情况讲也只是个单字组合问题。一个“打”一个“造”,在一起出来一个“打造”。全国上下都在打造着什么。
汉语里的外来音译词比较长,因为外文原文比较长的,比如马达加斯加,长达五个字。但是本土词汇主要是一两个字的长度。(参看第一篇《编码效率》。)500个常用汉字,组合成两个字的词,从数学上讲有25万个可能。一个汉字,到两个汉字,能把社会从远古带到现代。假设人类文明出现的飞跃,思维复杂性有了质变,500个汉字组合到三个汉字长度的词汇就有1.25亿个可能。汉字组合的理论极限非常巨大。
但是中文和英文有一点很不同,中文有一个造字的问题。没有人会扩展26个英文字母,但是我们祖宗可是一直在造字的。我们以前经常会看到异体字,也是汉字造字能力的一个表现。但是现在,就像我们丧失输入错字的能力一样,普通人丧失了发明新汉字的可能性。
这个问题并没有现实需要。虽然《康熙字典》收4万7千多个汉字,但是GB2312的6763个汉字就涵盖了99%以上的中文使用。汉字的数量要减少,而不是增多。
虽然没有现实需要,但是要做千秋大业计,不考虑造字的问题的计算机编码就不是一个符合汉字规律的编码。
大家学什么专业的都有,因此我要非常简白的说明一下这个问题。
现在我用笔写字,比如我“里外”的里字。我在下面的土字多加一横,我就造出一个新的汉字。这是个不好的创造,因为别人看了不知道读音。那么我在里字上面加一个“广”字头,这又是个新的汉字。(不知道是不是真有这个字,假设这是新的汉字吧。)这个字,你一看就知道是汉字,并且你肯定会把它读作里。这是个符合汉字规律的字。
我创造了这个汉字,我可以写信给别人,说漠北有种鸟叫做这个“广里”。别人看了,学会了这个字,也可以使用。如果这个汉字被传播使用,这个汉字就真正被接受了,可入字典。
这就是一个汉字由群众创造并被接受的过程。
这个过程在计算机上面是不可实现的。你目前没有任何办法输入这个汉字,放在网上。别人看到这个汉字,就在他的计算机上敲出来。
曾经有对计算机不熟悉的人听了我的说明,告诉我有个软件可以造字并显示在网页上,我去看了之后发现那是个小的图片文件。所以我挺有隔行如隔山的挫败感的。如果你对计算机不熟悉,我再详细的说明一下。问题是,你不能通过键盘输入一个不存在的字,这个字和其他所有字一样显示在网页上,你的读者再可以通过键盘输入敲出这个字。
但是,这个过程,是完全可以实现的。虽然可能比GB2312复杂得多,并且可能造成用户使用不便。
我粗浅的想法是,第一个是让用户可以以画图的方式自由的造字。第二个问题是用户可以像输入已有的汉字一样输入这个新造出来的字。第三个问题是这些任意造出来的字如何被其他的用户看到和使用。
用一个软件允许用户将汉字的各个元素组织起来,造出一个新码。这个码将含有汉字结构的描述信息,所以可以被其他计算机系统识别出来并显示在屏幕上,并复制到自己的字库里。这样,有人可以造字,造出来的字可以被别人看到。这个码甚至还可以有对应的键盘输入法的信息。其他的计算机将读入,并和自己的输入法联系起来,通知用户。然后这个新字就是像新词的生命过程一样:越来越多的人开始用,被社会认可,国家将其纳入标准,编入国标字库。可以想象,这个码不像个码,而像个自解释的附件,会比较长。我们必须保持现有的简短的标准字库,而允许长的包含汉字结构描述信息的自定义编码。
这只是一个思路,工程上会有很多方案,但是技术上并不是很难,主要是要符合汉字规律。但是涉及国家标准甚至国际标准,不是民间可以完成的。更重要的是,如前所述,现在我们是要规范现有的常用字,而不是鼓励人们造新字。
这个造字的想法满有意思. 主要是要被标准认可.
一个值得探讨的问题是这种民间造字具有多大的现实意义.近代以来新造的字,我估计,都是科技字.这些都是一帮精英决定的.比如大部分化学元素字,生化分子字等等.老百姓需要造的字,我估计挖掘挖掘康熙字典,很可能发现都被造过了.
如何在计算机上自由地造字,确实是象形文字在计算机时代面临的一个挑战
但是,如果从另一个角度去考虑,能不能改造字为造词呢?
把已有这些汉字看做是汉语的字母集,不再增加,而只用这些汉字去造多字的词。我想造新字主要为了增加名词,比如新的化学元素名,新发现的物种名称,甚至是给小孩子起名字,方言里的地名等等。如果我们能够改变汉语的一些习惯,比方说开始考虑两个字的化学元素名、超过三个字的人名(这个现在已经开始了),提倡用同音字表达方言地名,等等,那么,我们就可以走出造字这个困境。
正如你所说的,汉语造词的功能非常强大,我们需要扬长避短。
我喜欢有趣的事物。
我只会用拼音输入法,不会打五笔。在几乎不再用笔的现在,我有点恐慌,因为好几次,居然在需要用笔写字的时候,笔画众多的那些个,有点不大想得起来正确的写法。。。
而且汉字分简体繁体输入,象我这样用英文界面中文外挂,又不喜欢老是切换的懒人,就少了很多汉字的乐趣。以前还多用笔的时候,常常喜欢繁简混用,因为喜欢有些繁体字的美丽字形。自己也会在记录或者手写时,用自己的独特字,现在是越来越不可能了。
确实是觉得现在的中文输入,除了让我对拼音越来越有把握以外,输入越来越规范,打字越来越快以外,限制了很多创意的发挥。不象英文,自己造字词别人还很可能一眼能见能识能分辨。如今汉字在计算机上的输入,确实失去了很多字形上的联想意义和审美能力。汉字是象形取意,确实入画的。估计若计算机是中国人发明的,输入的思考方式也会不一样,键盘设计的就可能大为不同了。。。