五千年(敝帚自珍)

主题:【原创】汉语和英语的比较 -- 颜赤城

共:💬368 🌺1318 🌵2
全看树展主题 · 分页首页 上页
/ 25
下页 末页
家园 谢谢你!我才注意到!西西河喜欢翻河底的淤泥,唉
家园 花!请教,您说的这个熵值是什么意思,能给咱普及一下吗?
家园 英文的您就是Your Excellency

Your Excellency 是第二人称,His/Her Excellency是第三人称的尊称。

根据对话人的地位和性别,还可以变成Your Majesty,Your Highness, His Highness等等。

现在美英等级制不如以前那么森严,这些尊称已经很少使用,经常在开玩笑时候用。但是对英国的王室成员,这些尊称是非用不可的。

这些英语尊称用法只要看几个英语宫廷戏就可以了。比如《Young Victoria》或现在比较火爆的电视连续剧《Downton Abbey》,里面的尊称用法比比皆是。

家园 语法应该是越来越规定化吧

任何语言应朝着表达最简便、通信最准确、含义最丰富的方向进化。

中国文学史上相应出现了“唐诗-宋词-元曲-明清小说”,可见中国文学发展史也与汉语系统本身的发展程度存在一定相关性。也就是说,我们不可能在音节不丰富的时代去创作古诗,不可能过在汉字不丰富的时代去创作先秦散文,不可能在单音节化不完全的时代去创作格律诗,不可能在词汇不发达的时代去创作宋词,不可能在语法不成熟的时代去创造明清小说。

家园 古印度和古阿拉伯人的科学是相当发达的

那为何印度、阿拉伯人未诞生科学呢?为何科学就诞生于西欧一隅呢?

数学上的“0”就是印度人发明的。

阿拉伯人在化学冶金和金融方面的贡献也是很多的。

比如支票就是阿拉伯人发明的。

家园 这个熵是信息熵

表示通信过程中的不确定度和消除不确信度所需的信息度

从信息论的角度看来, 用自然语言交际的过程, 就是把信息通过语言的发送者发送出来,通过通讯媒介, 传输给语言的接收者的过程。语言的发送者连续地发出一个一个的语言符号,而语言的接收者则连续地接收到一个一个的语言符号。如果我们把这些语言符号的发送或接收看成是一些随机试验, 把所发送或接收的语言符号看成是随机试验的结局, 那么, 语言就可以看作是一系列具有不同随机试验结局的链。如果语言中只有两个符号, 而且这两个符号的出现概率有很大的区别, 那么, 在接收者接收到语言符号之前, 他就能够满有把握地预言,他最可能接收到哪一个符号, 而不大可能接收到哪个符号, 也就是说, 这个随机试验的不肯定性程度很小。而当语言的符号数目增大时, 接收者预言他所可能接收到的语言符号的把握性就减小, 也就是说, 这个随机试验的不肯定性程度增大了。

当还是这些数目的语言符号而这些符号的出现概率相等的时候, 接收者不能对其中的任何一个语言符号寄予较多或较少的希望,这样预言他所可能接收到的语言符号的把握就更小, 也就是说, 这个随机试验的不肯定性程度更大了。但是, 不论在哪一种场合, 当接收者一旦接收到语言符号之后, 这种不肯定性便随之消除。这时, 我们可以说, 接收者从所接收的语言符号中获得了一定量的信息。不肯定性消除的程度越大, 获得的信息就越多。

因此, 我们可以用在接收者接收到语言符号之前, 随机试验结局不肯定性程度的大小来表示语言符号所负荷的信息量。在信息论中, 把随机试验结局不肯定性程度的大小叫做嫡。在接收到语言符号之前, 摘因语言符号数目的多少和出现概率的不同而不同。在接收到语言符号之后, 不肯定性消除, 嫡等于零。可见, 信息量恰恰等于被消除的嫡, 我们只要测出了语言符号的嫡, 就可以了解到该语言符号所负荷的信息量是多少。

我们测出包含在一个汉字中的熵是9.6比特, 也就说明在一个汉字中所包含的信息量是9.6比特。汉字的嫡值大, 说明汉字中所包含的信息量大,也就是说要克服一个汉字在通讯中出现可能的混乱,必须要保证提供9.6比特的信息量。

在智力学习的过程来讲。这个9.6比特的信息负荷量要比4.0比特的信息负荷量要高,对于还在发育的孩童的大脑来讲,可能是超载了。所以使用9.6比特熵值语言的小孩子要靠死记硬背而不是逻辑推理的方式来进行运算,对大脑的发育可能带来永久性的影响--某些用于创新的脑区可能被永远占领(模式化)而不能用于以后成年所需的创造性思维了。

造成汉字这个熵值太大是鉴于字素的原因---汉字无法通过字母简化和扩展书写,其笔画书写方式变化种类和规则太多,无法简并。

通宝推:桥上,
家园 既然是聊天就有一些没说清楚的东西

比如汉语字典和英语字典的比较。确切的说英语只有词典没有字典,可比较的是汉语词典和英语词典,二者的大小都应该是随着涵盖词数增加的,英语词典不断膨胀说明内容随着社会发展不断增加,是很理所应当的,任何一部做到与时俱进的汉语词典也是应该不断收录新词而不断膨胀的。

还有说汉语要大声说明汉语交流对信噪比要求高,原因是汉语中同音字词很多,没有完整上下文不容易判断意思,这在人机语音交互系统里也是问题,机器对捕获的汉字语音对应到汉字的精确度比拼音文字差,相比而言在语音合成上汉字的优势就不是那么明显了。

家园 唉,你说的其实是不确切的说,因为中文的字也是词

我先对你重复两段我的原文吧,

中国人说话的时候声音大让一些同胞不好意思这似乎是使用的音节的数量比较少的尴尬例子。那么,中文说话交流同样信息的时候往往使用的音节的数量比较少这个事实有什么好处吗?

当然有啦,我给大家举一(类)例子。我在老美的NASA干过几年,控制和发射过卫星。在紧急情况时间宝贵的时候用英文可是慢啊。这一点人家老美也早就意识到啦,还设计了一些用来省时间的专用短语泥。我估计打仗时或救人时还是少用几个音节的好。

你还是在重复我说的拼音语言是声音和耳朵的,声音和耳朵的语言当然有声音和耳朵识别上的方便了,而且需要更多的音节。你说的“人机语音”也是“音”,当然是作为声音和耳朵的语言的拼音语言方便了。

中文不是词的字恐怕没有。确切的说英语也可以有字典,比如说搞一个诸如th、tion、eq等等的典。拼音文字的零部件不明显,是成品型的,中文是零部件型的。总之,语言文字是工具,拼音语言入门容易是明显滴,因为是声音和耳朵的语言嘛。文盲不是不会说,对吧?

最后,拼音文字就是记录发音,因此从这个意义上说确切的说拼音语言没有文字,老美也开始他们的造字了,比如说lol等等,LOL

家园 这句话有出处吗?

某些用于创新的脑区可能被永远占领(模式化)而不能用于以后成年所需的创造性思维了。

你这句话有心理学的出处吗? 还是你自己的民科?

家园 信息量更大是事实判断

但是所谓影响,就完全是根据意识形态来了。

家园 脑神经的发育是门大学问, 最好别信口开河

脑神经的发育是门大学问, 如果没有研究, 最好不要信口开河。 人脑子不是硬盘, 装了1T的电影, 就没空装别的东西了。 为什么不存在可能, 因为有了新的链接, 而让小孩以后有更多的创造想象能力呢? 譬如学过几何的小孩, 会不会比起从没有学过的更有空间想象能力呢?

我不是说谁不对谁对。 我没有做过试验, 所以只能说可能性。 如果把比较薄弱的可能性猜想说成事实一样来陈述, 那就伤害说服力了。

家园 这个你就不用操心了

你这句话有心理学的出处吗?

我同很多搞神经电生理的家伙们有过广泛地讨论。

家园 你确定原来的汉语只有四声?

汉语有四声,再加上轻声,共有5种声调

反对把北京话当成就是汉语。北京话里有很多辽人、金人、蒙古人和满人的影响。我们唐朝的官话就比较像广府话,而粤语一共有九声。

知道作者的原意与我说的无关。目的在于借题发挥,呼吁大家保留我们的语言。不然,后人连唐诗都不会念了。

家园 有这么的说法吗?

还有说汉语要大声说明汉语交流对信噪比要求高,

有没有这方面的研究?

家园 拼音文字其实也是用标识方法阅读,接近图形

汉字的书写速度慢,但是阅读速度快。因为汉字接近图形,而人对图形的反应比对字符的反应要快得多。

点看全图

外链图片需谨慎,可能会被源头改

阅读属于快速识别模式(只用眼睛),属于一阶层次,写作就是运用手脑协调的动作(涉及眼和手),进入二阶层次了,速度肯定会下降。

全看树展主题 · 分页首页 上页
/ 25
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河