五千年(敝帚自珍)

主题:孩子回国比较一下才明白大陆学生比海外华人的小孩平均差了十万八 -- forger

共:💬201 🌺1045 🌵43
全看树展主题 · 分页首页 上页
/ 14
下页 末页
家园 同感
家园 我也认为这个结论草率了

根据我的观察,包括我家以及周围孩子学习汉语,英语的过程。我认为汉语的一个问题是入门的门槛还是偏高的,最开始的记忆量很大。美国学校在学生负担不重的情况下,不怎么强调记单词,背单词,孩子基本上2,3年级阅读没什么问题了。写作上词汇量也比较丰富了。而我们小时候学汉语,伴随整个小学,起码4年级之前,记汉字,默写汉字是重点。一个东西初始门槛高是不好的,意味着有可能会打击一批孩子。 这倒是符合主贴的筛选原则。

汉语每个字必须带元音,这样声音清晰是优点。但是说实话,对初学者来说,特别没有语言环境,那四个声调的变化既难分清,又难以记忆。 这也是双刃剑。汉语相对发音少,这样编码效率低;为了弥补,又加了四个音调,但这一定程度上抵消了发音简单清晰的优势。英语相对发音也不多,但是允许辅音单独发音。所以组合增加了。 好像有研究,最后英语汉语的编码效率是差不多的。

最后,其实语言是载体。大家学语言很少是为了学载体,而是关心载了什么。用某种语言创造的好东西多了,大家为了学那些好东西,所以学语言。或者,为了挣钱,找工作之类的。像当年大陆人学粤语,也不是粤语有多先进,而是香港好赚钱。你创造的知识越多,你的语言就越强势。就像如今的互联网,虽然我们用汉语翻译了英文。但是,如何解释以太网,以太是什么。为什么叫万维网,万维从哪里来?蓝牙,这个倒是中文能看懂,但是一个蓝色的牙怎么就和两个设备连接扯上关系了。所以即使你翻译了,别人的文化也沁入你的语言系统里了。所以,从这个逻辑入手,简化汉字是对的。降低入门门槛,让更多的人快速的掌握这个工具,然后用它创造好的东西。这才是存续这个语言的关键。

这就像假如中国的文化强势了,别人也要试图理解“罄竹难书”,为什么竹子和书联系在一起一样。

家园 哪个结论草率了?

是?

汉语比较落后

还是?

因此无论从语法,还是构词,汉语都是世界第一的语言,

如果说两个都有些草率,那第一个也比第二个更草率一些。仅从语法一点出发,也没有详细论证,得出如此一个宏大结论,确实太草率了。由此称之为逆向种族主义,还是很贴合的。

家园 都草率

不能说汉语落后,应该说:古代汉语,特别是甲骨文阶段比较落后。但是语言是活的。汉语其实不断的进行自己的拼音化:形声字这个相对比较“反汉字”(相对其他造字方式)的形式最终成为绝对的主流,占90%左右。 现代汉语从这个意义上讲,也是相当拼音化的。

第二个也很草率,甚至自恋。我们当然觉得汉语好,但我们只占四分之一。其他四分之三是不认可的。现代汉语语法是很新的一个东西,清末才有。过去很多语言研究者认为汉语没有语法。至于构词,由于中国在近代科学发展中的缺失,对现代词汇的贡献不多。 很多还是从日本舶来的。 我举了一个例子:蓝牙。这个词完全就是西方文化在汉语中刻下的一笔。根据汉语的构词,无论如何不应该把蓝色的牙用作连接这么个概念。 这种类似的例子还很多。物理里面的单位,牛,法, 安,这些都直接是西方的人名,和我们汉语几乎毫无关系。

假如中国是第一个发明智能手机的国家,第一个广泛被世界应用的手机系统叫鸿蒙。那英语里就出现一个类似homen(我造的)的单词。为了解释这个单词,就要解释鸿蒙是个什么意思。这就是汉语构词,乃至文化对世界的一个影响。你有这么几千个影响,不先进也先进。

家园 这只不过从清代开始不重视教育和科学导致落后

要用历史的眼光、发展的眼光看问题,下一次科技爆发期可能就是中文占优了

毕竟中文造词法比较先进,可以望文生义,压缩率高,英文缩写重复率太高,知识爆炸以后更难理解了。

家园 我读书的时候大家从不补课

放学作业也很少,2年级就看少年版水浒,三年级看三国,看新民晚报,文意通达。写作文也一样,就是词汇量有限,毕竟只认识3000个汉字。可以基础交易不卷的话要达到95分没有任何问题吗,但是一定要98分、100分就难,这个时候投入10倍的精力也未必能够实现。

等到我认识1万8千英文单词后,看英文报纸,经常标题有不认识的单词,尴尬不已,又不好意思问人,那时不像现在方便查阅,不能通过标题快速获得信息扼要,阅读英文报纸获取信息的效率很低。和人交谈,经常He is, she is, I am /I was什么的常常搞错,有点羞愧,以为我自己菜。留心了一下英语母语的人,发现他们也会口误,英语语法和构词的低效率可见一斑。

绝大多数英语单词一样必须有元音,没有元音的单词除了单字母我一个都不认识,也许是我孤陋寡闻。英语音节最后带的辅音实在是发音速度的障碍,音量又小,很容易听不清,好在绝大多数时候无关大雅。中国人容易忽视后面的辅音,以至我一个同事,后来他高居某大公司的SVP,当年曾经苦练后面的辅音,听他说英语感觉他在咬牙切齿·。现在的英语,母语讲英语的,可以听出大量的懒读,也就是弱读,省读,连读,都是针对音节末尾的辅音,汉语本来也是有音节末尾的辅音,广东话中还大量保留,在长期交流中被广大人民群众抛弃了,因为影响效率。英语作为广为流传的语言,人民群众自发在简化。

至于音调,其实是单字辅助识别的手段,在双字或多字组合中无关痛痒,老外发出的各种古怪音调,根本不影响我们听懂。至于汉字的编码效率,只要看联合国出版的各种资料,中文永远是最薄的。

说到翻译,各种语言都要面对新生事物,如何简单传神地概括新生事物是一个语言是否有活力地重要标志,是一个语言抽象的能力标志。英语过去都是直接造新词,以至今天英文单词超过100万。中文则是抽象它的原始含义,从中文中找到对应的词的组合。中文语境的以太,以是根据,太是原始形态,是本原。以太是被认为没有重量,没有刚性,无处不在的媒介,但是可以作为电磁波和引力作用的媒介,以太就是用原始本原来传递引力和电磁波,以太这个翻译非常精准传神。

至于万维,维是用维系,丝线把东西连起来,万维是普遍连接的意思,深刻揭示了万维网的本质。中国人但凡受过点教育,一听万维网,就大概知道什么意思了。蓝牙SIG本身是一个商业组织推出的标准,蓝牙特殊兴趣集团或者蓝牙特殊利益集团,它叫什么名字中国人没办法。罄竹难书这有什么难以理解呢?当时的书写介质是竹片,将来大家不用纸了,难道我们的四大发明就没有价值了?

通宝推:青青的蓝,潜望镜,肖羽,秦波仁者,脊梁硬,
家园 汉语是不断发展的

其实古汉语里面,也是每种东西一个字的

比如光是“马”就有:

骊、骝、駃、骠、骝、骢等

实际是越来越抽象了

家园 在目前AI训练中更加体现了汉语的优越

正如陈王所说”掌握1000个字可以应付日常交流,认识6000个汉字的已经击败99%的人。小学三年级阅读报纸没有任何障碍“,同样的表达内容中文版的联合国文件永远是最薄的。举一个简单的例子:同样是没有任何军事常识的人,中国人看到护卫舰、驱逐舰、巡洋舰就会知道大概都是军舰,而说英语的人看到Frigate、Destroyer、Cruiser未必知道它们是什么,之间有什么共性。

查一下牛津词典可知:

《牛津英语词典》(Oxford English Dictionary;OED)习称《牛津大词典》[2],是由牛津大学出版社出版的20卷词典,截至2005年11月30日,该词典收录了301,100主词汇,字母数目达3亿5千万个。词典亦收录了157,000个以粗体印刷的组合和变形,以及169,000个以粗斜体印刷的短语和组合,令词典收录的词汇达到616,500个。另外,词典共列出137,000条读音、249,300个词源、577,000个互相参照和2,412,400句例子

包括英语在内的字母语言,由于造词方便,所以制造新词汇成为一种随意而为的时髦行为。但是都是随着社会发展的复杂性,英语词汇已经庞大到匪夷所思的地步,比如牛津词典收录的英语主词汇已经有30多万个,一个人想掌握几十万词汇是完全不可能的,因此形成的语言壁垒达到了非专业人士已经完全不能理解该专业的特有词汇的地步。

在AI训练的难度上,中文导致的歧义也远远领先于英语,比如Mouse,如果不结合上下文,你很难知道说的是“老鼠”,还是”鼠标“。随着大模型规模增大,英文相比于中文的难度就会指数级增大,需要的算力还有电力相比中文版也都是巨量,成本也会更大。今后的智能社会基础设施建设中文的优势只会越来越明显。

通宝推:时间的影子,秦波仁者,
家园 这个是比较核心的区别

同样是没有任何军事常识的人,中国人看到护卫舰、驱逐舰、巡洋舰就会知道大概都是军舰,而说英语的人看到Frigate、Destroyer、Cruiser未必知道它们是什么,之间有什么共性。

英语为代表的拼音语言是一种记录发音的“助记符”,并非完整的“语言文字”,拼音语言只能说是一种“语言”,还没有达到文字的程度。拼音语言的“文字”,只是用来帮助记录发音的,本身的含义少到几乎没有,没有内在逻辑(比如Frigate、Destroyer、Cruiser),而汉语的语言和文字含义都非常的饱满,文字甚至都可以独立于语言,而拼音文字是记录发音而已,没有含义,很难说是真正的“文字”。所谓我认为拼音语言更象是一种“语言”,并非是完整的“语言文字”。

从语言文字发展角度来说,人类早期肯定都是类似汉语的语言文字的,中国,埃及,巴比伦都是大量的象形文字,不是只用来记录发音的。我个人认为,地中海文明早期还是流行汉语类似的语言文字,但埃及文明被毁灭后,文明退化,周边地区,只能使用简单的拼音助记符来记录以前的事来重新建立文明。但正因为简单,好像也能应付,于是重新回到完整的语言文字就变困难重重。人类就是这么一种很偷懒的动物。

所以对比来说,汉语还能保持成为语言文字,要依赖于我们的文明从未中断。如果我们的文明曾经中断,我认为很可能我们现在使用的也是拼音语言。

通宝推:广宽,hattie,青青的蓝,潜望镜,燕人,
家园 护卫(用途)舰(类型)是多维结构。10*10=100*1
家园 你这明显就是没和英语母语的人接触过

你用你自己学母语和学外语的经历去判断,基本世界上所有的人都会说自己母语好。

你母语的词汇量不是靠学的。3岁小孩要是没上学可能一个字也不会写,但是他的词汇量可不是零,有可能已经几千了。 所以你读书,发现认识的很快,因为这个词你用过,不是障碍。

我家孩子也没有特殊补课之类的,都是2年级左右看哈利波特。 他当时论会写的单词,大大不如我。但他能看这些书,因为他看见不会的,大概试着拼出个音出来,这个词听过,知道什么意思,就基本不影响阅读了。想象一个中国小孩,要是给他一本汉字的书他能看懂,把汉字全变成拼音,他能不懂吗? 我拿我的学习经历说,背汉字记汉字还是一个需要花一些时间的学习经历。英文对于母语的人来说,从小学习需要花的时间少得多。

你的he/she is/was错和母语的人错法是不一样的。他错了可能他不知道/忘了这个人的性别。你错了是因为汉语不区分,你强迫自己要在说英语的时候加上这么一条。英语母语的人,说的时候就会想着是男是女,is 和 was对英语母语的人来说是两个词。他说错可能是他不知道这个事情过去没过去,而不是像我们一样需要想着把词“变一下”。对他来说,没有变的概念。 至于音调,我想你是没有接触过汉语初学者,发音,音调,词汇都很困难,还硬要和你交流时的痛苦。简单的说,要是音调随意发还不影响交流,那是不是可以取消音调呢?难度立刻降低四倍,皆大欢喜。显然不行嘛。

互联网我举例子,就是想说如果外来词越来越多,汉语就不可避免的愈发拼音化。 很多词并非按照汉语字义组合在一起,而是单纯针对外文的音译/义译。 就像当年学C语言,很多书上都大量出现“野码”这个词,其实就是wildcard的一个不太成功的翻译。好在后来出了通配符这个比较好的翻译。以太网,万维网的都是针对英文的逐词翻译,我只是看汉语的话,其实并没有理解它想表达什么。互联网这个词就比较好了。起码知道是一个互相连结的东西。

通宝推:潜望镜,
家园 先别望文生义了

先补自己的短板,争取多创造一点专业词汇,确保一词一意,不混淆。望文生义在科学领域不是一件好事情。

家园 小孩子从婴儿开始都是听觉记忆好过视觉记忆

我们常说”从记事起”就是大脑发育到开始视觉记忆多于听觉记忆,一般三岁前的事常常忘了。古人让儿童背诗习画是对的 促进大脑发育。

在网上看过 有许多人记得出生那时刻的感觉和情景,还有婴儿不会走路时看到的事情,都是在自己急切的情况下。

家园 朝鲜和越南语包括日语都是地方话,确实是中国人过去传下来的。

周边泰国缅甸语也象壮语那样的

家园 老兄这个说到点子上了!

中文常用字并不多,但是按照上面那位老兄的的说法:其组合出的多维结构可以说是千变万化。例如区区几十字的唐诗宋词非常简洁,其表达的内涵,意境、美感却能胜过千言万语,可以说是人类文明中登峰造极的存在。

这种简洁但内涵信息丰富的特征恰恰是非常符合现代社会对于计算机、大数据、人工智能领域的底层需求,可以大大减少计算量,简化对于硬件系统要求的难度,这正是从业者梦寐以求的。

那些认为中文落后的,如果是伪装成中国人的白皮的话那我表示尊重。如果说是中国人我只能说是自轻自贱的井底之蛙。

全看树展主题 · 分页首页 上页
/ 14
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河