五千年(敝帚自珍)

主题:【原创】为什么汉语是世界上最先进的语言(上) -- 冷酷的哲学

共:💬1516 🌺8640 🌵163
全看树展主题 · 分页首页 上页
/ 102
下页 末页
家园 证据是预测,但也许是试错,

大脑的逻辑是归纳法的。

家园 中文笔画残缺的影响只有更小...

要举例子, 前面不是还有人贴了遮掉一半中文照样不影响理解的图么

而且在电脑输入时代几乎不存在这个问题, 错别字错别字, 电脑输入几乎只会出现别字不会出现错字, 而且在拼音输入越来越普及, 输入法越来越智能, 别字就算有也基本都是同音字, 对理解的影响更小

家园 有关汉英比较的问题

要比较汉语和英语的优劣,要纠正我们习以为常的两个概念:首先,什么是音节?按现行的说法是有元音才构成音节,辅音再多都不算音节,这就是个错误概念。应该是人耳可分辨的一次发音动作就是一个音节,无论其有无元音。譬如strict,按现在的音节概念就是一个音节,但实际上应该有4个音节。其次是word应该是什么意思?现在都翻成“词”了,其实也是个错误,应该是字。什么是字?就是最小语义单位。在汉语中,字就是最小语义单位;而在英文中,word是最小语义单位。所以word=字。如此一来,汉、英的优劣就一目了然了。汉语中每个字都是严格的单音节,而英语字的音节数多少不等,极不规范,所以英语比汉语的进化程度要低得多。

通宝推:夢回漢唐,非鱼,
家园 好像测量语言对比的量化的实验数据过少

感觉数据太少了。应该有很多衡量语言的量化手法。比如

计算网上阅读一篇文章的时间,技术上应该很容易统计,比如我看西西河,看完一篇就点击下一篇,点击鼠标之间的时间就是阅读时间。

当然这个很粗略。可以用别的更精确手段衡量,改成统计回复文章用户从点击到回复的时间。

或是手机阅读新闻或小说时的进度,手指滑动手机就表示看完一页。

或是2人qq微信聊天时候,计算看完到开始打字需要的时间。就知道阅读和理解的速度。

说话和理解的时间也能统计出来,打电话时候专门统计那些爱煲电话粥的女生时间间隔。

三星新出的手机不是能跟踪眼球吗,感受到人眼在看手机最下一行就自动翻页,那要统计人阅读一个手机页面的时间就太简单了。

还有一个思路是计算说话消耗的能量,刚学英语时说得很费劲,就是消耗能量多,熟练后就可以用正常语速,大脑cpu占有率也不是100%了,很轻松的就能说出来,婴儿对语言的学习应该也有这个过程。不知道怎么准确的计算这个能量,声波的强度和时间的积分或是计算肌肉的运动?

刚上大学的时候就发现一个很明显的现象,同学遇到老乡时候在宿舍聊天,用方言非常流利,速度非常快,一点不打结巴。用普通话语速明显慢很多。显然就是这些人的舌头嘴巴训练得说方言消耗能量比普通话少,听力也能轻松。

家园 “憂鬱的烏龜”够经典!

再有港台人士和我讨论简体繁体,我就要他们写“憂鬱的烏龜”五百次,我写简体奉陪,估计港台人士十九服了气。

家园 money talks loud

1. 农村基层组织的变化 [ 领域时空 ]

"农村基层组织虽然没有完全瘫痪,但是其性质已经在慢慢改变。改变的快慢与利益的量有关,如果我村有拆迁补偿之类的巨额利益存在,性质估计就不像现在这么简单。邻村举报的那个,因为有村工厂和大型土地出让,因此性质就严重许多。而基层组织现在还处于恶化阶段,一时看不到好转的迹象和出路"

城镇化=tgs strategic 预备队, I wrote about this before about 2 years ago; it is a big deal and not an easy one, more difficult now than then.

how tg figure that(城镇化) out, now with manufacturing and export sector topped out?

2. has tg topped out economically, particularly in terms of its "北京共识" model, as a challenge to 欧美社会公理?

3. topped out=still ok

if nothing else, tg 子弟兵当家, even 張德江 was "discovered" by 鄧穎超, when she visited 張's college where and when 張 was number 2 boss, and number 1 boss was not there that day, and 張 hosted 鄧, and 鄧 was very happy and appreciated 張, from there on, 張 started his political career,..

as such and for all other reasons , tg has been number 1 super 3d human organization in human history

4. even if tg has "topped out", the process could be N years, and some kind of good luck could still come to help out

money talks, may not as loud as before, still very loud, and that is good enough for tg's sys admin folks

---------------

語言高能輻射:out of "经典能譜" [ 晓兵 ]

头像晓兵

乐善4

声望2366

发短信 趋加追订 屏蔽

1

"语言实际上是把人的思想通过发音器官变成一串频率不同、波形不同的声波,然后有另一个个体的听觉器官和相关的脑部组织重新转变回思想。"

very good points, but not 声波, not-conventional 通訊, not any "能量守恒" type of business of low profit margin, etc.

语言 as conventional 通訊+语言 as conventional logic processing tool=经典能譜, actually no big deal, remember your post about

"Moravec的悖论10 Fuhrer 字3601 2013-01-25 19:08:59",

AI will take care of all of them, and there will be some differences between less 正交 语言 such as chinese and those more 正交语言 such as english, still no big deal

2.

where is the big deal?

big deal=語言高能輻射 or qm 量子隧穿效应 in

1)invoking an important and substantial delta/change in a large population's 思想意識, effectively and in a relative short time period, such as in a war/national/idealogical conflict type of serious situations, and large scale political/marketing campaign and those less serious situations, etc

2) in long term "brain washing", "世界观" education, etc.

語言 used to be used as a powerful weapon as such becasue it is often 披著"经典能譜"羊皮(可見光,聲音,文字, picture, etc) but often does

a 狡猾的狼's "一本万利" kind of work, such as 高能輻射, 量子隧穿 people's brain and make them do the heavy lifting work, such as: love you 1314 as some kind of idol, fight a war, buy your stuff, elect you into an important political official post, etc;

家园 因为都与梵语有着许多联系,印欧语系的印

梵语其名称本为sanskrit, 维基上说是印欧语系的印度-伊朗語族的印度-雅利安语支的一种语言。

使用字母的拼音文字多多少少都与梵语有相似的地方,还是维基里说的:“在印歐語系范圍內,梵語同噝音語言(特別是斯拉夫語言和波羅的語言)還有希臘語共享相同的特征性語音演變。”

家园 关于中文的纠错能力,一点小想法

语言是用来交流的。语言在交流的过程中可以存在以下过程。

1.录入过程,就是人们把心中的文字变成纸张上或屏幕上的文字的过程。

2.传递过程,指的是,从录入方录入完成,到读取方开始读取,之间的过程。

3.读取过程,可以分成两个子过程。

一是把纸张上或屏幕上的文字,还原成心中的文字。

二是把心中的文字,最终复原成语音。(这个子过程不一定会发生。)

下面谈纠错:

1.首先看录入过程。对于一种语言,语音是一个encoder,文字是另一个encoder。中文的语音和文字是脱节的,所以只能依靠文字的encoder进行纠错。拼音文字的语音和文字相互关联,所以可以实现两个encoder相互纠错。所以拼音文字在录入过程中的纠错能力比中文强。

2. 然后看媒体传递阶段。纠错靠冗余。同样的内容,中文英文各搞一份,然后做压缩。中文文件在大多数情况下size小于英文文件,说明汉语的冗余小。中文的冗余小所以潜在的纠错能力把英文弱。

3. 最后看看读取过程。

先是把纸张上或屏幕上的文字,还原成心中的文字这个子过程。这里,无论英语还是中文都要靠上下文。但是,中文不使用空格断词,所以同样是词(word)级别的错误,中文有机会让它升级到上下文的层次。这样对于中文,通过上下文纠错就变得不那么可靠了。

最后是复员语音。由于中文的文字与语音分离,朗读的人无法通过文字提示读音,读了错别字,自己是无法意识到的,自然也就无法进行纠错。

家园 拜托您在提出这些理论的时候先做个思想实验,不要想当然

语音与文字,极少见到同时使用两者的。要么就是用语音交流要么就是用文字交流。敢问两者都不同时使用,怎么两者的编码还能同步互相纠错?拼音文字哪里来的纠错能力比汉语强。案例在哪里?你能不能在英文里找出一个这种交叉纠错的案例,然后再搜索一下中文对话,看看是不是真的找不到类似的案例。

冗余度的大小与纠错能力没有必然联系。你把一句话重复说30遍,冗余度很大,抗噪能力不错,但纠错能力有多大?其次,过大的冗余度影响交流效率。

词级别的错误到底有多少?升级到上下文的概率有多大?升级到上下文所以必然影响纠错?就算这些都有,那英文的多义词对上下文造成的理解偏差又该作何论处?

朗读的人读错了又怎么样?这么说吧,这年头还有多少机会能碰到“你需要从别人的朗读中得到必要信息”、“对方读了个白字”、“而你就无法理解了”这三个要素同时出现的情况。你能不能给我讲讲你近20年以来碰到的这种案例。话说我不记得近20年以来我碰到过这种情况。

家园 一个特殊之处好像是互相之间的连接——突触?

是长出来的,如果要模拟人脑,就也需要有这么个长出来的机制。

另外从记忆元件的数量级而言,似乎现在的技术已经可以实现了,当然元件有现有的计算机元件恐怕不大一样,有不大一样的逻辑。

家园 要分清降低,和相比其他语言低,这2者的区别

英语是相比较而言,文盲较低,从而最早进入工业社会,带动文盲进一步降低的良性循环

家园 语言是表现现实的,文字是表意的

这2 点,英文都不占优,它的优点就是将语言与文字结合起来

家园 《人工智能的未来》by the palm guy

I think 熊起 mentioned this book in his post somewhere, and thanks to 熊起;

I have not fully read it yet, just a few pages.

basically, the way I see AI's issue:

1.

光子=information, with all kind of 能级

2.

our brain, with many 突触 it has, is largely @low 能级, missing high 能级, missing information, models

I think the way our mind model developed is based on our vision experiences out of evolution, our vision=

"合成的光向量場經過時間平均後,其強度會趨近一定值"

http://www.ccthere.com/article/3851226

it works in our daily newton type physical world;

in high 能级 science/technology/social world, that model is very often misleading.

傅立叶变换 is local, as an example;

google's 人工智能 glass may try to help general people/mass to see through 皇帝新衣, to have a more "fair" class struggle, kind of, I guess goog two guys have a long term plan in their way of changing the world as we know

陕西科技出版社最新引进美国图书《人工智能的未来》(On Intelligence)一书,是由杰夫霍金斯,一位在硅谷极其成功、受人尊敬的计算机工程师、企业家与桑德拉布拉克斯莉,《纽约日报》的栏目作家共同撰写。本书对人类大脑皮层所具有的知觉、认识、行为和智能功能新理论提出了新的理论构想。这一理论的独到之处在于对大脑皮层的现行认识提出了新的观点,对大脑的工作原理,即霍金斯称之为“真正智能”而非计算机式的人工智能立论扎实,观点独特、新颖,阐述精密。对大脑及其工作原理感兴趣的朋友不妨读读,必有收获。

本书共八章,人工智能、神经网络、人脑、记忆、智能理论新架构、大脑皮层工作原理、意识和创造力、智能之未来。

家园 那么请比较一下英国与中国在工业革命前的文盲率

拿数据说话最可靠。

家园 问题不在于记忆元件的数量

而在于记忆搜索的过程中,每个元件自行再展开搜索,举个不恰当的例子:每个磁盘颗粒,自身也是磁头,而且知道去哪里读下一个数据。妨碍模拟人脑的,主要还是对机制的了解而不是器件制造。器件模拟的电子脑,实际上是造出来过的,有本论文集《人工智能哲学》,提过七十年代电子脑的进展。

全看树展主题 · 分页首页 上页
/ 102
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河