主题:汉字的造字创设逻辑 -- 大井故事
长期以来积累了很多思考逻辑的碎片,正好利用这个假期整理一下。这帖内容主要以推演欧洲(西方)文明进化过程为主。继而理清楚大家熟知的一些概念词汇比如自由、民主等词汇的进化由来。最后给出资本一词的新定义。
开篇先写汉字的造字创设一段内容,核心是为了简练下阐述人类社会各种族群进化发展中,所遵循的基本进化逻辑规律。
====================================
汉字起源于原始人使用的简单符号,包括象形符号。起到的作用是传递私密信息。这点是毋庸置疑的。
其实那个人类历史时代,地球上各地各区域的原始人都会使用一些不同的简单符号来传递信息。比如两个原始人私下约定刻画了一个圆圈来代表我们对某个事情或状况的共同认同、刻画一个三角型来代表不认同状况,这时信息的内容只有两个原始人知晓,而包括传递信息的原始人等外人,是无从知晓这个符号含义的。
对使用到今天的汉字而言,真正关键的是为什么我们这些符号被持续流传下来了,并持续的依托这种符号状态还在持续的进化发展。最终成型为一种现代文字。
说到符号,我猜测中华文明的那个八卦符号就是一种早期文字符号。利用八个符号的组合来代表约定的不同认同状态含义。这时学习八卦也就成为了学习里面的状态含义。至于后来的易经以及更多的64卦,那就是持续的演绎了。因为开始演绎的时代,中华社会已经不需要简单符号来传递信息了。
在那个时代,统治群体是最需要这种内部的符号传递方式的。就像现在的军队、保密机构,都有着专门的信息传递工具或方式。
至于有很多分析判断都说,文字起源于宗教。我觉得,应该是那时的原始人群体的统治层都是来自宗教意识治理人群的缘故。所以这些符号不是什么专门跟神仙沟通用的,而主要是统治层之间传递信息使用的。
简单符号的普及阶段,
原始族群开始比较容易看明白符号含义的这个阶段,就是象形文字泛滥的阶段。这个,东西方文明都存在此阶段。
毕竟,画一个山峰、一条鱼、一棵树等,哪怕把这些观察到的物质画的再简化一点儿,原始大众也都能够看出来内容是什么。这些都是很容易的事儿。
但是接下来,各种文明在文字发展进化上却开始走了不同的路子。因为,创立了更多的象形符号之后,就能够传递更加复杂的信息,也就能够开始用符号来记录观察到的这个世界的更多内容了。于是,这时需要创造的文字量就会越来越大,并且还要包括创设更多的无法用象形来表达含义的符号字。那么,原始人走到这一步,下面该怎么走呢?
我们知道,原始人必须要保障生存,生存就要吃饭。如此只能因地制宜,于是产生了农耕和渔猎两个进化方向。
两个方向的原始人都需要总结自身所在生存地域的地理环境、气候环境、生物环境等境况的规律和特点,归纳成为经验来指导自己的生产活动。
原始人的这种总结和归纳就是他们世界观的建立过程。
首先为了生存而观察所处世界、总结归纳经验规律,然后把经验规律的结果用于指导生产活动,从而保障原始人族群的更好生存。反之因为有了越来越多的生产活动,使得原始人开始面对不断出现的新情况、新状态,于是原始大众又带着这些新情况、新状态回过头去更加广泛深刻的观察世界,开始总结归纳的新过程。
这样的生存状态之下,处于农耕区域的中华文明,逐渐在思维中提炼出一种对世界分类观察的意识思想。这就是我们现在所熟知的金、木、水、火、土五种分类含义的由来。原始人下面要做的就是尽可能的把他们所发现的物质,归结到五类之中某类,因为这样才便于观察和分析世界。这种意识思想我们文明延续至今,比如对人体的认知总结。
对了,古人对人体中的气的认知,其实是来自对地球世界的风这种状态的总结归纳。金木水火土的总规则就是真实的物质存在类型,能观察到的。而风的定义,是说不尽道不明的。这也就有了,中医理论中的滞、涩和塞等用字的原因。本身逻辑就是来源于风对世界影响的世界观分析。
可以说中华文明原始族群对世界这种分类方式的意识思想,影响着这个文明的方方面面的进化和发展。其中就包含着文字创设的发展。
是的,到了上面提到的大量象形文字出现的阶段,中华文明对文字的分类也开始了。于是文字创设的基础,也是延续了金木水火土这五种类型展开。并且,非物质状态的符号文字的创设同样遵循这个规则方式。
这就是,我们文字中大量使用同样偏旁部首的原因。
比如,森林中一棵树,大家不知道它是什么树,但是只要为此树创设符号时带上一个木字旁,其他人就知道,这个东西是一个什么类型物质。
同样,分类的世界观分析意识在应用到汉字创设上面的时候,也导致了,汉字符号是世界各族群的文字中,文字数量最少的那个类型。
当然,文字的创设不是一蹴而就,不是某一个人的发明创造,不是某个历史时代的发明专属,而是一个同样追随人类社会文明持续进化发展的,一种持续不断完善符号创造的行为活动。
耳朵听用声音,眼睛看用图像。
声音需要一个音节一个音节,在时间上连续,同一时刻其他的音源会导致噪声,影响音频信息传递。音节和音节之间在时间上需要有间隔。
图像信息则可以同时呈现,不需要在时间上做分隔,只需要在空间上做分隔就可以。
效率上来看,视觉信息比音频信息应该高一些。
欧洲语言大部分通过音,中国语言主要通过形。也许欧洲是先有怎么说,然后有了怎么写,中国则是先有怎么写,然后怎么说。为什么有不同的发展途径,和地理有关?还是和早期使用的书写材料有关?中国早期的甲骨、竹片以及后来的活字、纸张对书写传播有利,欧洲早期的书写材料质量有限。
另外,汉字的一个主要结构方式是空间组合,这种思维方式和农耕所需要合适空间结构有没有关系?
因为中国古时书写材料的可靠性,我看是果的成份比较大,毕竟照抄图的过程中信息曲损的可能性要比口传过程中信息曲损的可能性小些。而且,最关键的是,书写的,可以追溯回去来确认抄的对不对,保真比较好。说的,就很难追溯回去了。
因 都从甲骨文而来,基本构型(思路)一致。
果 列国有自己的发展,书同文主要是规范写法。
举个例子
显然楚国比较飘逸,而秦国比较厚实。
就发展而言,很难说先有文字再有语言。但是就实际而言,文字的确是被命名出来的。我是说,有些文字是先有形,后有文。而且用途不同,会有不同语音。再反过来通过文字梳理语言,形成规范。
至于为什么发展不同。有人从甲骨文上推测,即从占卜出发,逐渐形成表意文字(比如汪德迈)。书写材料并不是关键。
最后是空间结构。不一定是耕作本身,而是观象授时,为了确定耕作的时间。从天文出发,建立起以空间为主的时空体系,进而形成宗法与制度(比如冯时)。
只是其他地方也很难脱离空间。比如古印欧词根-weid,最初是view(看),进而发展出wise(智慧)。古希腊虽然是拼音文字,但是文化上强调空间形式。甚至把时间等同于空间。古印度就更别说了,他们的vastu(物)本身自带生长、保持的意思,这也是从空间变化上得来的。印欧语系的变位本质上也可以说是空间上的,尽管他要反映到语言。所以单纯说思维模式很不容易。
但讨论结果很容易。比如我经常说的,汉语和其他语言不是一个脑区。汉语偏运动区,强调读写说看。其他偏语言区,强调听说。这是汉字三合一的特性决定的,进而成为思维方式。
而且这个说话系统一定相当成熟,能够解决信息的交流问题。
为什么这么说呢?
相比较几千年文字系统,说话系统的完善过程可以按百万年计。
说话系统已经能解决信息交流,为什么还要文字?
首先,说话系统是小范围的,或者说也许一个地理单元就有一套说话系统。今天在中国的很多地方,翻过一座山,就会听到一种方言。
也就是说,说话系统的交流范围非常有限。
其次,说话系统不利于经验的传承,比如,族群里面有位非常厉害的人,可他还没有很好地向族人传授某方面经验,就突然死掉了。
而文字可以解决这两个问题。
最早的文字应该都是象形文字,目前已知的有古苏美尔人的楔形文字,古埃及文字以及中国的甲骨文都是象形文字。前两种已经成为死文字,只有甲骨文发展延续下来。
古苏美尔,古埃及,古中国为什么会产生文字?
因为这三个古文明在当时,在很大的地理范围内,处于文明中心位置。
文字的出现是为了满足文明传播和传承的内在需要,或者说是为了建立中心主义的需要。
古埃及人建金字塔,巴比伦人建空中花园,不能简单理解成穷奢极欲或者宗教信仰等,其实是用最显目的标志向周边的族群炫耀实力,炫耀文明,与当代的摩天大楼没有本质的不同,目的就是宣告我是世界中心。
当然,古埃及和古巴比伦都消亡了,只有中国绵延不绝,虽然我们没搞金字塔和空中花园,但是历史已经表明中国搞中心主义最成功。
简言之,最早的象形文字是人类某支文明为了满足自身搞中心主义的需要而产生的,是内在驱动。
而后来出现的印欧语表音文字,则属于外在驱动而产生。
为什么说它是在外在驱动下产生?
所谓表音文字,是在不同的说话系统上建立的,或者说是对不同说话系统,在一定地理范围内进行统一,它不同于脱离说话系统的象形文字。
当古埃及,两河流域的有中心特征的文明消亡以后,地中海沿岸的各个族群又靠着各自的说话系统来往,为了能彼此听懂对方的话,他们必须发明出一套新的,大家都能听懂的话,同时为了贸易的履约,还必须有相应记录这些话的符号,于是,表音文字就产生了。
这些印欧人没有中心主义思想,他们发明表音文字,只是为了满足相互贸易的需要,是外在驱动下产生的。
以上是我对象形文字和表音文字产生的理解。
另外说一个可能很多人反对的暴论。
中国近现代落后的很大一个原因,是我们的象形文字造成的。
我们很早就发明了活字印刷,但是一直没用起来,主流的还是刻板印刷。
为什么呢?因为汉字活字印刷,印刷一本书,第一,需要制作的活字太多,需要上万个字模,成本太高;第二,对印刷工人的要求也高,需要认识很多字才能排版。
生产成本高,技术门槛搞,再好的技术也很难推广。
但是,活字印刷传到欧洲,技术使用条件立即发生巨大差异,几十个字母,只要制作几十个活字就可以印刷一本书,对工人要求也低,古登堡发明活字印刷以后,他手下的工人。干几个月就跑出去另立门户,开印刷厂。
欧洲人对古登堡发明活字印刷的评价,称为史上最伟大发明,并不为过。
高尔基书籍是人类进步的阶梯,培根说知识就是力量。
活字印刷术以其低廉的成本,无门槛的技术壁垒,让知识传播和生产出现井喷。
在古登堡发明活字印刷后,欧洲有了哥白尼革命,有了哥伦布地理大发现,这绝非是巧合。
日本明治维新搞的好,也与此有关,日文大概只有70多个字,搞活字印刷也很简单。
看人类科技的进步史,发现一个规律,即参与的人越多,越容易出现颠覆性的技术。有些技术的首创者,在其发源地可能是鸡肋,在别的地方就会大放异彩。比如,青铜和冶铁技术,中国是后来学会的,但后续却能发展到登峰造极,而在其发源地,却止步不前。
当然,现在汉字对技术的不利影响也许已经不存在了,一度认为汉字打字比表音文字慢,联想打字出来以后,发现比表音文字还快。
编程方面不懂,不知道有没有用汉字编程的软件?用汉字编程的软件是不是比用表音文字更简单?
以上纯属瞎扯,如果碰到一些人的敏感神经,勿怪勿怪。
已经有人在搞汉字编程了。
很多人在编程的时候用汉字注解,就这也可以更好的推动软件的发展。
是最初要适应不同语言族群之间的交流,因此才没有走表音的路。
同一字长位数的标准码里汉字和字母的地位等价的,都对应着某一个N位二进制数。
一、在表达传递信息方面,英文字母有的好处是只有26个,6个字节就够了,实际处理的时候可以用一些算法加速;汉字比较多,几万个汉字要16个字节。如果按照比特极限处理速度算肯定是英文快。比如说一个64位处理器,一次可以处理10个字母,对于汉字则可以处理4个。
但是,因为汉字单个字的表达功能远大于字母,4个汉字富含的信息量可以非常大,可能比10个字母组成的单词或者词组大,同样处理或者传播一次,汉字信息传递效率要高。
二、在存储显示方面,汉字字形复杂,需要更多的存储空间,但这个在现在存储显示白菜化时代显得无所谓。
三、在编程方面,我认为用汉字和字母没有区别,因为程序运行并不取决于用的符号,而是取决于逻辑,汉字和字母无非就是代数符号。从这个角度来说,abcd显然比甲乙丙丁简洁一些,学习过代数的人都能感觉出来,实际输入的时候也是英文输入更方便。
个人感觉英文编程在一些高级语言上并不一定比汉字有优势,因为编程最重要的是逻辑,尤其是高级语言最后会编译成可执行程序,只要能正确识别逻辑意图,用什么符号都是可以的。现在编程都用英文还是因为美国科技霸权和路径依赖。
都是受到后天环境的影响。
比如,中国一只小狗的叫声和英国小狗根本没有根本区别。这就是生物趋同。
人类也一样,从诞生到进化到某个阶段这些时间内,身上带有的生物性会起到最重要的作用。到达一定的阶段后,开始依托各种环境影响结果来完成下面的持续进化。
比如,阿拉伯语后来的进化是完全依托他们那本经书教义。我不懂阿拉伯语,只是跟会的聊过。大家也可以搜素一下对阿拉伯语的各种解析,就能够明白其复杂性的来源。
而处于渔猎区域的欧洲(西方)文明和处于农耕区域的中华文明在语言和文字的进化中也走了不同的。
农耕区域把农业活动列为最重要的生存基础。由此推动了他们认知世界的过程。
渔猎地区把渔猎活动列为最重要的生存基础。
但是在经过一定时间段之后,渔猎这种重要生存基础的方向却发生了彻底转变。因为,从地球自然规则原理上,渔猎这种活动所产生的人类长久生存效应是有上限的。也即是,这个活动就不是一个特别利于人类进化的活动。
这时,欧洲人新的生存活动就产生了。即,交换活动。确切的说,交换活动是源自渔猎区域原始人的存储行为。或者说,交换活动属于人类存储行为的范畴。
因为自然原因,渔猎活动的物质产品,首要的是保存。因为渔猎这个属于具备上限活动的缘故,导致获得产品和保存产品提到一样的重视高度。
而保存行为范畴的向下衍生出现两个重要分支,一个是动物驯养活动,另一个就是交换活动。这时,渔和猎的族群进化就开始有了重大分化。对欧洲而言,他们也就走上了以交换活动为最主要生存基础的进化方向。
这阶段,希腊那地方凭借地理优势,在欧洲进化中一骑绝尘。(这里要强调一下,希腊是欧洲文明的源头,但是要剔除那些各种造假的什么哲学理论。渔猎活动下,产生那些思想是不可能的。包括国家等概念认知。是文艺复兴时代,欧洲人才开始思考的。)
这个一骑绝尘是基于交换活动的大发展。包括物质和意识两个方向。这就像上面提到中华文明依托农业活动的进化发展一样,同一个逻辑原理。
交换活动下,才有了他们定义的自由、民主、契约等行为状态的意识规则诞生和延续。简单说自由民主等概念状态是依据交换活动而生。
而后来耶稣建立旧基督教,是对交换活动的一次意识强化。因为旧教的要义核心是规则。而天主教的要义核心是信仰。
上面这段时期,欧洲的语言文字进化分为两个小阶段,开始是人类的自然阶段。(这点中西相同)然后进入交换活动影响进化的阶段。
但是,耶稣旧教的诞生,强化了交换活动的同时,也让欧洲文明的语言文字与之前的进化产生了重大转折,打断了之前的进化方向。
这个阶段就是宗教压制整个欧洲语言和文字进化发展的阶段。因为宗教参与进入了欧洲的交换活动,为了自身利益而开始推动欧洲物质和意识的进化发展路径。
但是,宗教内部是有统一文字的!便于记录和信息传递。只是,为了获得最大控制收益,宗教根本就没有让欧洲走向文字统一和语言统一的必要。如果统一语言或者出现大范围的文字统一,那对宗教才是不利的。(这点和现在资本控制社会的手段和逻辑是一样的。)
欧洲这个状态,直到元朝西进时代,在各种压力下才有了被动改变苗头。
关于最后一个汉字结构的问题,我认为你说的对。肯定是受到外在环境影响而进化出来的。不可能凭空出现。这应该是一种更简单直观、更容易解读的方式,也只有如此,才能在历史上存留下来。
比如曹操和杨修那个故事中的的”囚“字。即使不认识这个字,但看他的形态也能感觉出这个字的可能涵义。这就是人类的自然认知行为的衍化。
早前都是几千,后来比较厉害的是一万多。现在完全随便了。
编程方面,还是编译环境和功能实现的问题,和语言本身无关。最后都得转换成二进制文件。
其实所有语言都大同小异,只不过是一些单词和组织方法。重要的是他们的规则和不同的实现方式。这才是关键。典型就是函编。但是改成中文也不是什么问题。没有谁比谁更简单之说。只能说看起来比较简单,不用记英语了。比如中文编程有易语言,不过是if、then之类改成中文而已。
早期经常是几百近千,而且是液晶屏的字库。不是单片机的储存。现在国标六千多字的依然很常见。
就程序空间而言,常见的4-8KB,最高64KB(STC89)。而现在STM32都是32K-1M了……😅
挑个错 文中字节和位搞混了 英文字母需要6位 汉字需要16位 也就是两个字节