五千年(敝帚自珍)

主题:读《文言文到底脱胎于一种什么汉语》附记 -- 杨微粒

共:💬23 🌺143 🌵1
全看分页树展 · 主题 跟帖
家园 从几种混合语的例子看汉语的克里奥尔语起源的可能性

https://zhuanlan.zhihu.com/p/161576819

一、引言

孙宏开等人主编的《中国的语言》中有一篇黄行先生撰写的介绍文章——《中国语言的接触和混合》,这篇文章非常有启发性,为我们思考汉语的起源提供了思路。

语言的发展是很复杂的,简单说有三种变化:分化、流变、融合。

分化是指说同一种语言的人们因为生活环境的隔离和交流的断绝使得语言向不同方向演化,从同一种语言演化出不同的方言,最后语言差距越来越大形成独立的语言;

流变是指语言即使不发生分化和融合,它本身也会在代际传承中发生缓慢的变化。这种变化的速率受到人口基数和外来语言的影响,如果人口基数小且缺乏外来语言的影响,则语言变化速率慢,如果人口基数大且与外界交流频繁,则语言变化速率快。这就是为什么汉语官话的演化速率要快于南方各方言的原因。流变的方向在不受到外来影响的前提下是相当随机的,这也是为什么澳大利亚土著所有相邻部落语言都相通,但是距离遥远的部落却无法通话的原因;

融合是指两种语言甚至是多种语言,在长期密切接触之后融合成一种语言的现象。

传统历史语言学的谱系树模型是根据印欧语系的研究建立起来的。由于印欧语族群特殊的历史,他们的语言历史主要是分化,因此谱系树模型很适用于印欧语系。但是除了印欧语族群、刚果语族群和波利尼西亚语族群外,谱系树模型并不适用于大多数人类语言。以中国为例,中国的语言史主要是流变与融合的历史。中国的语言当然有分化,可是更多表现在藏缅语族、苗瑶语族和壮侗语族内部,就整个汉藏语系(广义)来说,并未发生如印欧语、刚果语或波利尼西亚语族群那种四散扩张的历史,所以分化之后有融合,再加上流变的影响,所以中国的语言无法建立起令人信服的谱系树。

在中国的语言问题中,汉语的起源堪称圣杯问题。一方面,历史比较语言学已经从同源词的角度无可争议地证明汉语与藏缅语有发生学的关系,另一方面,汉语的语法特征与藏缅语却有着明显的区别,却更接近于侗台语和苗瑶语。如果纠结于同源词的分析,如西方学者那样,就会认为汉藏语系只包含汉语和藏缅语,而无视汉语和侗台语、苗瑶语的亲密关系。这个问题的确是一个很困难的问题,黄行先生的这篇文章以实际存在的混合语案例给了我们启发。

二、语言的融合与混合

黄行先生认为语言的接触有三个层次,最浅的一层是借用。借用也有三个层次,第一层是借用词汇但是改造发音和构词适应本族语,第二层是借用大量词汇且不一定改造发音和构词形式,第三层是巨量外来词进入本族语且改造了本族语的语音系统和语法规则。

语言接触的第二个层次是语言融合,弱势族群通过学习强势族群的语言,形成带有本族母语特征的混合语,经历双语阶段,最后取代本族语形成以本族语为底层的强势语言的方言。汉语南方各方言大约都是这样形成的。比如说如果没有现代的传媒手段和教育,英属印度在受到英国更久的统治之后,也有可能放弃印地语采用带有印地语发音特点和语法特点的印度英语方言(远比现在的印式英语离英式英语更远)。

语言接触的第三个阶段是语言混合。黄行特别提到了皮钦语和克里奥尔语。皮钦语是一种临时性的混合语,而克里奥尔语是稳定的、可以作为第一语言的混合语。混合语的普遍特征有:简化的非常规变化、变化迅速、羡余度降低以及趋于分析化。

语言融合和语言混合的差别在于,语言融合的过程一般比较漫长,而且最终结果是形成强势语言的一种方言,而语言混合的过程常常很迅速,经常在一两代人的时间实现,最终结果是形成一种新的语言。

我们具体来看文中举的五个案例:

1、广西融水县五千壮族人讲的诶话,是一种融入汉语的侗台语。按照前面我们给出的定义来说诶话不属于语言混合,而是处于语言融合进程中但尚未最后完成的例子;

2、西藏察隅县几个村庄讲的扎话,基本词汇借用格曼语,文化词借用藏语,但保留自身核心词;

3、青海同仁县两千五屯人讲的五屯话。这是一个非常有趣的例子,五屯话的基础是汉语,但受到藏语的强烈影响,吸收了大约 25% 左右的藏语借词,语音和语法都被藏语所改造。不仅如此,它还受到保安语的强烈影响,保安语并未提供多少借词,但对五屯话的语法产生了深远的影响。藏语和保安语的共同影响使五屯话从一种孤立型语言转变成黏着型语言;

4、四川甘孜州雅江县两千六百多汉族说的倒话。这些人是两百多年前移民到此的汉族,与周边藏族世代联姻。倒话几乎全部的核心词汇、基本词汇和绝大多数的一般词汇都是汉语词,吸收了少量藏语借词,但受到藏语构词法的影响。语音系统更接近汉语,但受到藏语较大的影响,音系发生了变化。语法则受到藏语康方言的深刻影响,发生了质变;

5、甘肃东乡族自治县自称回族或东乡族的两万唐汪人讲的唐汪话。这个更有意思,唐汪话里的借词很少,借自阿拉伯语、波斯语和东乡语,显然是受宗教影响。唐汪话虽然语音系统和词汇与当地的中原官话或兰银官话基本相同,可是语法却与汉语完全不同,几乎彻底地采纳了东乡语的语法。所以唐汪话是一种汉语代码 + 东乡语结构的特殊语言。

对后三种混合语的具体介绍,可以参考知乎上的一篇文章:

Prince:三种中国现存的混合语(克里奥尔语):唐汪话、倒话、五屯话​

zhuanlan.zhihu.com图标

三、对五个具体案例的简单分析

具体分析这五个例子,诶话和扎话都属于语言融合的例子,即弱势族群逐渐采纳强势族群的语言,我们现在看到的诶话和扎话都是尚未完成这一过程的例子。

唐汪话、倒话和五屯话则属于语言混合,这三种语言都是强势族群在局部弱势的情况下与周边族群语言发生混合的例子,它们有共同的特点,但由于处于不同的环境而处于不同的发展阶段。共同的特点是语法最先受到影响和改造,然后随着借词的增多语音也开始发生系统性的变化,最后是越来越多借词的进入。

因此和一般人的想象相反,一般人会觉得词汇是最容易受影响的,其次是语音,最后是语法。这几个例子恰恰告诉我们,在语言混合的过程中,语法是最容易受影响的,语音其次,词汇特别是基本词汇和核心词汇是最稳定的。

唐汪话使用人口较多,周围除了占据优势的东乡语外,仍然有强大的汉语方言的势力,因此除了语法结构趋同于东乡语外,语音和词汇都基本保持不变。

倒话使用人口较少,处于藏语康方言的包围之中,且当地人与附近藏族世代通婚,因此语法趋同藏语,语音也受到藏语的影响,但词汇借入不多。这是因为倒话族群的历史比较短,历史上有明确的记载,倒话族群是清代康熙五十八年(1719 年)由清朝驻兵和从内地招募的船夫与当地藏语居民联姻形成,距今刚刚三百年。

五屯话使用人口更少,不仅处于藏语安多方言的包围之中,周围还有强大的保安语族群,实际上是三种语言的混合。其语法主要趋同于藏语,但也受保安语的强烈影响,语音也受到藏语的影响,词汇有四分之一借自藏语,还存在同一词义有汉语词源和藏语词源的词并存的现象。和倒话族群相比,五屯话发展的历史更久,五屯人的历史不晚于明代万历十三年(1585 年)保安城建城的年代,距今至少四百年以上,可能更久。据传说五屯人源于四川,原信伊斯兰教,后改宗喇嘛教,可能是汉族也可能是说汉语的回民。五屯人现在被划分成土族,但自我认同倾向于藏族。

从这几个例子来看,对于解释汉语起源最有启发性的是三个语言混合的例子。和克里奥尔语相比,克里奥尔语一般是奴隶或土著采纳殖民者说的强势语言(例如英语、法语)的词汇,但是很大程度上用的是奴隶或土著自身固有的语法,语音也相应做了改造。文中介绍的唐汪话、倒话和五屯话与之恰好相反,是外来的强势族群在局部弱势的情况下采纳了本地语言的语法,语音也可能会受影响,但是词汇基本保持。从结果看,这两种不同的机制产生的结果是一样的,都是产生一种词汇基本不变语法大变的新语言。

四、原始汉语是藏缅语克里奥尔化形成的吗?

很早以前就有人提出过藏缅语克里奥尔化形成原始汉语的猜想:早期的华夏族说的是一种藏缅语,在苗瑶语和侗台语的影响下,通过克里奥尔化产生了语法趋同于苗瑶语和侗台语、词汇保存藏缅语的新语言——原始汉语。

然而,从上面的案例我们发现原始汉语的产生有两种可能性——既有可能是在华夏族优势地区被征服和同化的侗台语、苗瑶语族群说克里奥尔化的藏缅语,也可能在侗台语、苗瑶语优势地区出现类似上述唐汪话等混合语的原始汉语。这两种路径殊途同归。

从分子人类学的证据来看,除了江浙地区以外,华夏族大体保持了和其他藏缅语族群相似的 Y 染色体单倍群基因分布(扣除高原土著D单倍群的影响),因此我们推测原始汉语主要是华夏族通过类似唐汪话、倒话的方式形成的,而不是苗瑶语族群或侗台语族群通过克里奥尔化形成的。

从华东地区汉族的 Y 染色体单倍群分布来看,侗台语族群是融入了华东汉族之中,这与汉语吴方言的底层为侗台语是完全相符的。

我们说华夏族的主体是说藏缅语的移民,但这并不排除有相当数量的土著融入早期华夏族之中。从分子人类学的证据来看,苗瑶语族群与藏缅语族群分离时间相对较晚,所以也许现在我们认为是汉族或者藏缅语族群的特征 Y 染色体基因标记其实也广泛存在于早期苗瑶语族群中,因而当早期苗瑶语族群的主体融入华夏族以后,单纯从当代的分子人类学分析并不能有效区分华夏族中的藏缅语族群成分和苗瑶语族群成分。所以上面的结论并不排除苗瑶语族群通过克里奥尔化参与原始汉语形成的可能性,但即使这是可能的,也应该是一种次要途径。

有人可能会问,为什么是语言混合而不是语言融合?也就是为什么不是侗台语、苗瑶语族群逐渐采纳早期华夏族的藏缅语(最多保留一些本民族底层词汇和语法),而是藏缅语和侗台语、苗瑶语混合成了一种新的语言?因为如果那样,汉语的语法特征应该更接近于藏缅语而不是苗瑶语和侗台语。

两种语言相遇究竟是融合还是混合取决于双方接触的时间和双方的人口数量和文化力量对比:如果双方接触时间非常漫长(比如数千年),其中一方的文化力量远强于另一方或人口远多于另一方,那么会形成语言融合;如果双方接触时间较短(比如仅有几十到数百年),双方文化力量与人口数量势均力敌,就会易于形成语言混合。

所以我们可以做一个有趣的推论:在某个时间点(4200年前或更早),很短时间内从远方涌来了一大批说藏缅语的族群,他们在迁徙或征服路途上遭遇到了苗瑶语族群或侗台语族群,此时的苗瑶语或侗台语族群已掌握了稻作农业技术,人口众多、文化发达,而远道而来的藏缅语族群此时也同样人口众多、文化发达,但是在局部地区出现了强大的苗瑶语或侗台语土著包围着一个又一个藏缅语移民孤岛的现象。也许是因为藏缅语族群军事力量更强大,也许是因为藏缅语族群人口更多或增长更快,在几个族群接触的广大地区出现了一种新的混合语,即以藏缅语词汇为代码、以苗瑶语或侗台语语法为结构的混合语,如同黄文所举的那几个例子那样,从而一种新的语言——华夏语或称原始汉语诞生了。

五、结论

从黄行先生介绍的几种混合语的例子,对比汉语在汉藏语系中核心词汇取藏缅语,语法特征取侗台语和苗瑶语的奇怪特征,我们认为原始汉语极有可能是一种混合语。对照分子人类学的研究成果,原始汉语很可能是强势的藏缅语族群在苗瑶、侗台语族群包围下短时间内形成的混合语,而不是苗瑶、侗台语族群通过克里奥尔化藏缅语形成的。

通宝推:桥上,
全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河