五千年(敝帚自珍)

主题:【原创】汉语和英语的比较 -- 颜赤城

共:💬368 🌺1318 🌵2
分页树展主题 · 全看首页 上页
/ 25
下页 末页
    • 家园 八、姓名,和一个数学猜想

      抛却美学价值不谈,姓名在功能性上最该避免的重名。但是汉语和英语都用重名的问题。

      汉语和英语在姓名上最明显的区别就是,汉语姓氏在名字前面,英语姓氏在名字后面。(英语里也有先姓后名的写法,中间以逗号隔开。)另外,中国重姓多,外国重名多。

      我想大概每个人都认识几个相同名字的人。中国的几个大姓人口众多,如果取常见的单字名字,这辈子就等着遇见重名的吧。

      避免重名的唯一办法就是加长音节。

      外国人名字长。我还没遇到过姓名完全重复的两个人。但是长代码的缺点是不方便,日常生活中没有人会把一个人的姓名完全念出来,因为实在太长了。英语里称呼一个人,在正式场合用姓,在非正式场合用名字。姓名全念,那是奥斯卡在颁奖呢。

      但是英语的名字和中国的习惯不同。中国人是起名字,所有汉字都可以用作名字,甚至古代还造字做名字,比如武则天的日月当空。但是西方是选名字——常见的大概有几百个名字让你选择。(完全生造一个名字的情况确实有,但非常少。)这样选来选去重名的可能就很大,你身边很可能有好几个Alex, Mike, Mark。那么区分的办法也只有增加代码长度,一般习惯是把姓的第一个字母加进来。

      所以效率和精确是两个相抵触的标准。如果你要代码短,就会含糊;你要代码长,成本就增高。这里面实在没有什么回旋的余地。就好像用两位十进制数字写不出101个数字一样。我在前面有一处提到“混淆或者不便”,中间这个“或者”不是随便说的。所有“混淆”,都能以“不便”的代价来解决。这在语言里很明显。

      如果要我对英语提建议,我会建议他们开始造新名字。但是咱们还是针对中国的问题谈。其实也都是稀疏平常的建议。

      关于名字,就是起名字不要用常用字;尽量用两个字而不是单字做名字。一旦用两个字,除了固定搭配,重名的概率就大大降低了。

      姓氏和名字不同,有人类社会传统的因素在,这是个血统问题。大多数人要求孩子沿用自己的姓氏。所以姓氏只会越来越少,不可能增加。但是中国还有个习惯,把父母双方的姓氏合起来作为孩子的复姓。具体这个习惯的来龙去脉我不清楚,但是看上去非常有益并且容易被人接受。我可以想象很多现有的单姓能组合成很好的复姓。一旦使用复姓,名字就可以到四个汉字,几乎不可能重复了。这上面,政府还是要做些宣传和引导。

      最后提一个数学猜想。

      中国的几个大姓可以有上千万甚至近一亿的人口。这是国外没有的情况。在国外报道中国的时候,如果同一篇文章出现两个同姓的人,会在后面作注释(no relation非亲属关系),比如知名度很高的张艺谋和章子怡。这种注释对于中国读者就多此一举了。

      为什么大姓可以发展到这种地步呢?我猜想除了社会原因,里面会不会有数学上的道理呢?

      假设初始状态,一个人口为大数N,男女各半,每人姓氏不同,也就是N个姓氏。这不是个合理的假设,但不影响我们的计算。这些人自由结合,产生0到n(n有上限)个后代,男性后代和女性后代的概率相同。所有后代跟随父亲的姓氏。

      显然,在一代人之后,就会有多于一半的姓氏消亡了。随后姓氏消亡的速度会慢下来。

      那么最后是什么结果呢?人类的姓氏无限趋近于一个一统天下的姓氏呢?还是在某个地方平衡下来呢?中国的大姓的高人口比例和历史长度、人口规模相关吗?

      有没有数学大拿演算一下?或者编个程序模拟一下。这个程序应该很简单的。

      元宝推荐:爱莲,
      • 家园 恢复取“字”就行了
      • 家园 关于你说的数学问题

        在概率论里管它叫Branching process, 或Galton-Watson process。Galton在十九世纪研究是否贵族的姓氏比普通姓氏消失得快时,最早研究这个随机过程的。你说的问题的答案取决于每个男性的儿子的平均数量。如果这个数小于等于1,那么所有人类也就是姓氏最终都消失的概率等于1。如果这个数大于1,那么什么结果都可能发生。不能使用大数定律来决定每种姓氏在人口中的比例。也不存在什么平衡。当然随着时间的推移,很有可能会有姓氏消失,但是所有姓氏都不消失的概率大于零。

分页树展主题 · 全看首页 上页
/ 25
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河