五千年(敝帚自珍)

主题:部尾字典:写在前面 上 -- 桥上

共:💬50 🌺95
全看分页树展 · 主题
家园 部尾字典:写在前面 上

部首检字是各种汉字字典中最常见的检字手段,大部分字典都采用部首排列,但是有时部首以外的部分也值得我们关注,因此我就搞了这么一个“常见汉字形声字声符检字表”,与“部首”相对,称之为“部尾字典”。(倪海曙先生曾经编著出版了《现代汉字形声字字汇》,语文出版社1982年,网上可读到:http://book.chaoxing.com/ebook/read_10529204.html,107页起为声符按汉语拼音序排列之形声字表)。我这个表比倪先生更多强调了各声符间的联系。

汉字是几乎仅存的象形文字,但是其实象形也是有限的,人不可能记住太多象形符号,尤其是不可能大家都记住太多对于多数人都“形象相同而且意思一致的象形符号”,因此尽管汉字有几十万,实际可以有上百万,但是其实是由几百个独立的象形符号组合出来的(原认为有近千个,承河友夏商楚歌指点,读了些书,发现已有人研究总结,大约在四百左右)。

我觉得对于这些独立的象形符号,以及这些象形符号的源流和变化,还强调得不太够。按我的想法,字典应该对于任何字都标注出其各个组成部分(即组成这个字的各个独立的象形符号)及其源流。现在已经见有利用字的各个组成部分进行检索的(http://www.zdic.net/sousuo/ids/),但似乎不太普遍,尤其是计算机打字还不能打出所有这些独立的象形符号。我把这个检字表贴上来也是希望能为从这个角度审视汉字提供一些方便。

在这个部尾字典里所收的字都是所谓形声字,据说汉字有“六书”,就是六种造字方法,其中造出的字最多的方法就是“形声”,大概百分之九十以上的汉字都是用这个法子造出来的形声字。不过形声字也有两种:

一种是“真”的形声字,就是一个部首加一个声符,字的意义主要来自部首,而字的读音则来自声符。这种形声字也在六书里还有一个前辈,就是假借字:

古人其实没画出那么多字,有些意思实在画不出来,画了别人也不一定认识,你画的时候是一个样,我画的时候又会画出另一个样,大家不容易有共识,只好借用已有的、大家已经认识的、读音与当时语言中要表达的意思相近的画(象形符号、字),表达那个不容易画出来的意思,这就出来了假借字。

例如“是不是”的“不”字,就是假借字,其形象本是花萼,其意义当然也是“花萼”。但现在的“不”常用的这种“否定”的意义很难用图画表示,只好借用在当时的语言中与这个音相近的“不”(花萼)来表示这个“否定”的意义,久而久之,甚至这个“否定”的意思反而成了“不”的主要的意思,用于表示花萼的“不”反而被另外发明出来的形声字“柎”所代替。

再例如霸主的“霸”字,也是假借字,本来这个意思用的是“伯”字:“伯”字的霸主的“霸”这个意思是从“伯”字的本来意义衍生出来的,但“霸”这个意思用得越来越多,与“伯”字的本义也渐行渐远,读音恐怕也不同了,于是就借了在当时语言中与这个读音相近的“霸”来表示霸主的意义,以与“伯”字的原有意思相区分。

要是后来,就会造出形声字了:用一个已有的、在当时语言中的读音与想要发出的音相似的字(大体相当于假借字)作声符,再找一个大体能覆盖相应意思的部首,就造出一个新字了,就像上面的“柎”字。这种形声字就是现在最主要的造新字的途径:例如鲁迅先生造出的“猹”字,沈从文先生造出的“点看全图

外链图片需谨慎,可能会被源头改
”字(《生之记录》),都是这样。

再一种形声字是所谓孳乳字,就是一个原初的字衍生出了各种不太一样的意思,于是为了加以区别,就给这个字加了各种有分类功能的部首,造出几个新字(李国英先生论述部首职在分类,就说起李约瑟先生曾设想由汉字取代拉丁文用于生物分类,正是看中了部首的分类功能,见《小篆形声字研究第三章 小篆形声字的构件功能第二节 义符的功能二 义符的类化功能》 李国英 北京师范大学出版社 1996 p 044)。我曾经提到的、由“豊”字分化出的“禮(礼)”字和“醴”字应该就是孳乳字。

因此,孳乳字的声符并不是单纯的声符,也包含了这个字的意义,甚至是更直接的意义,而其部首反而只表示分类的意义。

部尾字典共涉及743+60=803个原形声符(某一用为声符的字符会产生很多变形,我从中选取一种作为这个声符各种变形的代表,称之为原形声符),但有不少原形声符的变形会变得面目全非,考虑各种因素,我引入其中一些原形声符的变形,与大部分原形声符一起,共分立了1054个声符,按笔画排列。

部尾字典共涉及2097个原形和变形声符,在每个分立的声符处都注明了与其有关的原形声符和另外一些各种各样与包含此声符的形声字有关的变形声符。

在每个分立声符之下列出了与其有关的形声字,按汉语拼音序排列,每一读音(不计声调)为一组。在每个分立声符之下还另外附上了一部分“含此形非此声符”的字,这样就基本集齐了含此形字符的字。

每个(分立的)形声字后面是其汉语拼音注音,在这个注音后面,我还在各种括号中分别附上了该字的一些其他读音以及该字的一些异体字,个别地方还有简单的注释。

把每个原形声符(包括与之相关的变形声符)所发的不同的音(不考虑声调)加起来共有2971个不同的音,平均每个原形声符可以发三个半多不同的音。

为了便于操作和检索,在每个声符后面我加了不同的标记如下:

1、所有声符之后我加了个七位的数字,前两位是其笔画数,后五位是其头五笔笔画的代号:横、竖、撇、点、折分别为1、2、3、4、5;

2、原形声符共803个,我都在其后加了“!”,其中同时还为分立声符的743个;

3、原形声符中没有直接以其为声符的字的(即不是分立声符的),共60个,我在“!”后面又加了“)”,成为“!)”;

4、虽非原形声符,但我将其分立出来的声符,共311个,我在其后加了“~”;

5、还有那些既非原形声符也没有分立的声符,其后只有上述那个七位数字。

部尾字典中共收入了9022字(由于有多音字,分立的字为9996个;除用为叹词的字之外,读音最多的字是“和”,共有hé、hè、hú、huó、huò五个读音),实际我基本上是按某一版新华字典的收字范围选的字:个别字实在打不出来,而且我觉得影响不大,就放弃了;另外有些字尽管打不出来,但我觉得有意义,尽管麻烦,但我还是坚持用变通的方式(图形以及在方括号[]内描述的方式)将其表示出来;还有些字我觉得增加了某一声符的发音范围,或比较有意思,也加了进来。

部尾字典所收的字包括约两千异体字,如果不算这些异体字,部尾字典收了大约八千字左右,大体上每个原形声符(以及由其代表的所有变形声符)平均对应十个字左右,每个不同的声符平均对应四个字左右。

当然不同的声符也有不同的特点:

有的声符(这里说的是原形声符)用得很普遍,如“丂”,有59字以之为声符,如“匕”,有62字以之为声符,如“厶”,有68字以之为声符,如“古”,有74字以之为声符,如“向”,有67字以之为声符,如“隹”,有76字以之为声符。

有的声符(自此处及以下说的不都是原形声符)则用得很少,只有一个字以之为声符,如“点看全图

外链图片需谨慎,可能会被源头改
[鸨左半]”,以之为声符的只有“鸨”;如“点看全图
外链图片需谨慎,可能会被源头改
[臼底断开](不是臼字)”,以之为声符的只有“裒”;如“点看全图
外链图片需谨慎,可能会被源头改
[上彑中两丿下巾]”,以之为声符的只有“肄”;如“点看全图
外链图片需谨慎,可能会被源头改
[聿左下加彡]”,以之为声符的只有“津”;如“点看全图
外链图片需谨慎,可能会被源头改
[斲左半]”,以之为声符的只有“斲”;如“点看全图
外链图片需谨慎,可能会被源头改
[壑上半]”,以之为声符的只有“壑”;如“豙”,以之为声符的只有“毅”;如“夒”,以之为声符的只有“巎”;还有“点看全图
外链图片需谨慎,可能会被源头改
[鬱上臼断开中加缶换林中加缶]”,以之为声符的只有“鬱”。

也有很多声符虽说是有两个字以之为声符,但其中一个就是其本身,例如“上”和“让”,“仄”和“昃”,“匹”和“苉”,“瓦”和“佤”,“兮”和“盻”,“凹”和“垇”,“囚”和“泅”,“耒”和“诔”,“丢”和“铥”,“色”和“铯”,“好”和“薅”,“巫”和“诬”,“灵”和“棂”,“尿”和“脲”,“沓”和“踏”,“阜”和“埠”,“肩”和“掮”,“巷”和“港”,“茶”和“搽”,“衍”和“愆”,“亮”和“喨”,“美”和“镁”,“突”和“葖”,“陟”和“骘”,“蔺”和“躏”,“索”和“嗦”,“圂”和“溷”,“拿”和“镎”,“旅”和“膂”,“舂”和“樁”,“雪”和“鳕”,“豚”和“遯”,“寇”和“蔻”,“款”和“窾”,“葬”和“髒”,“粟”和“僳”,“量”和“糧”,“粥”和“鬻”,“筮”和“噬”,“皛”和“藠”,“薦”和“韉”,等等。

或者有些声符虽有两三个字以之为声符,但都是异体字而已,如“彝”和“彜”,“届”和“屆”,“辄”和“輙”,“慭”和“憖”,“德”和“惪”,“袭”和“襲”,“升”、“昇”和“陞”,“关”、“關”和“関”,“飙”、“飇”和“飈”,“蕊”、“蕋”和“蘂”,等等。

也有的声符很专一,以之为声符的字尽管有好几个,但都发一个音,甚至连声调都一样,如“宁(zhù)”,涉及9个字,发音都是“zhù”;如“式”,涉及5个字,发音都是“shì”;如“休”,涉及7个字,发音都是“xiū”;如“奂”,涉及7个字,发音都是“huàn”;如“具”,涉及5个字,发音都是“jù”;如“咢”,涉及10个字,发音都是“è”;如“段”,涉及6个字,发音都是“duàn”;如“衮”,涉及5个字,发音都是“gǔn”;如“唐”,涉及10个字,发音都是“táng”;如“斯”,涉及7个字,发音都是“sī”;如“虜”,涉及6个字,发音都是“lǔ”;如“絲”,涉及6个字,发音都是“sī”;如“質”,涉及6个字,发音都是“zhì”;如“廛”,涉及6个字,发音都是“chán”。

反之,也有的声符就很多变,会发很多音:如“工”,有“gan”、“gang”、“gong”、“hong”、“jiang”、“kang”、“kong”、“qiang”、“qiong”、“xiang”、“zhuang”共十一个不同发音,涉及38字;如“勺”,有“bao”、“de”、“di”、“diao”、“liao”、“que”、“shao”、“shuo”、“yao”、“yo”、“yue”、“zhuo”共十二个不同发音,涉及14字;如“也”,有“chi”、“de”、“di”、“duo”、“she”、“shi”、“ta”、“tan”、“tuo”、“xie”、“ye”、“yi”共十二个不同发音,涉及23字;如“白”,有“ba”、“bai”、“bi”、“bo”、“mo”、“pa”、“pai”、“po”、“shi”、“ti”、“tuo”共十一个不同发音,涉及30字;如“点看全图

外链图片需谨慎,可能会被源头改
[契上半]”,有“chi”、“jia”、“jie”、“nie”、“qi”、“qia”、“qie”、“xi”、“xie”、“ya”、“zhi”共十一个不同发音,涉及22字;如“圭”,有“ai”、“gua”、“gui”、“hui”、“jia”、“jie”、“kui、“qi”、“sui”、“wa”、“xie”以及“ya”共十二个不同发音,涉及35字;而“各”竟有“e”、“ge”、“hao”、“he”、“ka”、“ke”、“la”、“lao”、“le”、“liao”、“lo”、“lou”、“lu”、“lue”、“luo”、“qia”共十六个不同的发音,涉及39字;还有“者”,有“che”、“chu”、“dou”、“du”、“she”、“shu”、“tu”、“xu”、“zhe”、“zhu”、“zhuo”共十一个不同发音,涉及38字;而“隹”甚至有“chuai”、“chui”、“chuo”、“cui”、“di”、“dui”、“huai”、“huan”、“hui”、“jiao”、“jin”、“kai”、“qiao”、“shei”、“shou”、“shuang”、“shui”、“sui”、“sun”、“ti”、“tiao”、“tui”、“wei”、“yao”、“ying”、“yue”、“zhai”、“zhan”、“zhao”、“zhi”、“zhui”、“zhun”、“zhuo”共三十三个不同的发音,涉及77字;另如“曷”,有“ai”、“e”、“ga”、“ge”、“he”、“ji”、“jie”、“ka”、“ke”、“qie”、“xie”、“ye”共十二个不同发音,涉及25字。

通宝推:慧诚,foureyes,icedshining,马尔他之鹰,方恨少,mezhan,史文恭,铁手,芷蘅,牛栏山二锅头,老虎五,

本帖一共被 1 帖 引用 (帖内工具实现)
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河