五千年(敝帚自珍)

主题:【原创】被征服的谜――ENIGMA的故事(一) -- 1001n

共:💬14 🌺64
全看分页树展 · 主题 跟帖
疑问
家园 试验回答

的确,那个单子是英文字母在英文文献中出现的频率。对待法文,德文,甚至俄文等等,连字母都不一样了,当然要结合该语种的文献另外统计频率表了:)

关于中文,确实是个很有意思的问题。由于密码学的发展主要确实在西方(唉。。),我能看到的披露的研究密码的文献,一般的重点也在英文等语种上。

对于中文如何密码化,我确实所知甚少,只好猜测一下了。个人觉得,中文较之拼音化语言,在编码上有个先天的麻烦,也是个先天的优势,那就是:拼音化文字常常只有二三十个字母,如:

英语26个字母;

丹麦语29个字母;

希伯莱语21个字母;

阿拉伯语28个字母;

越南语30个字母;

西班牙语27个字母;

即便是最麻烦的日语假名,也只有79个字母。

但中文是非拼音化语言,光GB2312里规定的一级常用汉字就有3755个,到GB18030就发展为27533个汉字,考虑到康熙字典,更是收录了47035个汉字……

有时候我在想,这么多的汉字,其实本身就是一种非常优异的编码。只是,谁也不可能造出一个有着成千上万按键的键盘来输入中文,在计算机时代,这个缺陷就一票否决了原样不动的汉字录入方案。

而对汉字进行编码,无论是区位也好,拼音也好,实际上都是把关联不大的汉字活活地给装在由数字或者字母构成的笼子里。这样,汉字可以用普通键盘输入了,代价就是丧失了汉字的感官上的、构成上的、相近相异方面上的所有特性。

但不这样,似乎也没有更好的办法……

而数字化或字母化之后,中文就跟别的语言没有什么区别了,能编码加密了,自然也能解码解密了。

话说回来,现代的加密技术早已经突飞猛进到了很高的水准。我以前几篇文章所写的内容,其实在密码学上,都被称为古典密码。呵呵,够老土的吧?

而winzip用的128位加密,其实已经不是古典加密的范畴了,而此密钥非彼密钥,这个问题容我有时间慢慢写来:)

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河