五千年(敝帚自珍)

主题:【原创】汉语和英语的比较 -- 颜赤城

共:💬368 🌺1318 🌵2
全看分页树展 · 主题 跟帖
家园 简单地回答一下

如果ASCII码按部首编,怎么会乱码呢?

汉字部首的位置形形色色位置不同,可能超过256个,ASCII码的数量可能不够了。

ASCII码长采用8比特,可以安排2^8=256个熵值在4比特左右的西文拼音字母(英语26个,俄语34个,)和其它数字标点符号。而中文单字的熵值是9.6比特,ASCII码的8比特就根本不够用了,只能采用16比特的编码了。

16个比特的中文码系统和8个比特的ASCII码系统在计算机运算性能上应该有差别吧?

汉字字符编码比拼音文字编码复杂就是因为汉字的熵值是9.6比特而拼音文字的熵值是4比特。

全看分页树展 · 主题 跟帖


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河