虽然也有特别的例外,比如1969年法国作家乔治&iddot;佩雷克写了一本二百页的小说《逃亡》,其中没有一个含有字母e的单词。而且翻译成英文后,居然也没有一个字母e。这的确算是一个奇迹。由于英文字母中最常见的字母完全没有出现,如果用这本书作为密码底本进行单字母替换加密,破译将会受到很大的阻碍。但是就普遍而言,写出的英语文章各字母的使用频率还是基本上能够与表1里的统计数据相符合的。从中可以看出,英文中e的普遍使用频数最高,相当于在一万个字母中,平均出现一千三百零四次,而z的使用频数最低,相当于在一万个字母中平均出现八次。另外,从单词的使用频率看,定冠词the的使用频率最高,其次是专有名词和it等代词,还有和on等前置词的使用频率也很高。从字母在单词中的分布来看,也有一些规律,字母y总使用频数的百分之九十都集中在单词的结尾,而w的百分之九十都集中在单词的开头,p和c在单词的开头多,在结尾少,r在单词的中间出现较多,j和q在缩略语以外的单词结尾不会出现,英文中仅有两个单词是由单字母组成的,就是a和i。此外还有很多类似的频率特征。
密码学家们还对日、俄、德、意、系、葡等语言的字母频数和使用频率进行过统计,也得出了类似的使用频率特征,制作出了相应的普遍使用频率表。
下面就是王玲统计出的这份密文中各个字母的频数:
表2
字母abcdefghijkl
频数55582412213874717011858
字母nopqrstuvwxyz
频数501412012231240808963
这份密文共有八百九十三个字母,因此很容易算出各个字母的使用频率。然后再进行明密比较。
但是,并不是说将密文字母简单地用与其频率相近的英文字母代替就可以的,因为在一般情况下,这些密文字母在密文中的使用频率是不会离开它们所代表的明文字母的频率太远的。从表1中可以看出,明文字母e,t,a,o,n,r,i,s,h可称为高频字母群,d,l,f,c,u,可称为中频字母群,g,y,p,w,b,v可称为低频字母群,k,x,j,q,z则是罕见字母群。而且从中频字母群到高频字母群,一般都有个明显的频率跳跃,高频字母群中频率最低的字母h为00528,中频字母群中频率最高的字母d只有00378。这种不同频率字母群之间的突变,在密文字母的频率统计中应该有对应的表现。将密文字母按频数从多到少排列,高频字母群与中频字母群的分界线看来应该在n和d之间:中频字母群与低频字母群的分界线大概是e和o之间,虽然中频字母群应该是六个,而现在只有五个。低频字母群与罕见字母群的分界线大概在和h之间,虽然低频字母群应该是六个,而现在是七个,于是就得出一个结论:中频字母群里少的一个字母很可能就是低频字母中多的这一个。
表3
yglwijbandvus
96878580717058555041402723
eofprkxhzctq
2214131212118843210
特别是字母y,很可能是代表最常用的字母e,密文高频字母群中最低的字母n可能是代表明文字母h。密文中剩下的h,z,c,t(密文中没有出现字母q)几个字母很可能就是代表明文中罕见字母群k,x,j,q,z,但是具体哪一个代表哪一个还不知道。
现在再利用第二个突破口‐‐语言的连接特征。在英语中,字母q后面除了连接省略号外,几乎百分之百地连接着字母u,这就是连接特征中的后连接方式。另外,有些字母,它们分别在前面几乎总是连接那么少数几个字母:x前面连接的普遍是i和e,极个别的情况下是o和a。还有一种间断连接方式,在e和e之间r的出现频率最高。
较高频密文字母连接次数分类统计表:
表4
y96g87l85w80i71j70b58a55n50d41v40
1y17y31y77y90y24y103y1010y723y18y94y14
3g70g08g215g93g95g177g810g126g02g13g7
7l12l81l113l63l211l201l64l1016l13l104l4
请勿开启浏览器阅读模式,否则将导致章节内容缺失及无法阅读下一章。
相邻推荐:极限对抗 黑暗塔系列03荒原 超级读者系统 他才是我 寻找善良 许你年年岁岁好 大汉民国 仙植灵府 不让女儿上桌?行,那就都别吃! 特工奇才沈之岳 艳鬼之结衣人间 开局双无敌天赋,竟然被称为废物 火山口上的大脑基地 黑暗塔系列02三张牌 战争指导 卡徒 文明 黑暗塔系列01枪侠 黑暗塔系列04巫师与玻璃球 地狱灵猫