密码学的七道习题_作者:芥末君(10)

2017-01-02 芥末君

  绘楠在演糙纸上写下了上一篇密文里的歌词,又在其下写出了“青浦”的罗马字,并且重复了好几遍:“例如说,用青浦先生的'SEIHO'作为密钥的话,明文里'the'的t对应的密钥是‘青浦’的'S',那对应的密文就是t往后数18位,也就是L;而明文里'time'的t对应的密钥是‘青浦’的'H',对应的密文则是t往后数7位,也就是A。”

  The first time ever I saw your face.

  SEI HOSEI HOSE IHOS E IHO SEIH OSEI.

  LLM MWJWB AWEI MCSJ M AHK QSCY TSGM.

  我看看明文里两个t与它们对应的不同的密文L和A,再看看密文里并列的两个L与它们所对应的不同的明文t和h,只觉得头都大了:“知道密钥还好……没有密钥的qíng况下,真的可以破译吗?”

  “的确很难,毕竟是欧洲流传了很多年的加密方式,不会被太轻易地破译。但诀窍也不是没有,”绘楠一边讲解一边在明文后面加了几个单词,又写下对应的密文,“像这样,因为明文有重复的单词,重复间隔是10个字母,刚好是密钥长度的整数倍,密文就跟着重复了。”

  The first time ever I saw your face, oh your face.

  SEI HOSEI HOSE IHOS E IHO SEIH OSEI, HO SEIH OSEI.

  LLM MWJWB AWEI MCSJ M AHK QSCY TSGM, VV QSCY TSGM.

  绘楠指着密文里对应两个your的QSCY解释道:“虽然明文密文不是一一对应会导致同样密文对应不同的明文,就像密文开头两个L对应的是t和h两个不同的明文,但不太可能导致整个单词都重复。

  “随便计算一下,单字母因为巧合密文重复的概率是1/26,那两个字母的单词因为巧合重复的概率就只有1/626了,更长的单词重复则更加不可能。大致可以认为这样的重复间隔就是密钥长度的整数倍,接下来只要数出重复间隔,计算约数就可以得到可能的密钥长度。”

  我觉得有点头痛:“但是这样,不是要去数全篇相同单词出现的次数吗?而且也不一定会这么巧有重复的单词吧?”

  在正常的文本里我不介意做这种劳动,但是密文就好像一堆乱码,我实在没信心能正确无误地对比出所有单词;万一认真数完了却没有重复的单词,也很难知道是确实不存在还是数错了。

  “不需要青浦先生亲自来数,”绘楠像魔法师一样做了个摘下礼帽的动作,华丽地一鞠躬,“好不容易到我的主场,请青浦先生安心观赏我的演出。”

  说着叫我安心观赏,绘楠照样是把我扔去校对,自己去研究室把笔记本抱过来,开始敲敲打打。看在他勤奋编写破译算法的份上,我勉qiáng原谅他了。

  检索软体开始运行的时候,我非常认真地拜了拜电脑。绘楠被我的动静搞得哭笑不得:“又不是找不到就解密不了了……只要努力写出正确的算法、使用了足够的计算力就肯定可以解出来。这种事qíng都是数学上的必然。”

  我反驳道:“虽然没有重复的单词也有办法得到明文,为了减小计算量,快点得到结果,还是能找到重复的单词最好吧。”

  遇到绘楠之后我的运气向来不错,此前是好端端就会招惹到火灾的体质,现在去便利店居然能抽到想要的招待券了。不知道是不是这种体质使然,这次也很幸运地检索到了重复的六字母单词,之间的间隔虽然长达1070个字母,好在只有四个约数,由小到大分别是2、5、10和107。

  “接下来要做大量的检索计算,分别以2、5、10、107和1070做循环,”绘楠在演糙纸上写下这五个数字,做了一个斩断的手势,“把余数相同的密文字母合并,得到类似Affine加密方法的密文,在这里计算字母出现次数,就能解开暗文明文对应。”

  “因为单词是被密钥切开了进行加密,不能再使用以单词为单位的出现次数了啊……”我叹了口气,难怪昨天奋力计算了一早晨也没有得到结果。

  “按照世界范围英文文本里字母出现的规律,”绘楠在终端上打开了一个好像赛马竞技排名的页面,“可以知道最频繁使用的字母是'e',第二位是't',再之后是'a'。”

  我则是起身凑到绘楠的笔记本前,看他编写的检索软体输出的密文字母频率:“嗯……用10做循环和1070,余1的密文里,出现最多的是V,其次是X,再次是N;而用其他数字做循环的结果里,密文字母的频率差别没有很明显。”