论文部分内容阅读
用户名-密码是当前最主要的身份认证机制,并且在未来很长一段时间内都将存在。通常情况下,用户在设置密码时,倾向于选择符合记忆规律和语言表达习惯的密码,但这些密码往往存在安全强度不够的问题,因此,密码安全性问题一直是一个热门研究领域。 利用不同的密码猜测技术来破解密码集是研究密码安全性的主要方法。现有的密码猜测技术主要有暴力破解、JTR和HashCat、概率上下文无关法、马尔科夫模型等,其中概率上下文无关法和马尔科夫模型取得的密码猜测效果较好。概率上下文无关法是一种基于模板的密码模型,即先计算出模板结构概率,再对模板结构具体化得出密码,该方法的局限性在于部分模板结构片段需通过枚举的方式确定。马尔科夫模型通过计算字符状态转移概率,从而确定密码整体概率,该方法的缺点在于模型阶数不容易确定、高阶模型容易过拟合,难以训练。 针对上述问题,本文研究基于递归神经网络的密码猜测方法。通过在泄露的真实密码数据集上进行训练,基于递归神经网络的密码猜测模型能够自动学习到密码数据集中的分布特征和字符规律,并生成大量接近训练数据特征的有效密码,达到扩充密码字典容量、提高密码猜测效果的目的。本文的主要创新性工作如下: (1)提出了一种基于递归神经网络的密码猜测模型PG-RNN,实验结果表明PG-RNN模型在密码长度分布、密码字符结构等评价指标上,表现优于马尔科夫模型和概率上下文无关法;模型复杂度低于基于生成对抗网络密码猜测模型,且在测试集上的命中率更高。 (2)提出了基于其他递归神经网络结构:长短时记忆(LSTM)、门递归单元(GRU)、网络结构搜索单元(NAS)的密码猜测优化模型,比较了RNN、LSTM、GRU、NAS在密码猜测问题上的效能差异,实验结果验证了不同网络结构在密码猜测上的有效性。最后,针对密码猜测问题,本文给出了搭建不同网络结构模型的有效参数设置。