基于朴素贝叶斯和LSTM循环神经网络的SQL注入检测技术研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:wyslymx2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web2.0时代,Web应用程序已经渗透到每一个网民的生活中,但其伴随的安全问题也越来越多,如果Web应用产生安全漏洞,就会直接威胁到用户的隐私数据、财产安全等重要方面。在众多Web安全漏洞中,SQL注入(Structured Query Language Injection)漏洞攻击是最受攻击者青睐的攻击手段之一,同时也是威胁程度最高的漏洞之一。因此,如何实时、准确地检测到SQL注入攻击,这对于Web安全领域的研究与发展有着非常重要的意义。针对这一问题,本文分别基于机器学习中的朴素贝叶斯(Naive Bayes)分类模型及深度学习中的长短时记忆循环神经网络模型(Long Short-Term Memory-Recurrent Neural Network,LSTM-RNN)对 SQL注入进行检测并分类,分类的结果分为SQL注入与Non-SQL注入类别。本文的主要工作如下:对机器学习的基本方法进行研究,改进了对输入样本的预处理与词法分析过程,并提出一种基于特征向量长度的去噪声方法。对于用户可能输入的字符序列,将特殊字符分离法与空格分离法相结合来提取特征,并对提取的特征在标记(Token)化过程进行原子化处理,使其最小的字符单元也具备特定意义的Token。经特征提取与词法分析后,生成特定顺序Token的特征向量,并过滤掉那些特征向量长度小于去噪阈值的样本,然后用Naive Bayes模型进行机器学习训练对其评估与分类。实验结果表明,改进后的检测方案对于数据集预先给定了样本类别的情况下具有较好的分类效果,可以对SQL注入实行有效的检测。对循环神经网络及长短时记忆单元深入研究,在基于Keras框架与TensorFlow的基础上,提出了一种基于LSTM-RNN模型的SQL注入检测方案。在预处理阶段,对给定的数据集样本通过Word2vec生成词向量模型;在训练阶段,通过将生成的词向量模型与LSTM-RNN作为输入,训练得到LSTM-RNN分类器;在测试阶段,通过将词向量模型与LSTM-RNN分类器作为输入,并通过Softmax分类器得到测试样本的分类结果。最后通过实验证明了模型检测的稳定性与较高的准确率。
其他文献
<正> 异型钢筘的箱片形状特殊,与平箱片完全不同,用常规的维修方法已不能适应生产的需要。为此,我们摸索出一套异型钢筘的清洁与维修方法,解决了生产之急,现将清洁和维修方法
创新人才培养模式是提高高等教育质量的一种诉求,而毕业论文又是高校人才培养的重要教学环节,其中论文选题又是毕业论文成败的关键。针对当前研究生论文选题中存在着"大而空"
全球化时代的历史目标是人的世界的文明进步及其持续发展。由此,本文从文化哲学视野提出“重新理解文化”的方法论问题。文章批判地考察西方哲学史上在实践理论取向方面具有
银杏属仁杏科、银杏属,又名公孙树,是果树中寿命最长的树种,素有活化石之称,为中国所特有。银杏树的种植方法主要有播种育苗、萌蘖繁殖育苗、嫁接繁殖、苗木移植、扦插育苗等
基于对传统的柔性机械手的研究,模仿象鼻抓取物体的过程,以形状记忆合金丝为驱动材料,研制了一种仿象鼻柔性机械手.建立了柔性机械手的力学模型,设计了控制部分电路,并进行性
运用文献综述、专家访谈、逻辑分析等方法,对几十年来田径竞赛规则的演变与田径运动的发展之间的关系进行分析。认为田径竞赛规则的演变促进了田径技术的完善、公平竞赛环境
目的 :探讨用三阶梯检查法诊断宫颈病变的临床意义。方法 :对2010年1月~2012年1月期间在我院进行宫颈病变检查的1064例患者的临床资料进行回顾性研究。我们首先对这1064例患
本文旨在分析丹.布朗的小说不同于传统的悬疑小说之处,指出丹.布朗的小说是具有严肃主题的悬疑小说,在破解悬案的同时又弱化"善"与"恶"的二元对立,表达了对文化社会问题的忧