机器学习在SQL注入攻击检测中的应用

来源 :河南科技 | 被引量 : 0次 | 上传用户:hanyeliu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以结构化查询语言(SQL)为研究对象,利用词袋(Bo W)模型和词频-逆文档频率(TF-IDF)算法两种方法进行SQL语句向量化。文本向量化后,特征矩阵维数大大增加,很难在后面数据训练和预测中使用。为解决这个问题,对大量SQL注入攻击语句与用户正常输入的SQL语句进行研究分析,概括出28个特征关键词。同时,使用决策树、XGBoost和随机森林三个分类模型,对数据集进行模型训练及预测。实验结果表明:与词袋(Bo W)模型相比,词频-逆文档频率(TF-IDF)算法的准确率、召回率、F分数、精确率均提高了1
其他文献
在倡导高质量发展的时代背景下,我国专利申请数量连续8年位居世界首位,从量变到质变的突破是当前需要解决的首要问题,高价值专利的培育是供给侧改革下提升创新质量的现实需要。当前,有必要以我国高价值专利培育现实问题为导向,将战略生态管理理论作为理论基点,有效解决高价值专利的培育环境导向性问题、培育资源保障性问题以及培育主体交互性问题,并从技术创新的技术生态位向市场生态位跃进的全过程入手,构建涉及高价值专利培育全程的优化方案。