基于随机森林的数据库入侵检测研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:wwtmw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库是信息系统中极易被攻击的一个环节,其安全问题备受关注。入侵检测是安全技术的重要方法之一,也是数据库安全机制的组成部分。入侵检测的本质是分类,因此分类算法对入侵检测系统起着至关重要的作用。随机森林具有集成学习理论、高效数据处理能力和参数设置简单等优点。本文对随机森林算法在数据库入侵检测中的应用进行研究。本文介绍了数据库安防和入侵检测的相关内容,研究了数据库的常见攻击手段以及数据库入侵检测的主要技术,分析了决策树、梯度提升决策树和随机森林的三种分类算法应用于数据库入侵检测中的优缺点。针对随机森林算法元分类器精度不足的问题,本文给出了以梯度提升决策树作为元分类器的随机森林数据库入侵检测算法。在提升分类精度的同时,改进算法中对原始数据集进行的重采样处理,可以降低噪声数据的关联性,而其中的随机投票机制还可以从一定程度上过滤掉单个元分类器出现过拟合的情况,降低了整体模型出现过拟合的可能性。此外,针对单棵梯度提升决策树在数据库入侵检测应用中容易出现过拟合的问题,本文给出了通过相关参数,控制树的深度,进行剪枝操作,降低模型的复杂度的改进方案。为了验证改进算法的性能,本文选择了9组UCI公有数据集进行了基础分类能力测试和KDDCUP99数据集进行入侵专项测试,并设置了经典梯度提升决策树算法和经典随机森林算法作为对照组进行算法实验。实验结果证明了本文给出的基于梯度提升的随机森林数据库入侵检测算法的有效性。最后,本文设计并实现了包含数据采集模块、数据预处理模块、入侵检测单元和警报响应模块四个部分的数据库入侵检测系统,并对各个模块进行了详细说明。
其他文献
随着我国废旧电器数量的增加,废弃的印刷线路板(废PCB)也在急剧增加。废弃PCB中含有大量的贵金属,可以被回收利用;同时,又含有多种重金属和有毒有害物质,处理不当会严重污染
目的建立下颌第一磨牙残根分裂桩冠修复的三维有限元模型,分析不同粘接剂粘接时残根应力分布特点,从而得到在不同情况下与分裂桩冠修复相匹配的最佳粘接剂。方法选取健康的下
维特根斯坦和海德格尔开创的语言哲学,最大的贡献就在于它改变了人们对语言所抱的传统看法.语言的存在被视为二元性存在:首先,语言是人类生存的重要基础;同时"像一枚硬币一样
盐城滨海湿地作为江苏省重要的自然湿地之一,是我国面积最大、生态类型最齐全的典型淤泥质潮滩。本研究选取盐城国家级珍禽自然保护区核心区作为实验区域,采用野外定位观测和
中枢神经系统神经损伤后再生困难主要由内在再生能力低下和外部抑制性环境所致。微小RNA(micro RNA,mi RNA)是神经元内调控轴突生长能力的重要因子,也可以通过调节外部再生抑制
目的观察康复护理在中风病恢复期对偏瘫肢体功能恢复的效果。方法选取我院近期中风恢复期偏瘫患者122例,随机分为实验组和对照组各61例,对照组给予常规的护理,实验组在常规护
随着知识经济时代的到来,专利是促进企业发展的一个极其重要的知识源泉。日益加剧的市场竞争态势召唤着直接服务于产品创新的高效率专利知识获取及其支持产品创新设计的方法
<正> 麻黄附子细辛汤,出自《伤寒论·少阴病脉证并治》。原方由:麻黄二两(去节)细辛二两、附子一枚(炮,去皮,破八片)组成。该方配伍严谨,用药精当。无论外感或杂证用之得法,
<正> 久泄不止案“伤寒脉微而厥,至七八日肤冷……蛔厥者,乌梅丸主之。又主久利”。此为《伤寒论》338条明文所载。乌梅丸为蛔厥证之主方。但不为蛔厥证所独用,能主久利,利多
信息技术的飞速发展给教育行业带来了前所未有的影响,职前地理教师作为未来教师的后备力量,更需要更新自身知识结构以应对教育信息化浪潮。美国密西根州立大学的Koehler和Mis