基于数据挖掘的工业互联网入侵检测方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:sunplusit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术与现代工业生产逐步融合,网络在使生产制造更加智能高效的同时,也使工业互联网面临更多的安全威胁。因此,保护网络信息安全,及时发现和处理异常访问数据,对于保障工业互联网安全稳健地运行至关重要。入侵检测系统作为网络安全防御工具,能够快速检测和识别恶意入侵并做出应急响应。在基于数据挖掘的网络入侵检测中,入侵检测系统需要处理的数据以静态数据集或动态数据流的形式存在。面向静态数据集的入侵检测,极易因为数据冗余造成数据挖掘算法效果不佳,并且消耗大量计算和储存资源;面向动态数据流的入侵检测,因为观察样本有限,可能导致建立的数据挖掘模型不能很好地适应数据流的动态变化。基于上述问题,本文做出如下工作:1.论文基于经典决策树算法的基本概念、核心算法和实现过程,分析了在静态数据集和网络数据流环境下,决策树算法在设计原理、实现细节、和主要诉求上的联系与区别。2.针对面向静态数据集的入侵检测中数据冗余影响数据挖掘算法效果的问题,论文提出了一种基于树模型的数据约简方法。该方法作为一种数据预处理手段,结合子群发现技术对数据集进行数据筛选,减小数据集规模、合理划分数据集,从而减少后续数据挖掘算法的计算开销。多个数据集的实验结果表明,该方法能够有效削减数据集规模;结合决策树分类算法,KDDCUP1999入侵检测数据集的实验结果表明,经过数据约简后的数据集能够建立结构紧凑、体积更小的决策树,并且在保证分类准确率的基础上有效提升决策树分类的效率。3.针对面向动态数据流的入侵检测中利用有限样本建立的数据挖掘模型不能充分适应数据变化的问题,论文改进并提出了一种基于概率估计的快速决策树分类算法。该算法以快速决策树模型(Very Fast Decision Tree,VFDT)为基本框架,结合拉普拉斯平滑和威尔逊区间均值估计两种概率修正方法,对属性测试条件做出调整以选择最佳分裂属性。NSL-KDD入侵检测数据集的实验结果表明,改进算法能够获得结构紧凑、体积更小的快速决策树模型,并且在保证模型对数据流的预测能力的同时提高了模型对数据流演变的适应性。
其他文献
世界各国的社区服务组织存在着多种组织形式,这些组织随着整个医疗服务市场结构的变化,也会相应地做出变化和调整.从经济学角度看,这些变化和调整都是为了降低交易费用所做出
在数字化时代的今天,高校数字资源建设至关重要。体现本地、本校乃至本馆特色的自建数据库既是提升高校影响力的途径,又是服务各项需要的重要门户。通过对高校特色数据库文献进
<正> 几个月前,刚刚来到广州的记者在与广州的朋友聊天,谈到广州与内地城市的不同这个话题时,就有朋友说到广东省中医院是广州的一个特色。据记者所知,内地的中医院一般都比
当前高校“文献检索”课程存在着领导不重视、师资力量不强、教材内容更新严重滞后、教学模式陈旧落后,学生学习兴趣不浓、理论和实践结合不够紧密等问题。针对存在的问题,提出
苏丹Muglad盆地是在中非剪切带右行走滑背景上发育起来的中-新生代陆内裂谷盆地.盆地的主力产层为下白垩统的Bentiu组,上覆的区域盖层是Darfur群,尤其是Aradeiba组的大套泥岩
实施中西医结合整体护理的根本目的是提高护理质量,最大限度地满足病人的护理服务需求.笔者所在医院围绕病人的护理需求,根据本医院的实际情况和实际条件,创建符合本单位具体
九十年代以后,在经济理论界开始出现并使用核心竞争力这一名词.我国医院进入市场以后,大家都参与了市场竞争,核心竞争力也成为医院经营管理关注的一个词汇.但究竞怎么样去理
任何一所医院都是置身于错综复杂的内外环境之中,医院内外环境的发展变化有的为医院的发展提供了机会,而有的则构成了威胁.因此,医院的营销人员必须密切关注国家市场营销环境