【摘 要】
:
互联网技术的快速发展在带给人们便利的同时也带来了很多网络安全威胁。如何准确高效地发现网络中存在的异常行为活动已成为网络安全领域中亟待解决的问题。数据挖掘是一种可以从大量数据中挖掘出符合事实规则的数据处理手段。聚类算法由于可以直接建立无监督的检测模型并发现异常数据,因此常常与异常检测技术相结合。特征选择通过消除异常数据中的复杂冗余干扰特征来避免维度灾难,达到提高异常检测速度和降低检测运算成本的目的。
论文部分内容阅读
互联网技术的快速发展在带给人们便利的同时也带来了很多网络安全威胁。如何准确高效地发现网络中存在的异常行为活动已成为网络安全领域中亟待解决的问题。数据挖掘是一种可以从大量数据中挖掘出符合事实规则的数据处理手段。聚类算法由于可以直接建立无监督的检测模型并发现异常数据,因此常常与异常检测技术相结合。特征选择通过消除异常数据中的复杂冗余干扰特征来避免维度灾难,达到提高异常检测速度和降低检测运算成本的目的。这使得特征选择算法在异常检测领域广泛应用。本文针对现阶段异常检测领域中存在的一些问题,提出了如下的异常检测算法:首先,在模糊C均值聚类(FCM)算法的基础上,创新地使用自适应蝙蝠算法对模糊C均值算法进行优化,在算法中加入分布熵和平均位距来自适应地调整传统蝙蝠算法的寻优能力。该算法有效地克服了模糊聚类算法对初始值敏感且易陷入局部最优的问题,能有效地对无监督数据进行聚类。其次,在传统的ReliefF特征选择算法的基础上,使用模糊熵改进的加权KNN算法指导ReliefF算法特征选择,充分考虑了数据间不同的特征对特征选择带来的影响。该算法能够选择出具有代表性的特征子集,有效地降低了网络流量数据的复杂度。最后,根据上述两个创新点构建出一种基于模糊聚类和特征选择的无监督异常检测系统模型。使用自适应蝙蝠算法优化的聚类算法对原始数据进行聚类标记并使用模糊熵加权ReliefF算法进行特征选择,最后使用极限学习机作为分类器进行异常检测。该系统模型能有效地克服传统异常检测方法对带标记数据集的依赖且时间复杂度较低。使用公开的KDDCup99和CICIDS2017数据集对异常检测算法及模型进行验证分析。表明本文提出的聚类算法、特征选择算法及异常检测模型可以兼顾高检测率和低时间复杂度,具有较高的实际应用价值。
其他文献
创设情境,逐步导入兴趣是最好的老师,为了调动学生的积极性,提高他们的兴奋点,在本课伊始就给学生创设了这样一个情境,如图1所示,在一个农场里,一群活泼可爱的小鸭子正摇头晃
物流管理作为供应链管理的一个主要组成部分,与传统的物流管理方法和意义不同。本文指出现代物流管理应成为一种供应链管理,供应链管理体系下的物流创新是现代企业发展的趋势
随着我国竞技体育职业化的发展,我国职业球队引入外援成为普遍现象,也由此引发了我国职业球队跨文化管理的问题。运用跨文化管理理论,对中西方文化的差异性以及由此造成的职
织物的表面结构和性质是影响喷墨印花颜色效果的重要因素。采用2种不同的纯棉织物,并用改性聚丙烯酰胺、石油加氢轻馏物、丙烯酸共聚物以及海藻酸钠分别对棉织物进行表面处理
钢琴艺术博大精深,黑白键蕴含了字宙所有的奥妙。仅仪从触键方法上看,就有说不完道不尽的学问。从宏观上看,钢琴触键方法,既是钢琴演奏技能,又是钢琴演奏风格,
在保证公路施工质量的前提下,为了达到对传统道路软基施工进一步加强的目的,根据当下科技的发展,土木合成建筑材料在公路软基处理中的应用是一个比较热门的话题,但要做到全面
基于生活实际的无机化学教学能有效挖掘出大量的无机化学材料,充实无机化学教学内容,能够有效地促进学生的无机化学素养全面发展,培养辩证唯物主义世界观。本文从环境污染问题、
演员要演好角色,需要准确地把握眼神的运用,是要用心去度,更要学会观察。结合自己平日的训练要素,才能塑造好一个人物形象,才能把人物演绎得活灵活现。
组成:黄芪30克,天花粉20克,干地黄30克,怀山药20克,女贞子20克,枸杞10克,三七6克,丹参6克,陈皮6克,生姜3片,大枣3枚。$$ 功能:补肾健脾、益气生津、滋阴清热。$$ 主治:消渴病。$$
宜城市是一个县级市,位于湖北省西北部,以汉水为界,分别从东部往西部呈平原、丘陵、山地变势,阶梯式延伸,面积2 115 km2,宜城版图呈"蝴蝶状",人口56.45万。现有职业危害因素涉