论文部分内容阅读
伴随着计算机技术的迅猛发展,当前我们已经完全进入信息时代,甚至有人描述这是一个信息大爆炸的时代。随着越来越多的计算机用户接入互联网,网络也逐渐变的鱼龙混杂,各种各样的病毒、木马、欺诈信息藏匿其中随时伺机入侵、破坏。这样的境况使得人们迫切的需要有效的入侵防护。数据挖掘技术能够有效处理海量的网络数据,而且能够从未知特征的数据集中发现其中隐含的有价值的规律或特征,因此比较适合用于针对未知行为特征的入侵检测方法。蚁群聚类算法作为数据挖掘方法的一种,自1991年被提出后一直是学者们研究的重点。该算法的自适应性、并发性、鲁棒性使其较适用于处理复杂的大数据量数据集,将蚁群聚类算法用于入侵检测系统的数据训练,所得行为特征库与根据专家经验建立的专家系统相比更有利于对未知特征行为的检测。 本文对入侵检测技术,聚类分析,蚁群聚类算法进行分析介绍。对几种蚁群聚类算法的改进思想进行研究,提出一种基于划分的聚类算法和蚁群聚类算法的组合算法,将半径递归增大和强制放下机制引入传统信息熵蚁群聚类算法中,利用近似信息熵的概念来减少基于划分的聚类算法与信息熵蚁群聚类结合时的数据计算量,加快算法执行效率,并将其运用到入侵检测方法中,通过具体实验验证其用于入侵检测方法的可行性和有效性。该算法的主要优点是在保持聚类质量的前提下提高算法的聚类速度,引入半径递归增大机制,从而有效解决蚁群算法初期由于数据分布散乱而引起的聚类成堆缓慢及聚类后期容易形成分散的小堆聚类的现象;引入强制放下机制有效的避免了蚂蚁负载空跑现象;引入短期记忆记录强制放下前 N次的信息熵最小位置,达到有效利用资源的目的,从而提高聚类效率。另外在研究中发现当负载的蚂蚁移动至邻域内没有数据对象的位置时,基于信息熵的相似性判断会失效,因此增加一种在邻域内没有数据对象时的处理策略,改进聚类的效果。通过常用聚类实验数据集和入侵检测实验数据集的实验验证发现,在聚类分析方面本文组合算法较之改进前算法,执行时间和聚类效果都有改进,用于入侵检测方法也能取得较好的检测正确率。