论文部分内容阅读
随着Internet技术和通信技术的迅猛发展,网络安全问题也变得日益突出。入侵检测技术作为一种主动的安全防护技术,有效地弥补了防火墙、数据加密等传统安全防护技术的缺陷,已经成为网络安全的一个重要研究领域。 由于数据挖掘技术能够从海量无规则数据集中挖掘出人们感兴趣的特定模式,减少数据处理量,所以专家们将数据挖掘技术引入到入侵检测的研究与开发中。聚类分析方法是数据挖掘中一种典型的无监督异常检测技术,可以在无标记的数据集上发现异常数据,提高入侵检测的效率,减少人工参与量,因此该方法逐渐发展成为一种重要的入侵检测技术。但是,当处理维度高、结构复杂、数据量庞大的数据集时,传统聚类算法的聚类效率非常低。为了提高聚类效率,并行聚类算法成为人们研究的热点。 本文将并行思想与传统聚类算法相结合,提出了一种基于k-means算法的并行聚类算法。该方法首先利用MPICH构建计算机集群系统,然后通过并行编程使集群中各节点主机并行处理数据集,达到高效聚类大规模数据集的目的。为了优化聚类结果,本文又提出了基于平方误差最小的重定位算法,并给出重定位的终止条件,从而提高了重定位效率。通过基于KDDCUP99数据集的实验测试,结果表明,本文算法不但比传统算法具有更高的聚类效率,而且能够更加有效地检测出已知和未知攻击。最后开发设计了一款基于本文算法的入侵检测仿真系统,该系统通过国家版权局认证,获得计算机软件著作权登记证书。