论文部分内容阅读
随着网络信息技术的发展,关于信息化的现象数不胜数。在网络中,每天都会产生各种各样不同类型的数据,随之而来出现了各种类型的网络安全问题。在这种情况下,我们需要借助社会和法律的强大力量来对付利用计算机网络进行的犯罪活动。因此,网络取证技术应运而生,并得到迅速发展。它的核心要点是对网络中各种数据信息进行提取和分析。本文应用聚类方法对网络中的数据进行分析、处理,最后判断出网络中的正常行为和异常行为。本文首先研究了分析网络数据信息所应用到的一些重要方法,然后利用特征选择方法对网络中的数据进行预处理,以便降低后续聚类分析的复杂度,最后运用层次聚类方法分析网络数据信息。本文所做的工作主要可以归纳为以下三个方面:(1)研究特征选择方法,提出一种改进的基于最大近邻粗糙逼近的特征选择算法网络数据维数高、特征多的特点使得最优特征的选择尤为重要。基于最大近邻粗糙逼近的特征选择算法通过最大近邻确定样本的近邻类,可以直接处理混合型数据。但是由于该方法在计算属性重要度的时候只考虑了单个属性相对于决策结果的重要度,所以本文首先重新定义了评价标准,然后利用前向贪心搜索策略进行特征选择,最后选出最优特征子集。通过实验的结果,可以看出该方法选出的特征数量减少,而且在此基础上,也提高了分类性能。(2)针对层次聚类如何选取合适的合并点问题,提出一种基于蚁群优化的凝聚型层次聚类算法层次聚类算法一旦执行分裂类或合并类,就不能修正,这样就会产生低质量的聚类结果。为了获得高质量的聚类结果,本文算法首先利用蚁群优化算法中的状态转移规则选择凝聚型层次聚类算法中下一个将要被合并的数据点,然后利用信息素更新规则寻找聚类的最优路径。从实验结果看,本文算法的准确率比传统的聚类算法更高,效果更好。(3)设计了基于蚁群优化的凝聚型层次聚类的网络取证系统在分析网络数据的基础上,针对每个过程设计了相应的功能模块,并将改进的基于最大近邻粗糙逼近的特征选择算法和基于蚁群优化的凝聚型层次聚类算法应用于相应的模块中,最终实现了基于蚁群优化的凝聚型层次聚类的网络取证系统框架。该系统可以有效地分析网络数据,判断网络行为。