论文部分内容阅读
在飞速发展的互联网时代,网络数据量急剧增加,网络的开放性和虚拟性为不法犯罪分子提供了机会,如何在海量数据中准确地发现非法数据已成为急需解决的问题,因此网络取证应时而生,并得到了快速发展。在取证过程中主要涉及证据生成即基本概率指派(BPA)的生成和证据融合两步,其中存在信息量大、BPA如何生成以及融合精度低的问题。针对信息量大的问题,本文首先提出了一种基于类贡献度和特征加权的KNN方法进行预处理以减少数据量,针对后两个问题分别提出了基于核密度估计(KDE)的基本概率指派生成方法确定BPA以及基于共信度的D-S组合方法提高融合精度。本文主要内容如下:(1)提出了一种基于特征加权和类贡献度的KNN方法针对KNN算法易受近邻点选择和类别判定规则影响的问题,提出了基于特征加权和类贡献度改进的DCT-KNN算法,通过有无某特征时的准确率计算该特征的权重,在此基础上利用加权距离以及各类别近邻点等确定类贡献度,实现对原始KNN算法的改进,实验表明了本方法的有效性。(2)提出了一种基于核密度估计的基本概率指派生成方法基本概率指派的生成是D-S理论应用的重要环节,至今仍未有通用的解决方法,针对该问题提出利用核密度估计来生成BPA的方法:利用训练数据构建基于优化窗宽的核密度估计的属性模型;然后基于训练数据的核密度估计模型进一步计算测试数据的密度-距离-分布值(Tri-D),通过嵌套式的方法分配Tri-D值获取测试数据对应的BPA,最后通过D-S组合BPA获得最终判断,实验结果证明了算法的有效性。(3)提出了一种基于共信度改进的D-S组合方法该算法就D-S证据理论组合中组合精度和冲突悖论的问题,在优化的冲突衡量系数、可信度和不可信度的基础上,提出了共信度,并在此基础上对证据进行加权修正再组合,实验表明算法在有效避免组合冲突的同时也提高了收敛速度与组合结果的精度。(4)对网络证据进行了融合分析利用前面三种方法完成D-S证据理论在网络证据融合中的应用,通过预处理、形成证据以及融合证据,完成了对网络证据的分析。