论文部分内容阅读
随着当今世界信息技术的高速发展,人们正享受着互联网带来的工作和生活便利的同时,也时时刻刻受到计算机病毒的威胁。计算机病毒代码编写技术从最简单的功能性破坏到采用多态变形、加壳等技术以避开杀毒软件的检测。当前各大反病毒软件采用的特征码扫描技术通过扫描已知病毒的特征库可以实现对病毒的检测,但这种方法无法识别未知病毒。基于动态行为分析的反病毒技术依据检测可疑文件运行时的动态行为检测病毒,它并不依赖于病毒的静态特征,能够有效识别未知病毒,是反病毒领域的发展趋势。本文针对当前的计算机病毒检测方法存在的不足之处,提出了一种基于样本动态行为特征并结合数据挖掘算法的计算机病毒检测方法,设计并实现了一个基于行为分析的病毒检测模型,该模型主要包括虚拟机控制模块、动态行为追踪模块、特征向量生成模块、支持向量机学习模块,这些模块分别完成了控制虚拟机、捕获样本行为、生成特征向量及样本分类等过程,并通过实验测试了该模型的有效性。本文的主要工作如下:(1)定义和分析了多种常见的病毒行为特征,并进一步剖析了病毒进行恶意操作的技术原理。(2)提出了利用病毒行为特征并使用“一对多”支持向量机分类算法构造分类器,从而对样本进行多类分类的新思路。研究了这种方法在检测未知病毒,确定病毒所属类别的可行性。(3)针对基于信息增益的特征选择算法对样本行为特征筛选上的不足之处,进行了特征选择算法改进,新的特征选择算法将样本特征项在某一类出现的频率和分布情况考虑进来,使得选择的特征项具有更好的区分度。(4)基于样本行为分析和支持向量机分类法设计并实现了针对PE文件病毒的检测系统,并对该系统进行了测试。实验表明,本文提出的采用改进信息增益算法筛选样本行为特征项,并利用支持向量机分类算法检测病毒的方法较采用原有信息增益算法得到的测试结果,在检测准确率上提高了约3%。