论文部分内容阅读
随着人类社会信息化程度的不断提高,人们对网络的依赖性日益增强,计算机的网络安全已经受到人们的广泛重视。传统网络安全保护是通过认证、授权、访问控制以及加密等机制来实现的,但这些仍无法阻止通过计算机软硬件系统的不足来入侵计算机系统的非法行为。入侵检测技术作为一项先进的动态安全防护技术,可以较好的发现这些非法行为,已成为计算机科学与技术的一个重要研究领域。当前,具有自我学习能力和自适应能力的入侵检测系统还不够健全,过去的入侵检测技术在适应性和扩展性上已无法应对越来越复杂的攻击方式。由于数据挖掘可以从海量数据集中自动的寻找到人们感兴趣的特定内容和模式,故而,在许多入侵检测研究项目中,数据挖掘技术都被使用了。在这一方面,本文主要做了以下几方面的研究工作:(1)对关联规则挖掘算法进行了详细分析,发现传统删减候选项集的方法还可以作进一步的完善。重点改进了Apriori算法产生候选项目集的步骤和方法,给出了一种删减参加自连接的频集和进行预剪枝相结合的改进方法。考虑到算法是用来发现那些正常连接记录的属性间的相关性的,对关联规则的规则生产算法进行了一定的改进。(2)详细的阐述了如何采集网络实时数据,如何将其转化成网络连接记录形式。根据关联规则算法挖掘的需要,结合网路连接记录属性值的统计学意义,给出了一种处理连续型属性值离散化的方法。(3)提出并阐述了一个基于数据挖掘技术的入侵检测系统模型,该系统结合传统的基于模式匹配的误用检测技术,添加了以关联规则为基础的异常检测方法,并在系统中进行实时频繁模式挖掘,以及时更新正常模式集。同时,将入侵检测结果数据定时添加到训练数据集。从模拟实验结果来看,改进算法较原算法具有较高的执行效率和检测率,降低了数据处理时间,提高了系统检测率,达到了提高入侵检测质量的目的,具有一定的实践和理论指导意义。