论文部分内容阅读
互联网的普及和迅速发展的宽带通信业务,把人们带入了一个信息极大丰富的时代。然而在给人们带来较多便利的同时,伴随而来的信息安全事件也越来越多,造成了巨大的经济损失,预防和阻止安全事件的发生变得尤其重要。日志用于记录系统日常运行的状态,检查错误发生,发现入侵时留下的线索,可以实时防止和杜绝信息安全事件的发生,因此,应用日志来进行网络安全分析已经成为一个热门的研究领域。本文重点研究了层次聚类算法Chameleon及其改进算法,在分析其存在的不足后通过引入共享近邻加权图对算法进行改进,然后将改进的算法应用到日志分析中,并结合Hadoop中的分布式存储系统(HDFS)和MapReduce机制设计了在线日志分析系统,最后,将改进的具有消息链接恢复的签密方案(Message Linkage Recovery Based on Elliptic Curve,ECMLR)对分析得到的数据及用户指定的重要日志进行保护。主要研究内容包括:1.深入研究了计算机系统日志及日志分析常用方法首先简单阐述了日志的概念、特点、作用及Windows日志的组成,然后总结了日志分析常用的方法及这些方法的优缺点,列举了部分现有日志分析工具,最后指出现有日志分析技术存在的问题。2.提出了引入共享近邻加权图的Chameleon算法在学习了Chameleon算法的原理及各种改进方法后,发现其仍存在相似性度量不准确,最小二分困难,人工指定阈值等问题,因此,提出引入共享近邻加权图的Chameleon算法,其中以数据对象间的共享近邻数来衡量相似度,进一步构造共享近邻加权图(WeightedShared nearest neighbors Graph, WSnnG),利用网络模块性评价函数指导最小二分,以结构等价相似度作为合并的依据,通过引入内聚度度量函数解决合并后不能撤销的问题。在UCI的Wine数据集、Pen-Based recognition of Handwritten Digies Dataset(Pendigits)数据集及四个二维人造数据集上对改进后算法的准确性及有效性进行验证,最后结合日志的具体特点,将改进的算法应用于日志分析。3.设计了基于Hadoop的在线日志分析系统的模型按照层次化、模块化、分布式的思路设计了基于Hadoop的在线日志分析系统,主要将其划分为数据采集层,日志分析层及界面展示层,并将改进的Chameleon算法移植到Hadoop中进行日志分析。在日志分析层设计了接口,用户可根据具体的任务编写相关的日志分析代码,通过接口导入系统中,实现日志分析算法的可扩展性及灵活性;在界面展示层用户可以对已存在的日志分析程序进行参数的设定,并制定日志分析结果的呈现方式。4.改进具有消息链接恢复的签密方案(Message Linkage Recovery Based on EllipticCurve, ECMLR),然后采用改进的签密方案进行数据保护从椭圆曲线密码系统中运算量大的问题出发,以签名方程为切入点,对基于椭圆曲线的具有消息链接恢复的签密方案(ECMLR)进行改进,并对其进行了正确性验证。安全性分析和效率分析表明,改进后的方案满足数字签名方案的安全性要求,并且在签名过程中减少了一次数乘运算,降低了验证过程中的点乘运算次数。之后,将改进的ECMLR运用到日志保护当中,提出了一种新的日志保护方案,该方案具有能够直接从签名中恢复出原始消息的特性。