网络安全数据分析与管理关键技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:xiaozi134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络的快速发展,互联网上的信息量日益增多。对互联网上流传的信息进行有效的检测、分析、响应和管理,监测可能导致突发事件的舆情信息,及时制止色情、暴力、反动等不良信息的恶意传播,是当前网络管理和安全面临的主要问题。 随着信息网络管理范围的不断扩大,信息的来源和获取量也将不断增大,将面临着海量信息无从处理的局面。因此利用海量信息存储和数据挖掘等技术,构建网络安全管理平台,支持各种安全信息的采集、处理和分析,是十分必要和有意义的。本论文主要研究网络安全数据的处理和管理问题。这里的安全数据是指与网络安全相关的事件或信息,包括网络安全事件、日志文件和BBS热点信息等。 本文研究的安全数据均来自网络安全管理平台采集到的数据,包括IDS告警、邮件处理系统的告警,以及BBS论坛信息等。针对告警信息,本文在BIRCH的分层次思想中引入预定义的规则库进行聚类,以提高聚类的收敛效果;同时,把该关联算法与Hadoop的Map/Reduce相结合,实现了算法的并行化计算,在一定程度上提高了算法的运行效率。对BBS论坛信息,本文主要研究两项技术:关键词抽取和情感倾向分析。关键词抽取是利用BBS数据的一些特征,抽取重要的词来代表文章的主题,统计热门关键词;倾向性分析是对于每个话题,对每个发信人发表的文章的观点识别其正负面,以便找出负面信息予以过滤。 本文搭建了网络安全管理平台,设计和开发了网络安全数据分析和管理系统部分功能模块。并对相应的分析算法,进行了性能评估和测试。对告警事件的聚类性能测试表明关联算法可以有效减少告警,缩短关联分析的执行时间。对于BBS的关键词抽取方法,分别从查准率和覆盖率两方面进行评估,对于情感倾向识别,选取不同的分类特征,并对分类效果进行了比较和讨论,为进一步的改进工作打下了基础。
其他文献
决策树方法是一种广泛使用的用于分类的方法,它通过一组无次序,无规则的实例推理出决策树表示形式的分类规则,从而找到一些有价值的、潜在的信息。本文通过对数据集和决策树
随着医疗卫生事业的发展,在临床医疗活动中的药物使用问题逐步成为公众关注的焦点。世界卫生组织指出在地球上每年死亡的人群中有740万人不是由于自然衰老或疾病的原因死亡,而
学位
电子支付是电子商务的核心,直接影响到电子商务的发展速度和范围。目前已有的电子支付方式中,电子现金是一种新兴的,极具潜力的支付方式。电子现金具有现实货币的特性,具有匿
随着集成电路制造工艺的进步和微处理器设计技术的发展,单发射按序执行处理器表现出强劲的生命力,不仅在嵌入式计算领域得到日益广泛的应用,而且代表了高性能计算领域微处理器设
流数据无处不在,股票交易记录、网络流量、传感器网络中的数据、web日志都是其中典型的例子。此外,航天、音乐、医学等领域也存在着大量的数据流应用。在这些应用中,数据量都非
数字签名作为一种保障信息安全的有效手段,可以保证信息完整性、鉴别发送者身份真实性及其签名不可否认性,同时还具有加密的功能。正是由于这些功能,数字签名被广泛应用到网
模型是对现实世界的抽象。模型包含系统的主要元素而忽略那些与给定抽象层次不相关的次要元素,从而既能保证模型反映了系统的主要特性,而又不至于使模型过于复杂而难以理解和把
呼叫中心(Call Center)是一种建立在现代通信网络基础上的客户呼叫处理系统。随着呼叫量的增多以及客户多样性的需求,传统呼叫中心已不能满足客户的需求,IP呼叫中心应运而生,
近年来,随着计算机应用和网络技术的不断发展,信息资源越来越丰富,如何对信息与知识进行有效的组织和管理,以便于信息与知识的共享和利用成为一项迫切而重要的研究课题。本体是一
目前,数字图像拼接技术在各个领域有着很高的应用价值。本文在综合分析国内外有关数字图像拼接技术研究现状的基础上,对GIS中图像拼接技术进行了深入的研究,具体内容如下。首