论文部分内容阅读
随着越来越多的企业基于网络开展业务,企业在数据安全、网络安全与系统安全等各方面都面临着全新的挑战[1]。通过在企业内部建立网络安全信息管理系统,对于解决企业业务面临的安全威胁,提高风险管控能力具有重要的理论和实际意义。本文以某企业的实际需求及特殊要求出发,研究并且实现了一个基于深度学习的网络安全信息管理系统。论文主要从以下方面进行阐述:(1)基于深度学习的文本分类技术,对文本表示模型进行了深入研究。并对分布式表示算法Word2Vector词向量模型进行重点分析。通过对两种文本表示模型原理的分析,比较了其对语境预测情况的差异,并通过实验比对,发现Skip-gram模型在网络安全信息分类场景,具有更大的优势。(2)通过Word2Vector生成文本的词向量,既保留了文本原有的语义信息,又能够通过目标词预测上下文的概率。并且通过实验,对网络安全信息文本分类场景中的词向量维度、窗口大小等参数进行调整,使得特征文本被更有效的处理,获得了效果更好的词向量。(3)通过词嵌入层、卷积层、池化层和全连接层四层卷积神经网络来进行网络安全信息的分类,使原先需要人工完成的分类工作替换为自动化工作,提升了工作效率。既尽可能多地保留了文本特征,又通过Dropout层有效防止模型的过拟合问题。(4)基于文本分类结果的权重因子,结合BM25算法,时间衰减等其他维度数据,实现了基于关键词查询的自定义的实时多因子排序算法,从而提升了数据检索的相关度和灵活度,使得重要的信息的曝光度和使用率获得提升,并且可以根据需要,实时进行调整。(5)完成了网络安全信息管理系统具体的功能实现、部署和测试。首先分析了业务的需求,并做了概要设计,然后详细阐述信息抓取模块、信息分类模块和信息查询模块三个系统核心模块的功能实现过程。模型通过Tf Serving部署,支持各种跨语言的http调用方式,并且可以对模型灵活地进行调整。通过功能测试,说明系统的各个模块的实现都符合系统设计的要求。