基于多流形学习的多源异构安全数据处理分析

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:zimomo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多源安全数据的分析是网络安全领域分析预测的基础,多源数据的融合分析技术是对安全数据进行处理的重要方法。日志数据可以记录系统的状态变化,日志文件可以表示出系统状态改变的情况。对网络安全状态的分析可以结合日志数据和其他安全数据,达到综合分析的目的。流形学习算法是近十年应用较广泛的一种数据降维与特征提取方法,该方法融合了计算机科学、数学、智能科学和认知科学等相关知识,已经成为目前机器学习研究领域的重点和热点方向。论文结合流形学习算法,将多源异构安全数据的融合分析分为多源数据预处理、特征提取和安全分析三部分:第一部分是预处理阶段,主要是对多源安全数据进行预处理操作。为了减少多源数据在语义、时间、空间上的异构性,同时去除脏数据,论文提出一种基于流形学习算法的数据预处理方法。首先,对数据进行数据清洗操作,包括初步过滤去重,识别噪声数据等;然后进行数据约简操作,通过流形学习算法对数据源进行降维,以此获得高质量的数据。第二部分是安全特征提取阶段,主要是对经过预处理后的数据的特征提取。为了分析多源异构数据源,选择合理的数据特征,论文提出一种基于多流形学习算法的数据特征提取方法,该方法同时考虑了多源数据的类别属性和距离信息。第三部分是安全分析阶段,主要是对提取的数据特征进行安全分析。随机森林算法由于构造容易、普适性强、方便与其它算法结合等优点被广泛应用,但传统的随机森林学习算法存在耗时较多、容易产生相似的决策树和构造效率低的缺点。因此论文提出一种基于多流形学习的随机森林构建方法,选择数据的本质属性构建决策树,生成随机森林,使随机森林准确率提升,同时有效避免噪声影响和过拟合现象。最后,对论文提出的方法进行了实验验证。实验结果表明,与现有的数据预处理方法、数据特征提取方法和随机森林分析方法相比,论文提出的方法提高了安全分析的效率和准确性。
其他文献
为了解决高校仪器设备缺乏和过时陈旧等问题,提高实验教学质量,本文设计了一种基于LabVIEW的虚拟逻辑分析仪。该分析仪由数据捕获和数据后处理两部分组成。主要介绍了数据采集
目的:分析非语言艺术的内容及其在健美操教学与训练中的作用.方法:非语言内容在健美操教学与训练中运用与实践是按教学计划规定的内容进行,让学生在教师的指导和传授下,有计
民族服饰是体现民族文化的重要组成部分。色彩又是服饰的重要要素之一,民族服饰无法脱离色彩,而色彩的本体价值就在服饰中充分展现出来,直观表现出鲜活民族个性。色彩与色彩
本文介绍了一种具有智能循线和避障功能的机器人设计方案,机器人系统包括控制系统的硬件和软件设计。硬件部分主要包括控制器、传感器和电机控制电路,控制器采用16位单片机SPCE
泰克公司宣布,泰克是目前市场上唯一能够提供从RF内容接收到网络边缘视频监测解决方案的供应商。该方案能有效解决有线运营商和电信运营商在网络监测中所面临的质量损伤管理和
对桂西北2种不同建园方式的柑橘园的土壤水土流失连续3年定位监测及对4种类型柑橘园土壤含水量年内动态变化进行了研究.结果表明;2种不同建园方式柑橘园的土壤流失量逐年减少
目的:将<内经>中的梦饮食与现代医学病态梦现象进行比较,以求理论与治疗手段的进一步发展,指导临床实践.方法:查找古今文献,从病理、生理、心理三方面对两者进行比较,找出异
目的:探讨神经生长因子(never growthfactor,NGF)局部连续给药对周围神经损伤后的修复与再生的影响.方法:SD大鼠48只,分4组;A组采用术后局部连续注射NGF 0.3μL3周.B组:手术
目的:研究L—FABP(1iver fatty acid binding protein)在大鼠非酒精性脂肪肝形成中的作用.方法:建立高脂饮食脂肪肝模型,用半定量逆转录聚合酶链反应(RT—PCR)与聚丙烯凝胶蛋白电