基于长短期记忆网络的日志分析工具的研究与实现

来源 :西南大学 | 被引量 : 0次 | 上传用户:lxm1230520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大规模分布式系统正在成为IT行业的核心组件,支持各种类型的日用软件,包括网上银行,电子商务和即时消息等。与传统的独立系统相比,大多数此类分布式系统全天候地运行,为全球数百万用户提供必要的服务。此类系统的任何非正常停机都可能导致重大的收入损失,同时随着网路攻击手段的不断更新,越来越多的危险威胁到了系统的正常运行,这突出了进行网络防御,保护系统可靠性的必要。异常检测是网络攻击防御中一个关键的环节,异常检测算法经过发展已从早期基于统计思想的检测方法发展到运用机器学习的检测方法。随着数据规模不断增大至千兆字节级别,传统的检测方法几乎无法从大规模的数据集中发现异常值。深度学习是机器学习方法中神经网络的发展形式,通过堆叠网络层实现高性能的学习与分析。在数据规模增大的情况下,深度学习的表现优于传统的机器学习。近年来,基于深度学习的异常检测算法成为研究的热点,被证明比传统机器学习方法更适合从大规模数据中寻找异常。系统日志可用于详细记录生产环境中的系统运行时信息的数据,在异常检测中起着重要作用。原始日志常为无结构记录而无法直接用于进行分析以发现异常,需要经过日志结构化解析将原始日志消息转换为一系列结构化事件后进行异常检测。现有的日志结构化解析工具在处理大量数据时性能尚存不足,本文拟利用Spark Streaming框架的大规模数据处理能力提升结构化解析工具的运行性能,提升日志结构化解析的效率。本文将系统阐述基于日志的异常检测相关技术,以此为基础,设计并实现结构化解析实时输入的日志数据,对日志数据中的异常加以检测。本文研究内容以及成果主要涵盖以下几方面。(1)使用有标识的日志数据集对长短期记忆网络(LSTM)进行训练,使其学习正常的日志模式。(2)将日志结构化解析工具以Spark Streaming框架加以实现,加强日志结构化解析工具对大规模数据的处理效率。(3)以经过训练的LSTM作为检测模块,分布式结构化解析工具作为结构化解析模块来开发日志分析工具的原型,将其部署在Hadoop平台上实现对实时输入的日志数据的结构化解析以及异常检测。本文选用开源的日志数据集对LSTM网络以及结构化解析工具的性能进行验证,LSTM网络方面通过实验验证了LSTM在实验数据上能检测出不同种类的异常,选择基于监督学习的异常检测模型支持向量机(SVM)和决策树与LSTM模型(本文称为LSTM?-log)进行对比,并验证了LSTM-log模型在异常检测性能方面,其精确率(Precision)、查全率(Recall)、F-度量(F-measure)均优于SVM及决策树两种模型,为日志分析工具的异常检测模块的实现提供了基础。结构化解析工具方面通过对比实验证明了在相同的数据集上分布式的结构化解析工具有与单机环境的结构化解析工具同等的精确度并且在结构化解析效率上优于单机环境的结构化解析工具。以上述实验结果为基础,开发并部署了日志分析工具原型,能实时对传入的日志记录进行结构化解析以及异常检测。
其他文献
本文通过焊接热模拟和焊接工艺评定试验相结合的方法,来研究宝钢试制的X90管线钢连续冷却转变的组织和性能变化规律,X90管线钢管环焊缝现场焊接工艺、方法和接头性能,从而来综合评价该X90管线钢的焊接性。本文的主要研究成果如下:1.利用Gleeble-3500热模拟试验机绘制了X90管线钢的SH-CCT曲线,研究了X90管线钢连续冷却转变的组织变化规律。2.利用热模拟的方法研究了X90管线钢热影响区的
艺术作品的阐释是艺术哲学与分析美学领域的重要议题。有关同一作品的多种阐释中,是否存在唯一正确的一种?作品自身是否存在独立于任何意图的意义?作者意图是否决定了作品意义?分析美学家们在这些问题上争论不休。而作者意图作为艺术作品阐释的重要标准之一,始终是讨论的一个焦点。反作者意图论主张,作品意义独立于作者意图。极端作者意图论则认为,作者意图等同于作品意义。作者意图论与反作者意图论的这场争论从二十世纪起持
钛合金具有密度低、比强度高、耐高温耐腐蚀等一系列的优异性能,使得其在装甲防护领域有着很大的应用潜力。本文针对TC21钛合金,通过制定合理的热处理工艺精细调控其组织细节,获得了等轴组织、双态组织及3种片层宽度的片层组织TC21钛合金。通过对这5种组织TC21钛合金开展一系列的动态压缩实验,并采用光学显微镜(OM)和扫描电子显微镜(SEM)对实验后的材料进行微观分析,研究了转变β区体积分数和片层α宽度
1引言长期以来,传统的翻译理论认为译者在从事翻译工作的时候,应该以原文为基础,做到"忠实"与"对等",而不应该过多地凸显译者个性。但是Baker(1993)将语料库与翻译研究相结合
会议
随着集团全球化、集团化快速扩张与发展,全面深化集团财务管理改革,建立、完善现代集团财务管理体系,实现企业财务管理转型和优化升级,已经成为集团财务管理的发展趋势。传统
随着汽车产业的不断发展和智慧城市概念的不断完善成熟,汽车作为一类常用的交通工具在人类日常生活中的重要程度越来越大。因此,对城市环境中交通状况的要求也越来越高。车载自组织网络(Vehicles Ad-Hoc Networks,VANETs)作为构成智能交通系统(Intelligent Transportation System,ITS)的一种专用网络,被越来越多的研究人员所关注。车联网不仅是车辆间的
我国盐业体制的市场化改革,打破了原有的专营体制,市场化竞争日益激烈,“价格战”明显,对盐业公司区域行政垄断地位产生重大影响,盐行业的垄断利润逐渐消失。Y公司也不例外,
工程变更是企业生产经营活动中一项不可避免的业务活动,贯穿整个产品生命周期,企业能否有效实施工程变更,决定了该企业能否快速响应市场变化和客户需求、不断提高产品性能、
本文研究可用于描述污染物迁移过程的拟线性退化抛物-双曲型方程带非齐次Dirich-let边界条件的初边值问题熵解的适定性.该类方程包括双曲守恒律、各向同性、各向异性和严格抛物型四种可能性.对于双曲守恒律(完全退化)和严格抛物型(完全不退化)的研究比较完善.本论文主要考虑各向异性方程(各向同性是各向异性的一种特殊情况).受双曲守恒律Dirichlet边值问题的启发,我们引入退化抛物-双曲型方程的“熵
三一律在17世纪的文艺复兴时期以及古典主义时期是受广泛认可的创作规则,人们凭借着三一律法则,让戏剧更有效的呈现出其真实感和逼真性。浪漫主义时期随着创作者对于无垠内心的探索,三一律不再能满足更为复杂的叙事需求,人们开始对三一律展开批判,将其视作戏剧发展的阻碍,这种反对的声音一直延续至今。但一个无法否认的事实是三一律的叙事在现代作品中频频出现,而且具有一定的美学韵味。针对这种现象,我们以现代的目光进行