基于时间序列数据挖掘的日志分析技术的研究

来源 :北京交通大学 | 被引量 : 9次 | 上传用户：hejizhou

【摘要】

：

各种操作系统、应用程序、设备等产生的日志数据蕴藏着丰富的信息,对日志数据的挖掘和分析不仅能够帮助管理人员提前发现、避开潜在的隐患,找到安全事件的根本原因,还能够挖

【作者】

：

王陈

【出处】

：

北京交通大学

【发表日期】

：

2018年01期

【关键词】

：

日志分析时间序列数据挖掘 GSP算法 PrefixSpan算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

各种操作系统、应用程序、设备等产生的日志数据蕴藏着丰富的信息,对日志数据的挖掘和分析不仅能够帮助管理人员提前发现、避开潜在的隐患,找到安全事件的根本原因,还能够挖掘出日志数据背后潜在的更多的信息。随着日志数据的重视程度越来越高,如何有效的挖掘和分析日志数据已成为当前的研究热点。日志数据具有时间序列的性质,使用时间序列数据挖掘技术能够对其进行更有效的挖掘和分析。序列模式挖掘作为时间序列数据挖掘技术的重要研究内容之一,能够挖掘日志数据中频繁出现的序列模式,这些频繁出现的序列模式往往反映了日志记录的事件之间的相互关系,具有重要的研究意义和价值。本文对序列模式挖掘的两个应用广泛的GSP算法和PrefixSpan算法进行了改进,主要的研究工作如下:(1)针对GSP算法需要遍历整个序列集、需要多次遍历k频繁序列以及遍历k频繁序列速度慢的缺陷,提出了一种基于序列集优化及索引前缀树的GSP改进算法。该算法基于本文所提的序列集优化方法以及本文设计的索引前缀树数据结构,有效减少了算法的运行时间。对比实验结果表明,基于序列集优化及索引前缀树的GSP改进算法的运行时间明显低于未改进的GSP算法,但会花费了更多的空间代价。(2)针对PrefixSpan算法占据了大量内存的缺陷,提出了一种基于后缀索引的PrefixSpan改进算法。对比实验结果表明,基于后缀索引的PrefixSpan改进算法在运行时的内存使用情况明显低于未改进的PrefixSpan算法,并且其运行时间与未改进的PrefixSpan算法的运行时间相接近。(3)为了验证PrefixSpan算法记录的后缀中含有非频繁项对算法的时间性能是否会产生影响,提出了一种基于投影数据库优化的PrefixSpan算法。对比实验结果表明,后缀中含有非频繁项不会降低PrefixSpan算法的时间性能,删除后缀中非频繁项的操作反而会花费大量时间。本研究同时证明了基于后缀索引的PrefixSpan算法不会因为使用了后缀索引导致其时间性能的降低。(4)对改进前后的GSP算法和改进前后的PrefixSpan算法进行了对比,深入论述的两类算法的特点,并说明了各算法的使用范围。

其他文献

近5年多囊卵巢综合征中医证型及用药规律研究

目的:借助中医传承辅助平台系统,分析和总结近五年多囊卵巢综合征的中医证型及用药规律。方法:收集2011-2015年CNKI中符合纳入及排除标准的文献,在中医传承辅助平台系统中建

期刊

多囊卵巢综合征中医传承辅助平台系统中医证型用药规律文献研究

自拟消腺汤治疗小儿腺样体肥大

鸡、鱼、豆、奶现已成为餐桌的"常客",但小儿乃稚阴稚阳之体,对于此等肥甘厚味的消化吸收会相对延迟,久之食物内积、化火,脾虚失于健运而痰湿内生,如此循环往复,则痰火互结,

期刊

腺样体肥大中医药治疗患儿症状肥甘厚味痰湿内生稚阴稚阳化火健运

肺隔离症患者53例临床诊疗分析

背景肺隔离症是一种罕见的先天性肺发育异常疾病,临床误诊率高。目的总结肺隔离症的临床特点、影像学表现、诊断以及治疗体会,以降低误诊率。方法收集2008-01-01至2016-10-01

期刊

支气管肺隔离症体征和症状诊断治疗

高温小球下落冷池运动机理的实验研究

高温颗粒在粘滞性冷液中沸腾蒸发瞬变运动引发蒸汽爆炸是一个工程安全问题。利用实验室设计建造的高温颗粒下落冷池沸腾可视化实验装置，通过高速摄影记录小球在冷液中的下落全

期刊

高温颗粒运动机理实验研究High-temperature particles Movement mechanism Experiment study

He冷却试验包层模块的热-力耦合分析

试验包层模块（TBM）是国际热核聚变实验堆（ITER）的关键核心组件，其设计涉及多学科综合优化分析。本文介绍了He冷却固态增殖试验包层的设计概念，并应用热-力耦合模拟方法对所提出的包

期刊

国际热核聚变实验堆(ITER)试验包层模块(TBM)热结构设计热分析力学分析Thermonuclear Experimental Reactor （I

肝郁肾虚血瘀之闭经治验

闭经好发于已婚妇女,且年龄分布以35~45岁为多,临床所见闭经以肝郁肾虚血瘀证为多,兹举一闭经案例谈谈笔者治疗闭经的心得体会。临床病例患者王某,女,39岁,2020年4月2日来诊,

期刊

月经先后不定期末次月经月经量少脉沉弦治验已婚妇女情绪异常闭经

蒙特卡罗方法用于HFETR堆芯γ释热的可行性研究

采用蒙特卡罗方法对高通量工程试验堆（HFETR）堆芯内的γ释热进行了计算，并将计算结果与实测值进行了比较。结果表明：用蒙特卡罗方法计算HFETR堆的γ释热率是可行的，具有满意的计算

期刊

HFETRγ热蒙特卡罗方法HFETR γ -heat Monte-Carlo method

基于时间序列数据挖掘的日志分析技术的研究

其他学术论文