论文部分内容阅读
随着信息技术不断发展,社会各个领域建立了越来越多的业务应用系统,不同系统运营产生了大量的数据。随着数据量的庞大,将不同业务系统数据融合在一起挖掘潜在价值变得越来越有意义。复杂事件检测技术实现的就是将业务数据抽象为事件序列,通过复杂事件描述方法,将有潜在价值的复合数据描述为特定的事件匹配结构,复杂事件检测引擎再从大量事件流中检测出满足匹配结构的事件序列,最终输出数据融合结果。但传统复杂事件检测技术在进行事件描述时,输入事件流为单一原子事件类型,事件谓词约束为简单的属性值比较操作和简单聚合操作,事件之间的时序约束只能是“after”、“before”等简单的时间关系。这使得传统检测方法无法满足诸如医学、金融等对时间要求比较精确,事件谓词约束要求更加丰富的应用领域。因此,一种能够支持多元事件输入,支持事件间量化时序约束和复杂谓词约束的复杂事件检测方法是非常有必要的。为了实现支持多元事件输入,支持事件间量化时序约束和复杂谓词约束的复杂事件检测,本文在传统复杂事件检测模型基础之上提出了面向多元时序数据的复杂事件检测方法,定义了基于TCN的量化时序约束表示方法和基于时段特征约束的谓词约束表示方法,同时增强了事件输入方式,支持多元事件输入,并且提出了基本的复杂事件检测算法和并行化检测方法,使得复杂事件检测方法更加高效。本文的主要贡献如下:(1)事件定义:在进行复杂事件描述之前,需要定义事件概念,本文对事件重新做出了定义,提出了原子事件、聚合事件和复杂事件的概念。(2)事件描述方法提出:本文在复杂事件描述方面,引入TCN时间约束网络进行事件间量化时序关系的表示,引入时段特征进行事件复杂谓词约束的表示,并且提出了聚合事件描述模型和复杂事件描述模型。(3)基本复杂事件检测算法提出:本文基于传统复杂事件检测系统SASE,提出支持量化时序约束和复杂谓词约束的复杂事件检测方法,同时支持多元事件输入。(4)并行复杂事件检测算法提出:针对基本检测算法在输入事件量较大时,整个系统检测时间周期较长的问题,本文提出事件流切片的并行检测方法。为了验证本文提出复杂事件检测方法的有效性,本文开发了一个复杂事件检测原型系统TCSEQ,设计了多组实验,分别从检测方法处理能力、事件检测正确性、数据量大小、待匹配序列长度、滑动时间窗口大小等方面进行了实验验证。实验结果表明:本文提出的方法能够有效支持多元事件输入、量化时序约束和复杂谓词约束的复杂事件检测,并且具有较高的效率。