一种基于宏森林自动机的复杂事件检测方法

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:ruindown
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,很多基于网络的应用系统会持续自动地产生大量包含各种信息的数据流,如何高效的从海量数据中获取有价值的信息并进行相应处理成为一种挑战。由此,衍生了一种复杂事件处理平台。复杂事件检测技术旨在快速准确地从持续到来的流数据中抽取有价值的信息,是复杂事件处理平台的关键部分。XML作为网络数据交换和数据共享的主要格式,是复杂事件处理平台的数据模型之一。目前,对于XML流数据的复杂事件检测方法的研究主要针对于两个方面:一方面,使用更丰富的复杂事件描述语言;另一方面,提出更高效的事件流模式匹配方法。当前存在很多针对于XML数据流的检测方法,其中一部分虽然较为高效,但其查询大多是在XPath的基础上进行扩展,它们对于复杂事件中时序关系的检测无法有效描述,且多数研究不支持返回复杂事件中多个匹配的子结果的需求。另一部分主要将复杂事件检测方法作为复杂事件处理平台的一部分,定义了相应的复杂事件处理语言,但在描述复杂事件时大多比较复杂。针对上述问题,本文采用正规树模式描述复杂事件查询,它在树模式的基础上添加了正规式节点,使其能够同时满足描述查询节点间的结构关系和时序关系的需求,是一种简洁且丰富的复杂事件描述方式。在此基础上,本文提出了一种高效的复杂事件检测方法CEDMFT,使用一种高效的XML流数据处理模型——宏森林自动机作为树模式的查询模型,结合一种用于正规式处理的兄弟自动机,形成复杂事件检测的解决方案。该方法通过将正规树模式查询翻译为一组宏森林自动机和兄弟自动机,使得两种自动机能够相互嵌套、相互调用,并结合对应自动机的事件流匹配方法,实现针对XML流数据的复杂事件查询。同时,本文实现了相应的复杂事件检测的系统,并进行了相应的测试实验。实验结果表明:对于简单的树模式查询能达到3.3GB/s的吞吐量,对于包含时序关系的复杂查询能达到1.2GB/s的吞吐量,能够满足复杂事件检测的基本需求。
其他文献
企业创新实践成果与知识是一个企业重要的无形资产,通过研究企业创新实践成果及知识管理系统,实现对创新实践成果的集中管理,促进企业员工之间的经验共享与交流互动,并形成集
本文为一篇MTI实践报告。该报告目的是透过案例分析,找出以耳语形式所做的同声传译中的主要困难,并提供可行的应对策略。首先,在口译任务描的部分,说明了笔者在考文垂和广东
随着经济社会的不断进步,人类财富的不断积累,人们生活水平的不断提高,人更加关注如何才能更加健康、幸福的生活,也因而有越来越多的人热切的想要知道,如何才能转变当下不甚
本文对基于时空上下文的目标跟踪算法进行了研究。时空间上下文跟踪算法通过分析目标周围空间上下文对跟踪目标进行定位。本文所研究的算法是一种快速的基于稠密时空间上下文
目前的社交网络,普遍均有推荐用户的功能。传统的推荐算法,有基于内容的推荐、协同过滤推荐以及混合推荐,已经在许多网络平台上取得了良好的应用效果,但是算法本身仍然存在一
随着信息化进程的深入和数字设备市场的蓬勃发展,数据量正在成倍地增长。海量数据的存储和管理促进了云存储的发展和应用,然而数据安全问题却阻碍了云存储的快速发展。用户将
近年来互联网技术不断发展,人们已经从信息匮乏的时代迈入大数据的时代。尤其是随着社会网络技术的发展,当用户在互联网上选择服务时,更信任和依赖自己的好友。然而面对海量
在包括物联网(IoT)在内的下一代数字技术中,非易失性存储器(NVM)将会扮演十分重要的角色。阻变式存储器作为一种新型非易失性存储器,由于具有结构简单、与传统CMOS工艺匹配度高、
随着信息时代的来临,数据呈现爆炸式地增长,数据备份系统需要存储的备份数据越来越多,为了节省存储资源,重复数据删除技术作为一种无损数据压缩技术被广泛应用于数据备份系统
随着集成电路进入超摩尔时代,集成电路规模日益增大,功能日渐复杂,验证工作在芯片研发周期中占到约70%的时间,传统的直接验证已无法满足工程上的要求。工程师希望通过提高代