论文部分内容阅读
现如今,随着科学技术的发展,爆炸式增长的数据信息涉及人类的各个领域。时间序列流数据作为众多数据类型中的一种时间序列模式数据,它是一个动态的数据集合,其大小随着时间的逐渐递增而不断变大。时间序列流数据所承载的信息可以实时传输,并且每一个数据点按照时间先后顺序到达。数据点之间的顺序不收系统调度和控制的影响,只与采样时间相关。因其数据的流动性,所以不仅数据规模巨大,而且数据峰值具有未知性。传统的数据分析和事件获取分类与时间序列流事件的获取和分类处理方式上有所不同,传统数据分析处理是一个可对数据进行随机的无需考虑次序的处理分析方式,而时间序列流数据是随着时间的增长不断收集存储得到的,这是一种流的状态,每一个数据点都具有时间属性故需要根据时间标签有序的对其进行处理分析。通过对时间序列流数据的研究,可以进行医学健康的检测,对金融债券行情进行分析,对用户社交行为的分析,天气、矿山灾害预警等。时间序列流数据中的时间序列流事件的完整事件获取与分类是研究此类数据各项操作的基础。现阶段时间序列流事件方面的研究已有很多,传统的数据系统中的异常事件获取针对的只是异常数据点的查询,但是在许多实际应用之中,异常事件是一段连续时间内的异常,即一段连续时间的点的集合。其中包括时间以及能量的多种信息,传统的阈值判定方法无法快速找到异常事件并且完整的得到事件信息。现有一些异常事件获取方法也存在着一些局限和不足。针对这样的问题,本文提出一种可变多级时窗算法的流式数据事件获取方法。该方法首先使用基于STA/LTA算法的事件触发算法找到异常事件的起始点和终止点的大致范围,然后利用基于AIC法则的起始点与终止点精确获取方法在估计范围中准确定位起始点与终止点,从而获得异常事件的完整信息。在此基础之上得到完整异常事件之后,提出一种基于神经网络的时间序列流事件分类方法对事件进行分类。首先将异常事件的向量数据转化为相同大小的矩阵以作为规定输入形式,同时在分类后对所提出的事件序列流获取方法中的时窗大小及步长进行反馈调节,以保证获取与分类标准随之间变化保持一定的准确性。实验表明,本文提出时间序列流事件获取与分类方法和现有一些算法的对比分析,在执行效率及准确性方面均具有很大优势。