时间序列流数据异常检测问题的研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:houtou27
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列流数据(Streaming Time Series)其特性不仅与时间有关,而且海量、高维和实时更新的特性使得该数据挖掘问题难度加大。而时间序列流数据又往往与日常生活息息相关。所以时间序列流数据的异常检测问题已成为当前数据分析与挖掘的热点问题。为此本位针对时间序列流数据异常检测开展了研究,其主要工作内容如下:(1)本文提出了基于边缘计算的分布式时间序列异常检测模型。利用边缘计算的大数据处理思想,尽可能的将相应的数据在接近数据源的计算资源上进行相应的处理,在减轻网络传输带宽压力的同时,提高了数据处理的整体效率。在分布式数据异常检测模型的基础上,本文提出了基于时间序列的异常检测算法(Anomaly Detection for Streaming Time Series,ADSTS)。本算法将根据时间序列数据的离群距离测算以及时间序列之间的相关性对时间序列中的异常时序点进行检测。实验结果显示本算法性能良好,检测时间短并且异常检出率高。(2)本文提出了基于改进的符号化特征表示方法FD-SAX的时间序列异常检测方法(Time Series Anomaly Detection Based on FD-SAX,TSAD-FD)。TSAD-FD在时间序列特征表示的基础上,构建增强查找树对时间序列中的异常序列进行有效识别。实验结果显示本算法在保持检测精度的基础上,相应搜索剪枝率以及整体的异常检测效率均优于同类的对比方法。(3)本文提出了基于分段聚合(PAA)特征表示以及高维时间序列流数据索引结构(High-Dimensional indexing for Time Series,HDITS)的K近邻连接异常检测算法。PAA特征表示可以帮助HDITS避免出现因为“维度灾难”而造成的检索性能急剧降低的问题,而HDITS可以迅速对不相似的序列进行有效地剪枝操作,从而加速异常检测的搜索效率。实验结果表明本算法在保证搜索精度的同时,能够对某个具体时刻或者某个时间范围内的异常序列进行高效检测,即能够保证被检出的异常模式序列具有一定的“时效性”。
其他文献
拥有流利的口语是大多数语言学习者学习外语的最重要的|1标之一。传统的语法翻译教学法(Grammat-Translation),3Ps(Presentation,Practl’ce and Production)教学法,即以引入,练
本文采用实验语音学的方法及音系学理论对邯郸的方言进行了详细的描述和分析。 论文主要分三部分。第一章为第一部分,用于简要介绍邯郸方言的声韵系统及其主要特点,并回顾了
《型世言》是明代陆人龙创作的一部优秀白话短篇小说集,所记皆为明代时俗、世事,语言别具特色,能较典型地反映出明末的时代特征。《型世言》所提供的语言材料对近代汉语的研究具
现代汉语的各类结构中,定中结构是一种非常复杂的语言形式:它与词类的关系错综复杂,造成了它可能与主谓结构、状中结构内部同形。这一复杂性也使得它成了“语言理解”的一个重大
<正>随着养猪业的发展,规模化猪场的生产管理在逐渐趋于标准化和精细化。管理的精细化促使养猪生产效率逐渐提高,但养猪利润却随之下滑。养猪界的各企业或者个体为实现持续的
会议
本论文首先从广告历史和广告语言入手,对以往的研究成果(主要是体裁方面的)进行了回顾和总结:然后切入广告的重要分支——约会广告,对其进行语篇分析。本论文主要采用Halliday的
光绪二十一年(1895年),广西按察史胡燏棻(1840~1906)在《创办邮政以删驿递》奏折中提出:"查泰西各国,莫不由国家设立邮政局,往来函牍,公私一体,权其分量之轻重,定给寄费之多
冗余是指交际中多余的信息。在信息传递过程中,人们往往要发出比正确理解最低需要量多得多的信息。多出最低需要量的那部分信息就是冗余。冗余是语言中一种常见的现象,同时也是
对隐喻所进行的任何研究不可避免要从对隐喻进行严密、准确的辨识开始,以使其区别于其他非隐喻性语言。但是,如果以概念的形式去确认隐喻,以一些必要、充分条件来判定隐喻,显然会
随着我国经济的飞跃发展,高等职业教育在我国规模日益增大,我国目前有1200多所高职院校,这是世界上规模最大的职业教育体系。预计到2020年,高职院校在校生将达到1480万人。职