时间序列相似性查询研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:haolong12345
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列数据广泛存在于金融、工业、医疗、交通、气象等各个应用领域,为了实现针对该类数据的应用目标,学术界提出了许多时间序列数据分析和挖掘方法,如相似性查询、聚类、分类、预测、异常检测、关联规则挖掘等。其中,相似性查询是许多分析和挖掘方法的基础,在研究领域具有重要的地位。  时间序列相似性查询在过去二十年间得到了广泛的研究。随着大数据时代的来临,过去提出的相似性查询方法正面临着严峻的挑战。同时,日新月异的信息技术催生了许多崭新的应用场景,使得过去的方法难以满足如今种类繁多的应用需求,因此,对时间序列相似性查询的研究仍然具有较大的理论价值。本文针对时间序列相似性查询的若干关键问题,如数据表示、相似性度量、子序列相似性查询、数据流子序列匹配等,获得了如下创造性的研究成果:  1、提出了一种时间序列分段统计特征表示方法,以及相应的分段近似动态时间弯曲距离,可抽取时间序列较充分的局部信息用于高效高精度的动态时间弯曲度量。另外,还提出一种数据自适应的分段方法,以扩展上述度量方法的领域适用性。  2、提出了一种基于切比雪夫因式分解的分段数据表示方法,以及相应的分段近似动态时间弯曲距离,可抽取时间序列的局部波动信息用于相似性度量,在某些应用领域实现了较高的度量精度。同时,提出了一种基于分段近似动态时间弯曲的数据流子序列匹配方法,可支持分段动态时间弯曲距离在高速动态数据流上的增量式计算,实现了较高的子序列匹配效率。  3、提出了一种基于分段近似动态时间弯曲的子序列相似性查询模型,可支持对任意长子序列的索引和查询,并且在完备查询的基础上,实现了较高的查询效率。
其他文献
随着超大规模集成电路的发展,处理器性能不断提高,访存系统的性能与处理器运算能力的差距越来越大。现代多核处理器设计成为主流,对内存访问带宽提出了更高的要求。为此,提高内存
随着网络带宽的快速增加和E-Science中对大量科学数据传输的需要,很多长距离高速网络相继出现,并在诸多领域发挥着重要的作用。但现有的TCP协议作为广泛使用的传输控制协议也面
学位
地理定位设备的普及和地理信息技术的发展使得地理标注服务日渐流行。另一方面,随着新媒体时代社交分享观念的不断渗透,用户们越来越乐于将所创作的图片、视频、文字等内容通过
化学杀虫剂在害虫防治中产生的负效应已经引起人们的广泛重视,生物控制在控制种群数量方面已成为研究的热点。其中“害虫—天敌”系统的研究是开展生物防治和害虫管理的理论基
计算机支持的协同工作(CSCW)在互联网时代取得了突飞猛进的发展,基于互联网的协同工作环境对于当代科学研究活动有着重要的意义和作用。如何在归纳科研活动共同特点和科研人员
学位
从知识发现概念的最初提出开始,数据挖掘理论和技术在短短十年左右的时间里得到了迅速发展。其中,数据概要分析(data summarization)是一类重要的描述性数据挖掘任务,它的目标在
激光具有普通光源所不具有的特性,即单色性、相干性、方向性、高亮度。激光这些特有的优点,使其在几乎所有的医学领域和激光加工领域得到应用。目前长脉冲激光(脉冲宽度为毫秒
多屏幕显示在军事和民用领域有着十分广泛的应用。随着数字化作战模式的发展,在未来的机载、舰载、装甲车辆等武器系统中将越来越多的引进多窗口和多拼接屏幕等显示技术,为作
学位
随着科学技术的进步与航天活动的迅速发展,深空探测越来越受到人们的重视,其中行星际轨道设计与优化技术是实现深空探测任务的关键技术之一。与近地卫星的轨道设计相比,行星际轨
线性分类器虽然是模式识别中最简单的一类,但在许多问题中往往能取得比较好的结果,由于其简单容易实现,对资源要求低而被广泛应用。  Fisher线性判别式(FLD)给出了权向量的求