基于相似性分析的时间序列数据挖掘研究

来源 :温州大学 | 被引量 : 0次 | 上传用户:silvervan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,数据挖掘受到越来越多的关注,本文在综述国内外数据挖掘研究发展概况后,对时间序列的表示、距离度量,聚类等几个问题进行研究,提出一些算法和解决方案,主要包括以下两方面的内容:(1)重新定义了时间序列的元组表示模型,使该模型具有了刻画时间序列的动态变化趋势和内容的能力。通过元组序列的投影,构成了齐元组序列,定义了齐距离,解决了在元组表示下的时间序列的全匹配问题,克服以点距离为基础的时间序列匹配物理概念不明确等缺陷。然后,在DTW(Dynamic Time Warping)距离的基础上提出了TVTW(Tuple Vector Time Warping)距离,TVTW距离允许元组序列沿着时间进行错位匹配,有效的解决了时间序列伸缩匹配的问题,相对于DTW伸缩更加合理,物理意义更加明确,在实验中得到了令人满意的效果。(2)将TVTW技术运用到时间序列的聚类中,构造一个以TVTW为距离度量的HTMC(Hierarchical then K-means Clustering)聚类方法。作为HTMC的支撑,提出了元组序列的合并方法,该方法能够产生出了综合了每一类中各序列的信息的模版序列(Templet Tuple Sequence),模版序列作为聚类各阶段的类中心,解决了聚类的过程中各阶段需要计算类中心这一关键问题。推导出了TVTW下的Lower-Bounding,使得在计算较为耗费时间的TVTW之前,先通过计算Lower-Bounding形成侯选集,再进行TVTW距离的计算,有效的解决得TVTW计算量大的问题,加快了聚类的速度。最后在总结全文的基础上,说明了今后需要继续的工作。
其他文献
数字电视取代模拟电视是必然趋势,利用PC收看数字电视具有便携、使用灵活等优势。近几年来,数字地面电视广播在世界范围内高速发展,用PC接收数字电视地面广播也不断出现新技
随着高性能计算技术在社会生产生活各方面的应用日益广泛,高性能计算的性能评测尤其是性能预测在高性能计算领域内逐渐受到重视。目前研究最广泛的是使用性能模型进行预测。
无线传感器网络与其他通信网络有着截然不同的特点。针对无线传感器网络的特点和用途,开发专用的路由协议已经成为当前无线传感器网络领域急待解决的问题。 本文利用蚁群算
商务智能(Business Intelligence,BI)帮助企业实现从数据到信息、从信息到知识、从知识到利润地转化。传统商务智能系统是在原有业务系统的开发技术之上架构起来的,这些技术很
在电力行业内,低压电力载波通信以其独特的优势、稳定的使用条件与巨大的市场吸引了人们的广泛关注,并成为世界各大科研单位和公司的研究热点。与此同时,低压电力线载波通信技术
湿地是介于水生生态系统和陆生生态系统之间的一种特殊的生态系统,是自然界最富生物多样性的生态景观和人类最重要的生存环境之一。因其具有巨大的水文和元素循环功能,湿地被誉
移动AdHoc网络(Mobile Ad Hoc Network,MANET)是一种自组织、无中心化、无固定基础设备的网络,网络中的移动节点群间歇地接近其他节点的通信范围,与其他节点进行数据或信息的交换
在过去的三十年中,通信行业面临着更多的问题,比如全球用户数量迅速增长以及对高速数据传输的需求。在不久的将来,接入网中传输高速数据时,对带宽要求将会增长到多于每秒千兆比特
P2P技术是一种新兴的基于对等网络的架构。P2P通过对等体之间的直接交换实现计算资源和服务的共享。Web服务是人们针对开发分布式应用程序的又一新技术,为应用程序通信提供了
在知识经济时代,信息化应用于各个领域,高校建立起以部门应用为基础的信息管理系统:如人事管理、财务管理、图书管理、办公自动化管理、后勤管理、教务管理等系统,这些系统都是在