时间序列的线性化表示研究

来源 :辽宁师范大学 | 被引量 : 0次 | 上传用户:A578964735
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会经济、计算机信息技术和存储技术的不断发展,在日常生活和科学研究领域中,逐渐积累了大量的有重要参考价值的数据。如何从这些宝贵数据中挖掘出我们需要的知识已经成为数据挖掘领域研究的热点问题。时间序列作为一种重要的按时间先后顺序排列的数据形式,反映了属性值在时间或空间顺序上的特征。时间序列的分类、聚类、异常检测、建模、相似性查询等操作可以实现有价值知识的提取。目前时间序列数据挖掘是数据挖掘中的一个重要研究方向。由于时间序列具有数据量大、噪声干扰严重和短期波动频繁等特点,直接在原始时间序列上进行相似性查询、分类聚类、模式挖掘等操作,很难得到满意的结果。因此,开展时间序列的降维研究是十分有必要的。许多学者提出了时间序列的线性拟合、线性分段等降维方法,在刻画时间序列主要形态的同时,忽略那些微小的细节,把握局部特征,从而保持了序列主要特征的不变性,极大提高数据挖掘的效率,达到简化计算量的目的。本文通过对时间序列线性表示的深入研究,开展了如下的研究工作。(1)提出了一种精确的时间序列线性拟合方法。算法首先通过判断连接相邻点所成线段的斜率变化来选择时间序列中的转折点,然后将这些点与时间序列的极值点合并作为关键点,用这些关键点组成的序列拟合原时间序列。这种线性拟合算法在剔除了噪声的同时,能更精确的定位时间序列中的关键点。实验结果表明,该方法能更好的近似表示原时间序列。和已有的方法相比,该方法拟合后的时间序列和原时间序列之间的拟合误差更小。(2)给出了一种基于函数的时间序列分段线性表示方法。考虑到时间序列的时间特性对于不同区段的影响,以及时间序列数据动态增长的实际情况,在RPAA(Reversed Piecewise Aggregate Approximation)和PAA(Piecewise Aggregate Approximation)方法的基础上,提出了一种新的时间序列分段线性表示方法FPAA(Function Piecewise Aggregate Approximation)。FPAA方法通过定义函数影响因子,克服了RPAA和PAA方法的不足。此方法满足下界定理,并且支持时间序列的在线划分。实验表明,与PAA方法和RPAA方法相比,所提出的方法可以比较有效的进行时间序列的在线查询。
其他文献
推荐系统是应用在电子商务系统中的一门非常成功的技术,它能有效缓解由于互联网飞速发展所带来的信息超载问题,并根据人们的行为、偏好等特点从海量数据中挖掘用户的潜在需求
现如今,网络通信的快速发展和电子商务活动的蓬勃兴起,各种网络设施也与之进步。数据库,作为信息的存储系统,是IT设施的基石之一,为用户提供了数据存储和共享服务。为了获得
安全多方计算(Secure Multi-party Computation, SMC)是研究多方协作计算问题的,即互不信任的两个或多个用户能够进行协作计算某项计算任务,并且保证自己的私有输入是安全的
与传统的静态数据相比,现代数据多以数据流的形式产生和积累,数据类型方面也越来越常见到多标签类型。数据形式与类型的变化无论对单标签数据流分类还是多标签数据流分类都提
最近几十年,随着计算机技术的迅猛发展,对于分布式多智能体系统(MAS: Multi-agent System)的研究和应用已经成为以人工智能为主的众多相关学科的研究重点。RoboCup即机器人足
RCP (Rich Client Platform)是基于Eclipse开发平台而推出的一套用来开发富客户端程序的应用框架,其主要功能是能够为开发人员提供一个快速的、功能强大的、具有良好扩展性的
计算机网络技术与多媒体技术的快速发展,很大程度上促进了通信技术综合化、数字化、智能化、个人化的发展,使得在单一网络平台上实现语音、数据、图像等多种业务成为可能。综合
图像阈值分割是图像处理领域中的一个经典的基本问题,至今仍是国内外研究热点,同时也是一个研究难点。在实际系统中,图像中的目标和背景之间并不具备截然不同的灰度,受不均匀光照
随着数字时代的到来,传统的模拟媒体内容逐渐朝着数字方面转变,由于数字媒体非常容易被传播、复制与修改,这让盗版者提供了很好的机会,然而,也同时损害了原始作者的利益。因
随着网络的大规模覆盖,浏览网络新闻已成为大家了解社会动态的一个重要渠道,新闻搜索引擎不可或缺。然而,虽然网络如一本无所不包的百科全书,由于当前搜索引擎技术仍处在革新