基于值半径复函数的时间序列表达研究

来源 :南京财经大学 | 被引量 : 0次 | 上传用户:a234917658
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列数据挖掘已经受到越来越多的国内外学者和专家的关注,因为时间序列中潜在隐藏着有用的规律和信息,人们希望能获取这些信息来预测未来以及进一步了解事物发展。然而时间序列具有海量复杂、短期波动频繁、易受噪声干扰等特点,使得直接在原始数据上进行挖掘不但效率低下,而且往往也难以获得满意的结果。因此需要对时间序列进行重新表达,以更好的进行数据挖掘算法。本文是在总结前人方法的基础上,提出了一种基于值半径复函数的时间序列表示方法。该表示方法首先将时间序列表示成值半径复函数,然后用该函数的傅里叶变换系数构成描述时间序列的特征向量,那么在相似检索时,只需计算两个时间序列各自特征向量的欧氏距离就可以度量两个时间序列的相似性。该方法的关键就在于值半径复函数的构造。本文是将时间序列数据值作为复函数的实部,将每个序列点的带正负号的半径作为复函数的虚部,而半径定义为该点到左右某个窗口大小的两点连线的垂直距离。另外还对具有特殊性的首尾几个点和波峰波谷点给予了特别处理。本文提出的这个表示方法是希望通过值半径复函数的实部保存时间序列的全局信息,而虚部包含了局部特征信息。因此值半径复函数能很好的保留时间序列的有效信息,而且通过傅里叶变换能极大的压缩数据,同时也便于欧氏距离的度量。本文的第四章还用实验验证了与其他几个使用较广泛的表示方法相比,值半径复函数表示方法不管在时间序列分类效果还是分类稳定性方面,都具有明显的优势。
其他文献
蛋白质是构成生物体的重要物质基础,生命现象主要是通过蛋白质的结构和功能来实现的。掌握蛋白质的各种属性对于理解蛋白质功能,了解生物体内各种生化反应、基因表达,以及具有针
Ad Hoc网络是一种由许多带有无线收发装置的移动主机组成的多跳自治系统,它不需要预先布设网络基础设施就能快速组网。近年来随着无线通讯技术的发展和个人便携设备的普及,人
文本分类是数据挖掘中一个常见的研究热点方向,K-最近邻分类方法是一种用实例解决问题的分类方法,在向量空间模型下,是一种比较好的文本分类方法。其主要步骤有:文本预处理,特征选
目前增强现实技术在移动端的应用研究还处在初始阶段,与PC端的实现相比,移动端的计算能力较弱,如何利用移动设备中有限的资源实现增强现实系统高效的运行,是目前急需解决的问
互联网技术的蓬勃发展带来的是网络媒体的应运而生,微博凭借其信息发布的实时性、平台多样性和内容的草根性,在短短几年之内迅速取代传统媒体,成为人们社交生活中使用最多的
当今的时代是信息化的时代,随着计算机和网络的迅速发展,在日常生活中会产生越来越多的数据。人们在享受信息化网络系统带来便利的同时,也遗憾有非常多的信息被淹没在了数据之中
随着信息技术和互联网的蓬勃发展,企业组织业务系统的迅速发展,诸如OA、论坛、ERP等越来越多的业务系统和网站应运而生。同时,各种支撑系统和用户数量的不断增加,网络规模迅速扩大,由于技术的需要,用户只有在每个系统的用户数据库中登记相应的个人信息并成为注册用户后,系统才能更好地为用户提供更为个性化的服务。这带来了一系列问题,如安全性、效率低下和无法统一制定访问控制策略等。因此有必要构建一个统一的身份认
随着Java平台的不断发展,和其良好的跨平台特性,越来越多的应用系统、嵌入式系统采用了Java应用平台,应用领域不断扩大。不过Java虚拟机虽然具有很多优点,但是运行其上的应用
随着通信技术和计算机技术的日益发展和普及,计算机网络已经成为了人们生活和信息交换的重要手段。网络信息安全显现的问题,已经影响到个人和公司的切身利益。面对越来越严重的
近年来,全局优化问题越来越受到人们的重视,不管是在社会生活中还是在科研实践中,对全局优化的研究已经成为一个较重要的研究热点。然而,传统的确定性优化算法很难甚至不能求解高