时序数据挖掘中的相似性和趋势预测研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:cwsyydr01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列数据挖掘是从大量的时间序列数据集中提取潜在的、有用的知识,据此预测时间序列的未来。本文进行了时序数据挖掘中的相似性和趋势预测研究,主要工作如下: 首先对数据挖掘的基本理论与技术,时序数据挖掘、时序数据相似性搜索、时序数据趋势挖掘的研究现状、存在问题及其根源进行概述,综述性地说明了进行本研究的价值和意义,简述探索性分析方法等本文所涉及的理论、技术和方法。 在此基础上,详细评述时间序列相似性搜索的几种主要近似表示方法和数据变换方法,对这些方法进行分析和比较,总结这些方法的优点和不足,提出目前研究中所忽略的上述方法的准确性、一致性和漏报问题及对相似时间序列的相似程度缺乏度量的共性问题。 借鉴以往研究中对相似性定义拓展的思想,定义了一个衡量时间序列相似程度的指标--相似度,较好地表达了时间序列近似表示的度量问题。分成四种典型情况,对基于近似表示的时序数据相似性搜索的一致性、近似程度影响、ε取值、漏报四个问题进行较深入的研究,推导出相关的定理,较好地解决了上述问题,给出了能克服漏报的四种挖掘算法,最后进行了实例仿真验证。 给出变换空间、变换空间相似、变换后在原始空间的表示、收敛的变换等定义,推导出收敛的变换必不产生漏报的结论。在此基础上,对基于傅立叶变换的方法M-DFT、PAA变换法进行了研究,证明了M-FDT法、PAA变换法具有非漏报特性,并以PAA变换法的挖掘算法进行了实例仿真。 利用人工神经网络和最小二乘法各自在处理非线性关系和线性关系的独特性能,提出基于人工神经网络和最小二乘法的时序挖掘方法,并以具体的时序数据集进行测试,结果表明方法能较好地反映和刻画时间序列的未来趋势。 借鉴探索性分析方法从顶层到底层,从低分辨率到高分辨率,从粗到细的思想对时间序列相似性进行了初步研究。提出将时间序列的相似性分成粗、细分层匹配的方法,利用EMD、PAA方法提取时间序列的趋势进行趋势相似性判定,再对趋势相似的序列逐一进行判别,通过理论推导说明了方法的有效性。
其他文献
语音识别其广阔的应用前景和理论价值近年来已经受到人们的广泛重视,让计算机与人智能的进行交流并且具有简洁的交互界面,这些技术的实现都依赖于语音识别技术理论的发展。语
5月27日上午,石景山区古城街道十万平社区73名社区党员成为了北京市基层党组织建设一项创新工作的参与者。他们当场投票,从两位经过了“三推两考”的党员候选人中,直选出了
滚动轴承在工业上的应用非常广泛,其中许多还是工业和生产中的关键设备。研究、发展并应用先进的振动监测与分析技术具有十分重要的现实意义,不仅保证了滚动轴承设备安全而高
鸭绿江边,有个不起眼的村落——瓦房村。在那封闭的年代里,这里的3000多口村民,虽说勉强能凑合着填饱肚皮,可如想再脱穷变富奔小康,却难而又难。村党支部书记高玉安食不甘味
我几乎每个月都帮客户做媒体计划。广告主花钱进行投放,最看重的就是三样东西:精准、精准、再精准。因此在帮客户选择媒体的时候,我往往会建议他们考虑三个问题:第一,是否门
11月中旬,一场突如其来的暴雪横扫了中国的北方。20厘米,50厘米,70厘米。深可没膝的雪,让人裹足不前;50年一遇,100年一遇,有记载以来最高极值,暴雪不断刷新着历史的记录,银装素裹的大地给人们来了个冬天的惊喜,也给人们的生产、生活带来了严重的影响。  山西临汾也迎来了近年来罕见的一场暴雪,记者冒雪来到了平阳大地。在临汾汾河城区段记者看到,雪色茫茫,天寒地冻中,汾河城区段生态环境综合治理施工现
交流磁化率作为磁纳米粒子重要的磁学特性,不仅可以反映磁纳米粒子的磁化能力的大小,也可以反映磁纳米粒子的弛豫损耗特性。测量和研究磁纳米粒子的交流磁化率,并探索交流磁化率
粒子群算法是一种群体智能算法,通过模拟鸟类的群体行为,将寻找具体问题的最优解转化为粒子在特定空间迭代搜索过程。粒子群算法是近年来发展最为迅速的智能算法之一,在电路
目的:探讨三腔引流管肠腔内引流联合腹膜外引流预防低位直肠癌吻合口瘘的应用价值.方法:采集2010年1月~ 2015年3月河北北方学院附属第三医院普通外科同一手术组实施的221例数
巡展活动牵动万人心rn“真扶贫,扶真贫,号召社会力量真心为穷人服务,说到了百姓的心坎里”“扶贫开发活动是最温暖人心的活动”"人物展办得很好,让人们受到了感染和教育,体会