时间序列数据挖掘研究与应用

被引量 : 0次 | 上传用户:chensiren
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,数据挖掘受到越来越多的关注。本文在综述国内外数据挖掘研究发展概况后,对时间序列的表达、搜索等几个问题进行研究分析,提出一些算法和解决方案,取得一定成果,主要包括以下内容: 1)提出时间序列的趋势表示模型,可以有效刻画时间序列的动态变化趋势。通过趋势投影,实现时间序列趋势距离的快速计算。序列趋势距离方法克服以点距离为基础的时间序列误匹配以及物理概念不明确等缺陷。对应时间序列线性分段数目的不同,序列趋势距离具有基于时间的多尺度分析特性,可以有效反应不同分析频率下时间序列的相似程度; 2)采用相对点平均残差衡量Bottom_Up算法划分的子序列线性度,提出子序列线性度概念和一种双误差阀值改进算法,大大提高了趋势序列模型的准确性。并分别对人工数据和股票指数进行仿真计算; 3)通过分析相邻子序列趋势距离的相似性,提出一种变步长趋势子序列快速搜索算法。和已有的方法相比,在空间和时间性能上都取得了令人满意的结果。对结果冗余集合进行分析,并提出一种简单的解决方法。在模拟数据上进行仿真实验,并对结果进行分析和讨论; 4)将Dynamic Time Warping理论运用到实际工业过程数据处理中,解决由于反应时间、采样时间的不一致以及在间歇过程中,类似变化过程的采样数据长度互不相等而无法实现相似性趋势序列搜索问题。提出用趋势变换序列DTW距离做筛选的搜索方法,有效提高整个搜索效率,并在模拟数据库上进行仿真实验,并对实验结果进行分析和讨论; 5)以Borland C++Builder和Matlab为开发平台,设计一个进行关联规则挖掘的准系统I_Miner,可以实现数据预处理,数据变换和关联规则挖掘等工作。并应用上述部分算法,用I_Miner对一实际化工装置生产数据进行关联规则挖掘。 最后在总结全文的基础上,指出了时间序列数据挖掘有待深入研究的若干个问题。
其他文献
信息在证券市场运作和功能发挥过程中起着核心作用。维护信息公平,提高信息效率,是保障投资者利益,实现资源优化配置的关键所在。盈余预告制度贯彻了监管当局崇尚的高质量信息披
本研究以我国东北过伐林区吉林省汪清林业局金沟岭林场为研究区,从景观和林分两个层次探讨实现森林可持续经营的空间途径。研究方法包括:非线性多目标整数规划、GIS技术应用、T
在普通话水平测试过程中,许多应试人出现紧张、焦虑、怯场等反应,究其原因是因为应试人平时准备不充分、心理素质差、消极的自我评价带来的负面影响和一些不良因素的干扰等。
由于勘察设计施工和业主使用等方面的原因,常常会给建筑物造成不同程度的隐患与损坏,致使建筑物发生种种病害,如开裂变形、弯曲扭转、不均匀下沉和倾斜破坏等,不仅使建筑物丧失正
自由落体运动是匀变速直线运动的特例。通过对自由落体运动的研究,一方面是对前面知识的复习和巩固,也加强了课本知识与实际生活的联系;另一方面通过研究物理问题的基本思路
基于2016年2月、5月、8月和10月的水质监测数据,采用综合营养状态指数和营养状态指数对东坡区10个乡镇饮用水水源地进行了富营养化评价与分析。结果表明:各乡镇饮用水水源地除
香港的双语现象一直是许多语言学家感兴趣的话题。今年七月一日,我国将恢复对香港行使主权,为庆贺香港的回归,同时也为了引起人们对香港回归后语言问题的关注,本刊特发表王德春教
针对目前油田抽油机的应用现状,采用场路结合的方法设计出与塔架式抽油机相匹配的开关磁阻电机,并对电机的调速性能进行分析,验证了设计的合理性。最后,对抽油机与电机系统的实际
目的低剂量甲氨蝶呤长期使用可引起甲氨蝶呤相关性肺炎。本文就1例儿童甲氨蝶呤肺炎的诊治过程结合复习文献探讨本病的临床特点,诊断治疗及相关进展。方法通过1例急性淋巴细
当今社会信息的爆炸性增长必然促使光网络的向更高速、更大容量方向发展。随着光纤通信技术的发展和密集波分复用(DWDM)系统的应用,全光交换已经成为当前光网络的发展趋势。全