【摘 要】
:
本文针对时间序列的数据挖掘问题,研究了将时间序列转化为趋势序列,以及趋势序列中的数据挖掘问题。 文章主要涉及以下几方面的工作: 1)提出了趋势序列的定义,指出趋势序列
论文部分内容阅读
本文针对时间序列的数据挖掘问题,研究了将时间序列转化为趋势序列,以及趋势序列中的数据挖掘问题。 文章主要涉及以下几方面的工作: 1)提出了趋势序列的定义,指出趋势序列从本质上而言是一种字符串,并且应能抽象而概括地表达时间序列中我们感兴趣的信息; 2)针对时间序列转化为趋势序列的问题,讨论了转化过程中使用的趋势变换的选取问题,给出了变换的代价函数,并结合转化后的趋势序列的游程压缩表达,给出了信息描述代价的概念。进一步地,我们利用信息描述代价来指导趋势变换的选取; 3)提出了趋势相似的定义。研究了趋势序列的全匹配问题。针对小趋势指标集、高相似度阈值与低频序列的情况,我们提出了趋势分布的概念,并利用这一概念,给出了一个利用趋势分布来过滤候选序列集的全匹配算法DistFil。与已有方法相比,取得了满意的效果; 4)研究了在长的搜索序列中寻找与待查询序列相似的子序列搜索问题。同样,我们利用趋势分布的概念,给出了一个递推式的搜索算法INDIC,以及一个变步长递增算法VISL。与已有方法相比,在小趋势指标集、高相似度阈值及低频序列的情况下,取得了满意的效果; 5)提出了挖掘趋势序列中的频繁子序列的问题,给出了一个递推式的挖掘算法INAMFT,取得了较好的效果; 6)探讨了利用趋势序列对时间序列进行分类的方法,并对利用聚类进行时间序列符号化的不同途径进行了一定的比较与说明; 7)在一个实际的数据库上进行了数据挖掘工作,对数据挖掘的实际应用进行了示范,并我们的工作结果进行了一定的应用和检验。
其他文献
一直以来都对每天生活在其中的这座城市的建筑风格的美妙心旷神怡,也一直以来都很想采访一位建筑行业的精英,想听听他对我们这座城市越来越漂亮的建筑和建筑业的发展前景有什
<正>2013年1月28日,嘉兴现代物流园区管委会在上海东怡大酒店召开了嘉兴现代物流园推介会,长三角区域内几十家企业参加了此次推介会。嘉兴现代物流园管委会相关领导介绍了园
作者及所在研究团队于2012年-2017年,在黑龙江、吉林2个省,涵盖完达山、张广才岭、老爷岭总共137 085km2的研究区域内,综合运用野生动物生态调查研究技术、生态建模方法、种
国有资本划转社保基金已成为国家的一项重要政策。国内对此方面的研究主要集中在社保基金资金筹集渠道、国有资本划转的必要性、划转方式、划转的影响、最优划转率以及重大意
目前管理会计在我国企业管理中的应用正处于一个关键的转折时期,随着经济的发展,管理会计更为重要,必须加强对管理会计应用与发展的研究,寻求加速管理会计在我国企业管理中推
DC—AC逆变器是电力电子技术的重要组成部分,并已经在越来越多的领域得到应用。在一些关键的应用场合中,往往要求DC—AC逆变器的输出电压具有理想的正弦波特性。 传统的DC—
作为广州近代城市规划历史与理论研究的一个组成部分,本论文着重分析了广州近代城市化进程,考察和研究了广州近代城市规划历程演变、城市规划内容与实践、城市规划管理机构的演
本论文开发研制了瓦楞纸箱CAD系统,实现了纸箱结构选型、材料选择、尺寸参数化计算及强度校核的计算机辅助设计。在软件研制过程中完成了以下几方面的工作: 1、针对目前我国
移动机器人是目前机器人领域的研究重点之一,吸引着众多学者的注意,这是因为它有着巨大的应用潜力。把它与飞速发展的网络技术结合起来,更会显著的拓展机器人的应用范围,对人们的
ERP(Enterprise Resource Planning)是现代企业管理思想与计算机应用技术的结晶,通过ERP系统的实施可为企业在市场竞争上获得优势,并获取最大的利润。本文对炼钢企业实施ERP的物