多元时间序列流动态关联规则挖掘

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:Rqs_ToT
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于多元时间序列流广泛的存在于工业生产过程、商业活动和自然科学等领域中,因此,研究多元时间序列流中的知识挖掘是很有意义的。对多元时间序列流知识挖掘的一个重要的研究方向即是挖掘多个时间序列流之间的关联关系。时间序列流具有流数据的特点-海量性、连续性和流动性等,时间序列流中的数据和知识都会随着时间的推移而发生变化。在实际应用中,人们往往对新产生的数据中蕴含的知识可能更感兴趣。因此,本文提出了一种挖掘多元时间序列流动态关联规则的方法,这里的动态是指随时间变化而动态更新的一个过程,而挖掘出的规则体现了在同一时间段内多元时间序列流之间的关联关系。目前已有一些针对多元时间序列流关联规则挖掘的研究,这些研究挖掘出的规则类型各式各样。但大多数研究挖掘出的规则前后件中的基本元素,即只包含一个项的元模式都有着相同的时间段长度。且这些研究大多数并没有考虑新数据中的知识可能会更令人感兴趣的情况。本文提出的方法使用滑动窗口来挖掘多元时间序列流之间的动态关联规则,这种动态关联规则随时间变化且它的元模式,即那些只包含一个项的模式,在不同的规则中有不同的时间段长度,在同一规则中有着相同的时间段。当数据流流过时流数据被预处理,预处理的过程包括分段线性化近似,分割线性化后的数据使在同一时间段内每个时间序列流只有一个线段、然后增量地聚类这些线段,数据流的符号化表示以及合并处理后的数据流得到事务集以用于挖掘。在预处理后我们用一个规则挖掘方法来挖掘关联规则。滑动窗口内的模式存放在一个概要存储结构-全局的SWFI-tree中,通过定期的剪枝策略以去掉SWFI-tree中的不频繁模式和过期的模式。同时,为了区分新事务模式和历史事务模式,该方法也引入了时间衰减模型,通过一个衰减因子来减少历史事务模式的权重。通过对实际的热电厂数据的实验结果表明,该方法是有效的。可以挖掘出相应类型的关联规则,且随着时间的变化规则也在不断地变化,体现了规则的动态性。
其他文献
随着高校规模的不断扩大和管理信息化的普遍实施,学校的教学和学生管理部门都建立了自己的管理信息系统,而且都积累了大量的业务数据。为了更加充分有效地利用这些管理信息系统
随着计算机科学的快速发展与广泛应用,信息网络技术业已深入到现代教育的众多领域。与此同时,高校信息化建设的步伐也越来越快,学校内各个部门都开发出了自己的应用系统以满足校
网格计算是近几年来出现的新兴技术。建立网格可以最大限度地综合利用分布资源(数据,计算能力,存储能力等),即消除异构资源孤岛,真正实现资源共享。网格(Grid)概念的提出为基
工作流管理系统被用来在异构、分布式应用系统架构内定义和驱动业务流程,它的首要目标是要保证在业务流程的处理过程中,由合适的参与者,在合适的时间、合适的地点,利用合适的
本文对基于粗集的约简和分类方法进行了系统深入地研究。总结了现有方法,并对一些算法进行改进,进而提出了几个新的算法。主要工作如下: 首先给出了可分辨矩阵的概念及基于可
游戏引擎作为一种新的游戏编程模式,在一定程度上提高了游戏开发的效率。游戏引擎中的资源管理是对各种资源进行统一管理并提供统一接口的组织方式,它是游戏引擎中的重要组织
集群通信系统是多个用户共用一组无线电信道,并动态地使用这些信道的专用移动通信系统。MPT1327 是专用信令信道集群移动通信系统的一种公开的典型信令。MPT1327 是一种模拟
由于传统的SPC要求控制特性满足相互独立并服从正态分布等前提条件,造成了SPC的局限性。针对SMT中的一些特殊问题,本文进行了探索,改进了传统的SPC,使之能较好的控制这些特殊的问
信息科学发展到今天,企业对可以在线访问及不断更新的数据的依赖达到了前所未有的程度。不可预计的事件可能会限制数据的访问,严重地影响企业的运营。而且,自然灾害等事件会
本文描述了线性可分与线性不可分支持向量机以及支持向量机如何利用核方法来解决非线性问题。同时,还讨论了支持向量机的训练算法以及惩罚参数不对称的支持向量机。由于支持