多流时间序列结构模式发现研究

来源 :西南师范大学 西南大学 | 被引量 : 0次 | 上传用户:njxgfd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在军事、工业过程监视、医疗诊断、机器人控制、物流管理、金融经济管理等系统中,我们面临的都是复杂的多流时间序列数据,如何利用计算机技术对多流时间序列信息快速、准确地加以分析、估计,评价,优化综合,具有重要的意义。如在农业生产中,温度的变化、气压的变化、虫害的变化、粮食产量的变化组成了多个数据流的时间序列,如果能够发现这些数据流之间的关系,用于指导实际生产,对于提高产量、防治灾害,有重要的现实意义。 当前对时间序列的研究集中在单一时间序列内部关系的发现如:趋势、序列模式、相似性模式的搜索,关联规则、周期的发现等等。研究多流时序不能简单地将它割裂为单流时序,因为这样就割裂了数据流事件之间的关系。虽然MSDD能够发现多流时间序列中的依赖模式,但是由于其缺少对数据的初始化、事件之间时间关系的表示不直观、算法执行的时间空间开销很大(O(n~5))、不能够充分发现多流时间序列包含的知识,它只发现依赖关系,因此研究新的,高效,全面的发现多流时间序列事件之间关系的算法成为必要。 本文分析了单一和多流时间序列中的知识发现,把多流时间序列事件内部存在的关系表示为:关联模式、依赖模式、突变模式。本文将它们统称为结构模式,而这正是目前其它算法、没有考虑到的,虽然MSDD考虑了事件之间的依赖关系,但它忽略了突变模式,关联模式等重要的知识表示。本文给出了关联模式、依赖模式、突变模式的定义,提出了一个比较灵活全面、直观的挖掘它们的算法:时间窗口移动筛选算法TWMA(Time Window Moving And Filtering Algorithm)。该算法的一个突出特点是将时间序列事件按时间窗口序列化,使得事件之间的时间关系表示很直观,该算法能成功地从多流时间序列中发现了事件之间的关系。该算法与其它算法比较,发现的知识更丰富,时空开销小,时间复杂度为(O(n~3)),算法直观,简洁。我还用VC++成功设计了一个挖掘器,并对由医院门诊数据流、气温变化数据流、气压变化数据流组成的多流时间序列进行了挖掘,证明了TWMA是可行。 面对数据的海洋,传统的单机串行算法己经不能适应快速、实时的知识需求,研究面向多机、并行、分布式的数据挖掘模型越来越重要。本文通过分析当前主要的并行模型、算法,总结出它们面临的共同问题是:处理机容量的限制和处理机需要传输大量的数据,于是,本文在TWMA的基础上提出了PTWMA,采用了表对应技术、以及算法本身不需要反复传输大项集的策略来克服了上述两个问题。PTWMA 为分布式,并行控掘多流时间序列提供了一种有效的算法和模型。
其他文献
该文针对人脸识别中的上述两个关键问题,在分析国内外相关研究现状的基础上,分别提出了基于器官的准确,快速正面人脸检测算法和基于眼动模型的活性判别算法.论文的具体的研究
该文主要提出利用Agent和XML实现以ERP为目标的信息系统集成方案,解决目前中国中小企业中的“信息孤岛”问题.首先介绍Agent的相关概念及相关技术,然后分析它们的应用及策略,
一般情况下,无线传感器网络都是长期分布在其所监测的区域内的,往往需要在其监测过程中对其软件进行维护和功能扩展,因此对无线传感器网络进行远程代码更新也就成为了一种不可或
CAI(Computer_Assisted_Instruction)自从五十年代产生以来,一直是计算机应用领域中研究的一个热点。从CAI的发展史来看,它的飞速发展主要依赖于教育理论的转变和计算机技术的进
基于网络的应用已由传统的客户机/服务器(C/S)向浏览器/服务器(B/S)转变。浏览器/服务器模式是电子商务的技术基础,为电子商务的实施提供了简单的解决方案。目前基于B/S模式应用的实
分类器是模式识别系统的重要组成部分,也是机器学习的重要研究领域.支持向量机(SVM)是一种拳的分类器,由于能够较好的解决小样本学习问题并具有较强的泛化能力使其迅速成为目
准确的分支预测对于提高计算机的性能非常重要。由于当今世界的主流计算机大都采用超标量、深度流水的技术,控制也越来越复杂,一条指令的预测失误很可能会导致十几甚至几十周
该文在对IPv6和IPv4协议进行对比分析的基础上,着重探讨了比较重要的两种IPv6/IPv4混合组网技术--隧道技术和协议转换技术.文中详细论述了隧道技术实现的原理和模型,分析了隧
由于在“平法“施工图中采用间接的方法表示钢筋,因此统计钢筋工程量时必须根据平面图中的标注信息并结合标准构造详图才能确定钢筋的完整信息。为了实现钢筋工程量的自动统计
事务处理和并发控制一直是数据库研究和实践的重要组成部分之一.而事务调度可序列化理论无疑是事务处理和并发控制的核心理论.该文开创性地提出了从更小粒度的操作层面来研究