数据流上滑动窗口技术的研究与实现

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:ilovelp222222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出一种基于静态滑动窗口的数据流聚集技术(SSWAT--Stream Summarization using Static Sliding Window-based Approximation Tree)。SSWAT的主要思想是,报据窗口大小和更新周期,建立一个树型结构,其中每个结点存储着这个流数据内不同区段的数据近似值。树的不同层对应着不同的更新周期。其更新周期与窗口的更新周期相联系。SSWAT的近似树高度求解如下:已知窗口大小N和更新周期为T的情况下,那么树的高度H可以通过以T为底,对滑动窗口的大小N取对数来获得,SWAT和SSWAT两种技术的差异在于:前者的窗口更新周期为一个时间单位,后者的窗口更新周期为多个时间单位,SSWAT很好地适应数据流的流速多样性。
其他文献
本文提出了新的、描述能力更强的函数挖掘对象--频繁函数集(frequentfunctionset,FFS),提出了可配置的频繁函数集挖掘算法CFFSDA,它灵活、可以配置使用多种搜索算法,分析CFFSDA的不足,引入基于约束的频繁函数集(constrainedFFS)概念,它可以满足用户的不同兴趣需求,提出了基于约束的频繁函数集挖掘框架。
胜利油区主要探区已基本实现三维地震资料覆盖,但多为历年积累的小区块三维,不利于探区的整体评价和认识.本文系统地分析了胜利桩海地区三维地震资料大连片处理的地质效果,认为其具有资料的信噪比高、分辨率较高、拼接自然、所反映区域构造合理、断裂系统较清晰、超覆与尖灭等地质现象清楚等优点.连片处理资料消除了区块边界效应,有利于构造整体评价,有利于区域沉积相的系统研究,并可节省大量再次采集资金.
本文阐述了基于CWM模型的针对ETL领域的元数据管理解决方案,依据该方案实现了一个原型系统:MFTL,该系统能够基于CWM标准模型化来存储管理元数据,从而为不同系统之间的元数据交换提供了可能。
本文主要讨论了主题数字图书馆中元数据组织模式及实现方法,给出了一个较为规范化的转换流程。本方法较好地解决了主题数字图书馆中元数据组织存储方式问题,并已被成功地应用到科技部“敦煌学数字图书馆”项目中,而且对其它数字图书馆的建设具有借鉴价值。
本文提出了一个新的方法RW,对搜索引擎得到的结果做进一步处理,从复杂的Web拓扑中提取权威页面和权威社区地,实验证明,所提出的方法能得到数量少且准确的查询结果和合理的权威社区。
本文提出了一种基于模式树的挖掘eEPs的新算法eEPMiner,实验表明eEPMiner具有很好的性能,其速度比基于边界的算法快得多。eEPs具有很好的分类性能,可以用来构造准确的分类器.有效的挖掘eEPs为建立基于eEPs基分类器,从而使用装袋(bagging)、推进(boosting)等技术,进一步提高分类准确率奠定了基础。
本文提出了一种基于二元语言模型的图像语义自动标注方法,该方法基于二元语言模型的概念,通过考虑一幅图像中各个图像子区域间的相邻关系,建立图像区域与关键字之间的联合概率模型,实验显示,与传统的基于语言模型的图像标注方法相比,该方法能明显地改善标注效果。
中医学源远流长,是我们的祖先与疾病作斗争的经验结晶.几千年来,针对不同的病症积累了无数方剂,留下了众多中医学巨著.这些方剂和巨著构成了指导今天的中医工作者如何对症下药的基础.然而,令人遗憾的是,在众多的医学著作和方剂中,有少量方剂未给定方剂中单药间的比例及剂量,今天的中医工作者只能通过经验和估计的方法去开出处方,给工作带来极大的不便.哪些单药组合是这类方剂中的核心药组和药队?如何确定这类未给定剂量
本文讨论了基于时空粒度的近似区域的表示和操作方法,提供了不同粒度问的转换方法,这些理论和方法应用到国家"八六三"高技术研究发展计划项目IDPIAIS的子课题土壤时空数据库ASTD中,成功解决了多粒度数据处理、可变精度查询和时空不确定性等关键问题,该时空粒度理论还可以应用于时空数据挖掘、时空CSP、时空逻辑等其他领域。
本文提出一个并行多维视图维护方法PMDVM,它通过选择性算法将增量式视图维护和视图自维护有效地融合在一起,同时,它还利用相关性算法对不相关更新进行过滤,可以有效地降低消息总数和数据的通信量,从而大大提高视图维护的效率,为了赋予系统并行处理所有更新的能力,还利用时间戳和相关更新冗余缓冲机制来解决并发更新问题,并使用透明提交代理机制来纠正可能产生的无序提交问题,从而最大程度上保证了送交到视图维护层的所