基于滑动窗口语义的聚集计算方法

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:wangfang1896
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文针对滑动窗口聚集查询问题,提出了一种基于滑动窗口语义的聚集计算方法--链树(linked-tree)算法,该算法把滑动窗口逻辑分层,记录层次内数据统计信息,具有很高的执行速度;同时,所需的内存量不与窗口大小直接相关,可以大大节省内存;此外,基于该算法的查询共享策略,可使类似的聚集操作共享相同的链树结构,进一步提高了查询处理速度并节省内存资源。
其他文献
本文提出了一个新的方法RW,对搜索引擎得到的结果做进一步处理,从复杂的Web拓扑中提取权威页面和权威社区地,实验证明,所提出的方法能得到数量少且准确的查询结果和合理的权威社区。
本文提出了一种基于模式树的挖掘eEPs的新算法eEPMiner,实验表明eEPMiner具有很好的性能,其速度比基于边界的算法快得多。eEPs具有很好的分类性能,可以用来构造准确的分类器.有效的挖掘eEPs为建立基于eEPs基分类器,从而使用装袋(bagging)、推进(boosting)等技术,进一步提高分类准确率奠定了基础。
本文提出了一种基于二元语言模型的图像语义自动标注方法,该方法基于二元语言模型的概念,通过考虑一幅图像中各个图像子区域间的相邻关系,建立图像区域与关键字之间的联合概率模型,实验显示,与传统的基于语言模型的图像标注方法相比,该方法能明显地改善标注效果。
中医学源远流长,是我们的祖先与疾病作斗争的经验结晶.几千年来,针对不同的病症积累了无数方剂,留下了众多中医学巨著.这些方剂和巨著构成了指导今天的中医工作者如何对症下药的基础.然而,令人遗憾的是,在众多的医学著作和方剂中,有少量方剂未给定方剂中单药间的比例及剂量,今天的中医工作者只能通过经验和估计的方法去开出处方,给工作带来极大的不便.哪些单药组合是这类方剂中的核心药组和药队?如何确定这类未给定剂量
本文讨论了基于时空粒度的近似区域的表示和操作方法,提供了不同粒度问的转换方法,这些理论和方法应用到国家"八六三"高技术研究发展计划项目IDPIAIS的子课题土壤时空数据库ASTD中,成功解决了多粒度数据处理、可变精度查询和时空不确定性等关键问题,该时空粒度理论还可以应用于时空数据挖掘、时空CSP、时空逻辑等其他领域。
本文提出一个并行多维视图维护方法PMDVM,它通过选择性算法将增量式视图维护和视图自维护有效地融合在一起,同时,它还利用相关性算法对不相关更新进行过滤,可以有效地降低消息总数和数据的通信量,从而大大提高视图维护的效率,为了赋予系统并行处理所有更新的能力,还利用时间戳和相关更新冗余缓冲机制来解决并发更新问题,并使用透明提交代理机制来纠正可能产生的无序提交问题,从而最大程度上保证了送交到视图维护层的所
本文提出一种基于静态滑动窗口的数据流聚集技术(SSWAT--Stream Summarization using Static Sliding Window-based Approximation Tree)。SSWAT的主要思想是,报据窗口大小和更新周期,建立一个树型结构,其中每个结点存储着这个流数据内不同区段的数据近似值。树的不同层对应着不同的更新周期。其更新周期与窗口的更新周期相联系。SSW
本文描述了DNA序列的压缩问题并简要回顾了相关工作,针对其中用(广义)后缀树寻找DNA序列中的冗余信息这一类方法中存在的问题,在广义后缀树的最长公共子串对应的路径上引入优化策略,找出当前最适于压缩的冗余子串,实验表明,用局部优化策略找出的冗余子串和2阶算术编码对DNA序列进行压缩可以有效地提高压缩效果。
本文提出了一个具有一般性的、可扩展且可定制的数据流模型RealModel,该模型突出刻画了数据流的时间特性,对数据流上的操作语义深入的分析和定义,并把数据流的数据特性和操作特性以约束的形式抽象出来,RealModel以三元组形式化描述了数据流的数据结构、数据操作及约束,此外,RealModel将关系和数据流在数据形式和操作上进行统一。
本文在原有贝叶斯网络分类器的基础上构造判定树,从而将贝叶斯网络分类器中蕴含的分类判定知识更直观地呈现给用户。将此方法应用于银行信用卡资信评估的分类分析,成功地获得了有指导意义的信息。进一步的工作包括研究构造判定树的其它的属性选择标准.更高效的剪枝策略,以及充分利用这种树的判定结果的非确定性提取更多有意义的知识如概率分类规则等的方法。