LHB-TREE:一种高效的处理数据流历史数据的方法

来源 :2005中国计算机大会 | 被引量 : 0次 | 上传用户:network_worm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文结合 web 分析与数据流,提出了一种新的树结构 LHB-TREE,可以有效地处理数据流的历史数据。HB-TREE 存储聚集函数收集的统计信息,具有存储空间小,查询速度快的优点,并在此基础上提出了历史时间粒度的概念,解决数据流系统中查询海量历史数据的问题。
其他文献
本文研究了 C6711 芯片的 VLIW 结构特点和MPEG-4算法,并根据VLIW结构特点,提出了MPEG-4算法优化技术,使用提出的优化技术,在 C6711 芯片上编解码能够达到实时要求。特别的,本文中提出的优化技术,同样可以应用于其它有关 DSP 及视频算法开发项目中。
本文提出了基于 J2EE 标准构建一种新型交互式电子政务平台的解决方案,并且针对扬州电子政务子系统——扬州市统计信息发布平台,详细的介绍了其在 J2EE 架构下的 B/S 三层体系结构、各功能模块的设计与实现,最后对系统建设中的关键技术——GISApplet 的引用、交互式设计、安全性等方面进行了阐述。
并行作业调度模拟器是并行作业调度研究的重要工具。本文针对 MPP 系统中作业调度的特点,设计和实现了一个可扩展的并行作业调度模拟器 ParaSim。ParaSim 采用资源占用矩阵来表示计算资源,使用事件驱动的模式进行模拟调度和运行,支持多种调度策略,并允许对各调度参数进行设置。ParaSim 为实际并行机作业调度调度策略的定量分析、调整和优化提供了非常有力的数据参考。
随着 Internet 和大规模 Intranet 的出现和飞速发展,软件系统之间逐渐构成一个开放协同的软件环境软件应用形态从紧耦合向异步松耦合模式转变。作为支撑开放协同环境的重要技术手段,中间件异步通信机制得到了广泛的研究。目前的相关研究集中在特定的中间件异步机制实现层面,对于这些不同异步机制之间的概念体系和本质特性的研究还比较缺乏。为此本文首先从通信机制的发展轨迹入手,讨论了异步机制的三要素;
本文研究的重点是基于频繁项集的支持度和关联规则的新颖度连续挖掘数据流上的变化。主要贡献是:(1)在利用抽样技术所获得的以元组为单位的数据流上进行概要数据结构的构建,该方法可以进一步减小问题的求解规模;(2)通过计算和比较数据流上的当前窗口与参照窗口中频繁模式支持度以及关联规则新颖度来度量和连续挖掘数据流上的变化。分析表明,提出的数据流连续挖掘方法是合理的、可行的。
本文基于多尺度函数的逼近性质,利用有限元函数的插值特性,对有限元多尺度函数满足的伸缩方程中的矩阵系数进行了推导,得到了新的结论,修正了 V.Strela 提出的构造定理。根据本文的结论可以构造任意阶有限元多尺度函数,文中给出二阶和三阶有限元多尺度函数的例子,并与其他相似的结论进行了分析比较,指出了其中的不足。
域间流量工程是目前优化网络资源的一种新技术,而 BGP 路径选择问题的研究是域间流量工程中的一个关键问题。本文建立了基于流量平衡的 BGP 路径选择问题的数学模型。在此基础上,分析与评价了当前对该问题进行研究的几类算法,指出了今后需要研究的关键问题。
对于媒体数据(RTP/UDP/IP)在使用标准IP协议栈处理时,系统中UDP数据的处理效率低会导致系统性能瓶颈。针对该问题,基于三层交换设备的工作原理,提出了网络数据分类优化处理机制——IIPS(Improved IP protocol stack)。它采用建立UDP/IP专用协议栈的方式,简化UDP数据的处理流程,构建了一种性能优异、移植性良好的方法,并实现了基于RTOS系统的产品验证。实验结果
本文通过测量网络的延迟,提出了一种网络性能的分析与评价方法,对网络性能按照延迟这个度量进行等级划分。利用 HMM 是一种不完全数据的统计模型并可实现区间预测的特点,将 HMM 的状态与网络等级划分联系在一起,由延迟的测量值序列来实现对网络性能等级的预测并实现了基于该模型的具体预测算法。通过在局域网环境的实际测量,表明该算法有很高的预测精确度,并且适用于实际的应用网络。
本文针对计算机集群系统,设计了网络负载评估和分配算法。算法中综合考虑了处理器能力和网络负载情况,对实现过程中的问题进行了详细讨论,对原型系统的测试结果显示设计算法的负载分配合理、转发效率高、调度开销小,实现了线性可伸缩。