论文部分内容阅读
近些年,数据流逐渐成为越来越重要的数据类型。数据流终的数据不同于传统的数据库中的数据,因此数据流中的数据处理和管理方面的技术需要重新被考虑;这开拓了一个崭新的研究方向。另外,随着多年的OLAP技术的研究和发展,OLAP已经起到越发重要的作用。现有的OLAP技术只是基于有限的、静态的、持久稳固的、历史的数据;而数据流联机分析处理是基于无限的、连续的、快速变化的流数据。那么数据流联机分析处理技术的研究将是一项具有挑战性的任务。 本文主要研究了数据流联机分析处理技术。首先,本文研究了数据流的滑动窗口大小控制方法和窗口更新技术。它们很好地适应了数据流的多样流速情况。本文提出了一种基于静态滑动窗口的数据流聚集技术。它能够有效地实现细节性数据流上的近似查询。第二,本文研究了时间序列数据流的回归分析技术。该项研究包括以下几方面:(1)时间序列数据流的一元线性回归模型的创建技术和回归模型的应用;(2)多个线性回归方程的聚集技术。本文的实验分析展示该技术能够有效地产生时间序列数据流的回归模型,快速地完成数据流的回归分析。第三,本文提出了多粒度时间维的设计思想,定义了两个关键子模型,并阐述了基于先验路径的钻取技术。基于上述三项研究,本文研究了一种数据流上部分物化多维数据模型的设计与实现。性能分析表明该设计能够有效地利用了有限的存储资源。最后,基于以上算法,本文提出了一个数据流联机分析处理原型系统的总体设计,并给出了实验结果。