论文部分内容阅读
房地产数据仓库中存储大量历史数据,OLAP对此历史数据进行复杂的查询,查询优化是提高OLAP响应速度的关键。目前,最有效的方法是增加综合数据的存储,但存储空间限制了综合数据的存储量。本文从数据仓库的概念模型和逻辑实现两个层面对系统优化问题进行了深入细致的研究,得出一个有意义的数据立方体优化方法。另外,对于房地产数据来说,常用的统计预测模型不够精确。为了准确地对房地产投资盈利情况做出预测,文中对灰色模型进行优化,提出一种新型的高精度时间序列预测模型。
首先,定义了一种多维数据模型,并从理论上证明了当所有维的结构满足有界格特点时,该多维数据模型的结构也是有界格,为基于搜索格结构的优化方法奠定了理论基础。
接着,文中提出了一种分库变粒度动态物化策略,将大量访问率低的详细数据存储在备份数据仓库上,并将这些数据聚集成粒度相对较粗的综合数据,存储在聚集数据仓库中供OLAP查询处理。同时,采用了动态调整算法,根据OLAP查询分析所读数据的频率来调整需要在聚集数据仓库中集成的常用数据。
最后,根据房地产数据的特点,文中提出了称为马尔可夫傅立叶灰色模型的预测方法。该方法使用最近的一组数据建立灰色模型,然后用傅立叶序列修正该灰色模型的残差。最后,用马尔可夫矩阵表示残差的全局信息。克服了全局预测效率较低和局部预测准确性不够的问题。
实验表明,采用上述优化方法后,系统的处理和查询速度都有较好的改善,预测精度有较大提高。