论文部分内容阅读
最近几年,信息决策系统越来越受到企业的重视,各行各业在提高生产力的同时,也在加强信息分析系统的建设与投入。许多企业在数据仓库方面投入了大量的财力人力,但是没有收到预期的回报,相反,运维的成本日益增大,数据的可信度却越来越低。在电信领域中,数据仓库问题尤为突出。关键的问题是数据仓库建设初期缺乏系统的理论指导和开发行为的规范性约束,导致数据量加大时数据仓库查询性能急速下降,数据仓库批量严重延时,这也是目前各大数据仓库厂商研究探讨的课题,模型的客户化也是一个重要的方向,模型的客户化包括决定模型的总体架构的逻辑模型客户化和针对特定数据仓库平台的物理模型客户化,而这两方面的设计都是需要和电信领域的业务紧密结合的,传统的模型研究都是采用了目前市面上比较普及的Microsoft SQL Server或者Oracle等产品,大部分的模型都只适用于某一方面的业务,不具有通用性,另外针对数据仓库现状进行优化工作也是一个重要的研究热点。于此同时,电信业数据采集系统的数据采集频度不同,而数据入仓时却对数据采取每天入仓的方式进行,对一些关键性,实时性的,动态的数据没有办法及时的分析处理。这目前也是传统数据仓库发展的一个瓶颈。针对以上问题,本文重点研究了基于Teradata的电信数据仓库的建模与优化。本文提出了基于Teradata电信数据仓库建模的系统整体设计方法,很好的解决了开发初期的规范问题。另外结合CLDM,完成了参与人领域模型的设计,为后续数据仓库的建设提供了指导思想,同时为CLDM建模运用到国内电信行业提供了借鉴意义,该方法有效的解决了模型的通用性。最后,针对数据仓库进行了优化,总结了P-T优化方法论,提出了一种适用于数据动态查询的TEER模型,在Teradata数据仓库优化方面具有参考意义,也拓展了数据仓库模型优化动态查询的相关理论。论文的实验结果证实了本文取得的初步效果,并且具有统计学意义。