论文部分内容阅读
当前,数据库的应用越来越广泛,并朝着大型化复杂化的方向发展,对数据库的性能要求也越来越高。如何充分利用现有的软硬件资源,获得最大的数据处理能力成为数据库应用中的一个重要课题。利用物化视图和分区技术提高数据库的性能是本文研究的目标。论文以贵州省地税局省级数据集中项目为研究背景,针对该项目的特点:数据信息量达到了千万以上,例如贵阳市的应征税收表的数据量就有42,066,496,而且数据每月的增长量也在万条以上,仅以六盘水一地的税收业务表为例,2010年6月六盘水地区的入库税收数据为89,755条,应征税收的数据为126,745条;业务系统复杂多变,在省级数据中心上建立的大型应用平台,包括有“基础应用查询”、“规范统计报表”、“决策支持查询”等。其中规范统计报表每月都需要产生近143张业务报表,这些报表都是对各个地州市局税务信息的汇总和比较,能实时为税务局的领导层提供税收信息,并按照业务需求进行统计和比对,由此可见数据库的性能压力是很大的。因此,本文研究的重点是将分区技术与物化视图技术相结合,利用物化视图的分区和多级物化视图对数据库系统进行优化。同时,在省局数据集中项目中,利用物化视图技术对9个地州市局数据信息进行ETL的数据抽取,通过创建多级物化视图实现数据的汇总。研究工作主要涉及以下几个方面:1.本文对物化视图和分区技术作了详细阐述,详细介绍了Oracle llg版本下的物化视图和分区技术实现的机制和原理。2.通过对物化视图和分区技术的深入研究,结合项目的实际需求,提出了建立两级分区和物化视图与分区技术相结合的优化手段,以及利用物化视图实现ETL的数据抽取和通过建立多级物化视图实现数据汇总。3.结合作者参与的贵州地税省级数据集中项目,给出了物化视图和分区技术在实际运用中的策略和实现方式,并测试了使用物化视图和分区技术后对优化数据库性能方面的成效,从而验证了物化视图和分区技术以及这两种技术的结合使用对数据库性能优化方面的可行性和有效性。