论文部分内容阅读
数据库是决策支持技术的关键,数据库技术的成熟也是数据仓库技术提出的基础,而数据仓库和数据挖掘技术是决策支持新技术,它将成为一体化信息支持系统的核心技术。 基于上述的各类技术,本文阐述了如何应用数据仓库的技术建立税务系统数据仓库,分析了多维数据模型、元数据,数据仓库的系统结构、技术要求。最终建立了税务系统的数据仓库。由于在税务系统当前的业务处理系统有多种数据源,本文重点给出了实现数据预处理中的数据清理、集成、转换和数据装载的相应策略。并在建立的事实表上进行了OLAP(联机分析处理)操作,通过这些操作实现数据仓库在税务系统的应用。研究了数据仓库的逻辑设计和物理设计,包括数据模型分析、多维数据库设计、数据仓库的并行处理、分区等。在全局观念的前提下,提出了一种税务系统从数据集市到数据仓库实现方法。最后,分析了数据仓库的索引技术、导入导出方法和安全监控问题。 在数据挖掘技术的研究中,论文探讨了数据挖掘的功能、分类、任务、方法技术、工具和模型;提出了应用于税务系统数据挖掘的基本过程和主要步骤;分析了数据挖掘原语、查询语言和系统结构。从理解关联规则算法和对其分析出发,研究数据挖掘的关联规则算法及Apriori算法的改进。联系税收业务,从对项集的支持度、规则的支持度和置信度的计算入手,实现了关联规则算法在税务稽查部门的应用预测,通过算法分析各类违章违法的可能性,找出各种因素之间隐含的规律,从而指导当前税收稽查实际工作。 探讨决策支持系统基本概念和功能,分析了国内外税务系统在决策支持系统方面的应用情况。在已有的税收信息数据基础上,在遵守国家总局征管法的前提下,重点设计和分析了主题模型,并提出了决策支持系统的框架设计。通过税务决策支持系统的功能分析,提出了决策支持系统能够解决四个类型的问题。最后,熟悉了在ORACLE9I中实现决策支持系统的Oracle OLAP服务的基本概念和工具,并通过主页发布和PB编程实现了数据的统计查询。 由于目前国内税务系统还没有一个完整的应用数据仓库和数据挖掘技术解决应用的方案,本文提出了一整套的实现方案,在国内税务系统具有先进性和实用性,从而有效的指导了税收工作。 本文主要的工作和贡献是: 1、系统设计和建立了税务系统数据仓库。 2、利用关联规则算法实现了在税务稽查部门进行预测的方法。 3、系统的设计了税务系统当前应用的各类主题,提出了税务部门决策支持系统的框架设计,通过Oracle9i提供的OLAP工具的使用和ASP、PB等工具的使用实现了多维数据统计查询分析的功能。