论文部分内容阅读
随着信息技术发展的日新月异,有效的管理运营过程中产生的大量数据一直是信息处理系统研究人员面临的重要课题,本文以国税电子申报系统为背景,研究对采集到的海量数据如何进行处理和运用问题。本文详述了在构建数据仓库过程中的几个关键技术:数据抽取、数据表现和数据存储管理。国税数据仓库系统的设计采用了多层结构,它有两个源数据库,其中国税申报数据库是本系统主要数据源,利用数据驱动的方法,对数据仓库的纳税申报主题进行分析和设计,通过查询、优化技术、数据仓库索引、中间库的设计以及利用中间库的自动更新来提高数据仓库的总体性能。本文在数据仓库实施过程中,对元数据的建立和管理进行了讨论。利用人工神经网络的数据挖掘技术一直是最热门的话题,在海量数据中如何发现有价值的信息一直是人们讨论的重点,人工神经网络的数据挖掘技术应用于国税系统,本文提出了与国税业务相关的数据挖掘主题,着重分析了总体申报情况模型,利用模糊解法成功地实现了对报税总体情况的描述。数据仓库的建立是一个不断完善的过程,在论文的最后对国税数据仓库系统的未来提出了展望。