数据挖掘技术在税收征管决策中的应用

被引量 : 0次 | 上传用户:Eltonxin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前,数据挖掘研究发展十分迅速,税务系统的信息化建设也正由扩张走向集成和数据管理阶段。但是,数据挖掘在税务系统的应用尚处于起步阶段。因此,研究数据挖掘技术在税务系统的应用,具有重要的理论意义和现实价值。 本文主要工作是:(1)讨论了数据挖掘中的数据预处理和数据集成技术,研究了关联规则的挖掘方法。(2)结合税收征管数据,给出了数据预处理和数据集成的实例方法。(3)针对国家税务局的征管软件等多个管理信息系统产生的实际数据,进行了关联分析算法的应用研究和实例计算,并分析了Apriori挖掘算法的计算效率。 本文主要进行了以下的研究: 第一章:介绍了税收业务的背景知识和数据仓库及数据挖掘技术在税务系统研究和应用的现状,分析了数据挖掘在税收系统的应用前景,讨论了如何在税务系统应用数据仓库和数据挖掘技术。 第二章:阐述了对数据挖掘理论知识的认识,分析了数据挖掘技术的定义、研究内容和本质、功能、常用技术和流程以及当前数据挖掘的研究方向。 第三章:分析了数据预处理方法,讨论了如何将多个关系数据库的数据集中,并在集中过程中实施清洗、集成、转换、消减等数据预处理,并给出了实例分析。 第四章:讨论了关联分析关系方法,研究了Apriori算法及其优化途径,对上一章生成的数据集进行了实例计算,并进行了性能分析。通过对挖掘出来的关联规则的分析,证实了可以使用数据挖掘技术提升税收征管决策水平。 第五章:归纳总结,提出进一步的研究方向。 本文的工作的主要特色如下: (1) 通过对数据挖掘有关理论比较分析,讨论了相关数据挖掘算法和工数据挖掘技术在税收征管决策中的应用程技术理论,实际分析了一个数据挖掘关联分析(知riori算法)全过程的案例,为税收行业如何有效开展数据挖掘工作提供了新思路和新方法。 (2)本文以数据挖掘中关联规则的挖掘方法为主要研究内容,讨论了税务系统,如何结合现有的管理信息系统,利用关系数据库的所提供的数据操作、关系运算的能力对大数据集实施数据预处理,实现数据集成,并给出了一个关系数据库数据预处理的一个实例分析。关键词:数据挖掘,关联规则,数据预处理,数据仓库,税务系统
其他文献
本文运用马克思主义的历史唯物主义和唯物辩证法的观点,对于长期以来鲜为人问津的袁世凯兴办近代军事教育的问题进行了较全面客观地分析、比较和评价。 本文主要分五个部分
盐不仅是生活必须品,同时也是重要的化工原料,在国民经济中占有非常重要的位置。 盐的来源主要是海盐、井矿盐和湖盐。从制取方法上来讲,多效真空蒸发制盐是生产精制盐及高纯
旋转床是七十年代末出现的一种用于传质和反应的高效化工设备,它在工业上有着十分广阔的应用前景。有关旋转床内液相控制的传质过程,已有一定数量的研究结果发表,但沿旋转床径向
风险投资自20世纪40年代诞生以来,已经成为高新技术企业发展的助推器,它不仅为全球带来了新经济时代的曙光,而且成为牵动新经济发展的强大动力。我国发展风险投资近20年,与国外风
培育和弘扬社会主义核心价值观是时代赋予教育的重大使命。家庭教育是人生教育的第一课,是学校教育、社会教育的基础,也是一个人的世界观、人生观、价值观形成的重要基础,在
本文介绍了空调列车DC600V供电系统的组成,论述了使用DC600V供电系统的意义,指出了其所存在的问题,并针对问题进行了分析。 首先对空调列车600VDC供电系统的负载建立了模型。
钻井中的泥页岩稳定问题是影响钻井技术发展的重大问题。至二十世纪八十年代末C.H.Chenevert提出泥页岩稳定的“力学与化学耦合”理论以来,泥页岩稳定性研究由定性实验阶段上升
本文作者在研究中发现,20世纪初叶的第三次翻译高潮与20世纪八十年代的翻译高潮有许多历史文化上的相似点。首先,在翻译高潮到来之前,二者都经历了文化真空期。其次,由于社会的转
21世纪是一个以网络为核心的信息时代,随着计算机技术、网络通讯技术的不断进步,电子商务在全球范围内获得了迅猛的发展,给企业注入了新的活力和机遇,同时也给企业带来了新的
本研究采用传统的热水浸提法从宁夏枸杞中提取出枸杞多糖粗品(LBP),对其糖含量进行测定;采用高能量饲料结合小剂量链脲佐菌素建立2型糖尿病大鼠模型,根据糖耐量曲线下面积、