基于聚类的数据挖掘技术在税源监控中的应用

被引量 : 6次 | 上传用户:akiheeca
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机、通信、人工智能等技术的不断发展,社会信息化程度不断加深。商务信息化、医疗信息化、政务信息化……各种信息化充斥于人们的生活中,使我们生活的社会也成为了信息化的社会。信息化深刻地影响着人们的工作、学习和生活,一方面带来的是多种多样的便利,另一方面也产生了海量的数据,“数据膨胀但是知识贫乏”的问题日益突出。而在知识经济时代,知识创造财富,如何掌握最新的知识成为了竞争的焦点。因此,从海量信息背后挖掘隐藏的、以前未知的知识,成为了当今研究与应用的新热点。作为为国聚财、为民收税的税务部门,同样也面临着海量的涉税数据无法深度加工利用,浪费了许多有价值信息的严峻问题。随着“金税三期”进程的不断推进,税务部门的数据由省级集中进一步上升为全国的数据大集中,税务征管数据库中积累了大量内部与外部的数据。但是当前税务部门的这些数据的处理与分析仅仅局限在查询、汇总、简单对比等较基础的应用,缺乏对数据蕴含的信息的深层次挖掘。本文力求在税务管理工作中引入数据挖掘技术,来提高税务决策的科学性以及纳税服务的质量,并将研究的重点放在了聚类算法在税源监控中的应用上。税源监控作为一种基础性税收管理活动,贯穿于纳税申报、纳税服务与税务稽核等流程中。掌握最全的税源信息,实施严密的监控措施,可以有效保证税收的应收尽收,实现国家宏观政策。聚类算法作为数据挖掘的一种技术,已被人们广泛地应用于医疗、商业、生物等多个领域。将聚类算法应用于税源监控中,可以有效提高税源分类的科学性,并能帮助税务管理人员有针对性地制定不同的税源管理决策,对于税务部门工作效率和管理水平的提高具有重要的现实意义。本文在总结国内外研究与应用经验的基础上,概括总结了数据挖掘技术、聚类算法、K-means聚类分析和税源监控等方面的知识,并将两方面知识结合起来,分析了聚类算法在税源监控中全面应用的必要性与可行性,设计了聚类算法在税源监控应用的模型。然后本文使用SPSS Clementine12.0软件并严格按照CRISP-DM“跨行业数据挖掘的标准化过程”建立模型,按照本文选取的数据指标体系,抽取了大智慧软件相关的财务数据,对166个纳税人进行了聚类的案例分析,将其分为一般税源、重点税源以及优质税源三大类,并有针对性地对各类税源提出了税务监管建议。最后本文在归纳总结聚类算法在税源管理中应用的基础上,为聚类技术在税源监控中的全面应用提出了相关的建议。
其他文献
目的:探究microRNA-106b对人膀胱癌细胞株BIU-87细胞增殖、凋亡以及侵袭能力的影响,为microRNA-106b应用于临床诊断以及治疗膀胱癌提供理论基础及实验依据。方法:用化学方法合成
<正>碱性磷酸酶是浮游植物在海区无机磷缺乏的情况下,通过自身的调控机制合成的用于水解有机磷并释放无机磷的一种胞外酶,它只有在海区无机磷浓度低于某一阈值的情况下才会被
会议
通过研究数字高程模型的建立过程及误差来源,结合低等级公路设计中的精度要求,探讨数字高程模型在低等级公路设计中的应用。
过去三十年里,浙江通过县政扩权改革发展出了一套有效的次省级政府的激励结构,主要内容包括:利用省管县财政体制扩大次省级政府的范围;实施一系列以GDP增长为导向的财政政策;
针对透水混凝土的透水系数与抗压强度不易同时满足的问题,通过对碎石混凝土试块制备中不同的投料、成型、养护工艺进行对比,探讨透水性、抗压强度均满足路面铺设要求的混凝土
焚烧是危险废物处置的主要方式之一,近年来,中国危险废物焚烧处置设施进入高速发展时期,极大地补充了危险废物处置能力不足的短板,但也随之带来了诸多困难与问题。本文以全国
随着网络的迅速发展和网络交际方式的日益普及,网络语言也渗透到生活的方方面面。网络助推了新词语的产生和发展,网络语言引起了越来越广泛的关注,成为人们研究的热点。网络语言
将损耗型负介电常数材料-光子晶体匹配的异质结构作为基本单元排列成周期性结构,组成一种新型的光栅结构,利用有限元分析方法计算了该结构的透射特性。通过分别对比不同的光
晚清时期,小说作品涌现而谴责小说雄踞文坛,题材和内容涉及社会生活的各个领域,官场、商界、华工、女界、战争等等,以写官场最为普遍。其兴盛的主要显象是激情四射、怪诞诡谲