数据挖掘方法在纳税人行为分析中的研究和实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:luanwf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
税务部门针对提高税收征管水平,加强数据资源开发利用的要求,尝试进行数据挖掘技术的研究和应用,探索基于较大规模税收数据而进行的纳税人行为分析和预测。本文研究并实现了关联规则发现和决策树分类等算法,并针对税收数据特点,优化了ID3等算法,分析纳税人欠税和纳税人流失的可能性。首先,本文就数据挖掘中关联规则的概念和作用进行了探讨,研究并实现了Apriori算法和FP_Tree算法,通过真实的税收数据,挖掘出布尔型关联规则、数值型关联规则、多维关联规则等知识,通过实验和在税务部门的应用验证了算法程序的正确性和有效性。其次,本文介绍了决策树分类方法的概念,说明了经典ID3算法的原理和过程实现。针对税收数据的特点,实现了基于支持数和置信率的SCP后剪枝的方法和基于FP_Tree的ID3改进算法,分别解决了决策树构造过度和构造效率低下的问题。通过实验证明了SCP的后剪枝方法和基于FP_Tree的ID3改进算法的有效性和优越性。利用改进算法构造的纳税人流失分类模型和纳税人欠税分类模型,应用到税收管理,提高了税收管理工作的质量和效率,取得了较好的社会效益和经济效益。
其他文献
瑞金是响誉中外的红色故都、共和国摇篮。在中国革命历史上留下了浓墨重彩的篇章,有着重要的历史地位。瑞金开创了中国新民主主义革命史上的多项第一:它不仅是中国共产党创建
猜想是一种重要的思维活动,它是在已有知识和事实的基础上,对未知的事物及其规律作出某种假定或提出预拟的看法。猜想有其显著的特点,一是推测性,它要找到事物的本质或事物之
期刊
9月6日,在宿迁市社会信用体系建设工作动员大会上,江苏苏丝丝绸股份有限公司被宿迁市人民政府授予“宿迁市十大信用管理示范企业”奖牌。近年来,苏丝股份把信用体系建设作为
小木作作为室内营造的设计语言体现着建筑的风格与文化寓意,钓源古村位于江西吉安市西部约18公里处,是北宋大文学家、政治家欧阳修后裔聚居的古村落,距今已有1100多年的建村
美术课是实施美育的主要途径。充分发挥美术课的主渠道作用,认真实施素质教育是当前美术教师的主要任务。我在美术教学中,从以下几个方面人手狠抓了学生素质的提高。一、通过
期刊
由清华大学中国学术期刊(光盘版)电子杂志社出版、中国科学文献计量评价研究中心与清华大学图书馆研制的《中国学术期刊影响因子年报》系列数据库首发式2010年12月16日在京举行
本文对2010年中国食糖市场运行的特点从生产、市场供求、价格运行走势、进出口贸易等方面进行了总结分析;同时也对国际糖市场进行了分析。对2011年食糖市场的供需形势等进行了
<正>2017年12月13日,第十二届孔子学院大会举办题为中外大学通过孔子学院参与"一带一路"建设的校长论坛。来自斯里兰卡、英国等9个国家的12位大学校长先后发言并同300余名与
本文利用HP滤波法和GARCH、GARCH-M、TARCH和EGARCH等ARCH类模型对1970年以来美国苜蓿月度价格的波动性进行分析。研究表明,美国苜蓿的实际价格呈现不断下降的趋势;苜蓿价格
2月18日自治区科协七届五次全委会在乌鲁木齐市举行,会议由自治区科协党组书记李冀东主持,自治区党委常委尔肯江&#183;吐拉洪出席会议并讲话,他要求全疆各级科协组织找准在“十