数据挖掘在税务系统的应用与研究

来源 :华北理工大学 | 被引量 : 2次 | 上传用户:huangom444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化系统的建设,全国各地税务部门都建立了各自的税务管理系统,在系统的使用过程中产生了大量的企业税收数据,这些数据大多处于闲置状态,造成了数据资源的极大浪费。为了从这些闲置的税收数据中获取更深层次的知识、规律,本系统将数据仓库技术、数据挖掘技术应用于税收数据之上,完成对税收数据深层次知识的发掘。根据数据挖掘技术的一般性流程,通过对税收数据预处理、聚类分析、结果分析等过程处理。从增值税和企业所得税的聚类以及企业年度纳税总额的聚类对税收数据进行分析。数据预处理包括数据抓取、数据清洗、数据汇总、数据集成以及数据标准化等过程。根据数据仓库技术的思想,通过数据预处理将数据从不同的应用数据库、数据文件中抓取到本系统数据库,对数据进行粒度、维度方面的调整,最终生成待挖掘数据。数据挖掘的算法采用基于最大最小距离的K-Means聚类算法,该算法根据聚类中心个数智能地选取较优的聚类中心点,从而提升聚类效果。从数据库设计、系统设计及实现方面对两种聚类分析进行了实现,最终以图表形式展示聚类结果,并做出分析。总之,通过对税务数据的聚类处理,从增值税和企业所得税、年度纳税总额两个方面对企业纳税情况做出分析,能够从一定程度上协助税务部门更好的监察、管理纳税企业,发掘重点、优质税源,保证税收工作平稳、有序的进行。
其他文献
目的对冠心病左室舒张功能测定中心脏彩色超声的诊断价值进行探讨。方法依据研究纳入标准以及排除标准将50例冠心病患者列为我院研究对象,收治时间均为2017年7月至2018年7月,
<正>结核性脑膜炎(结脑)是结核分枝杆菌引起的以脑膜为主的非化脓性炎症,是常见最严重的肺外结核病。近年来,由于耐药结核病例的增加,加之人口流动及AIDS流行等因素,全球结核
目的对高血压合并阵发性房颤患者心脏超声的特点进行观察探究。方法将我院于2018年1月~2019年1月接收的35例高血压合并阵发性心房颤动患者纳入为A组并将同期内35例单纯性高血
方言是地域文化的一种形式,它具有储存本土文化信息的功能。文章搜集、整理并分析了重庆方言中的新词语——重庆言子儿,一个个生动有趣的言子儿,表达了巴渝民众幽默豪爽的个
目的对比研究采用心脏超声对高血压合并阵发性心房颤动所具有的临床诊断效果。方法随机选取本院2016年7月~2018年9月期间收治的高血压合并阵发性心房颤动患者27例设为研究组,
目的分析rtPA静脉溶栓后联合支架取栓及rtPA动脉溶栓治疗急性缺血性脑卒中(acute ischemic stroke,AIS)的临床疗效。方法本文18例患者随机从2015-09—2017-09甘肃省人民医院
思想品德在小学课程中有着至关重要的位置。由于传统思想品德教育方式过于死板,教学过程缺乏新意,导致小学生学习主动性不强。因此,对小学思想品德教育进行改革与完善,应从教
目的探究分析老年钙化性心脏瓣膜病借助超声心动图进行诊断的临床可行性。方法选取2017年1月~2018年12月接诊的SCVD患者63例作为研究组,另选取同期健康状况良好的老年志愿者6
<正>不少影视围绕"美食"这一题材展开,大胆将美食和电影相结合,让观众在观赏影视剧的同时,也在潜移默化中了解美食文化,在一定程度上满足了人们更多的文化需求。2015年2月1日