论文部分内容阅读
数据挖掘技术是一种利用各种分析工具在海量数据中发现模型和数据间关系的技术,或者说是从大量的数据中抽取出潜在的、不为人知的有用信息、模式和趋势,目的在于提高决策能力、检测异常模式、在过去的经验基础上预言未来趋势等。所以说数据挖掘技术可在多方面运用于税收工作中,如采用时间序列技术对各地区的税源规模进行预测,可帮助税务部门更好地进行税源管理,建立起有效的税源管理体系,减少税收收入流失;采用聚类分析对纳税人进行分类,既可提高税收管理的效率和质量,还可鼓励纳税人诚信纳税,促使纳税人自觉树立税务信誉形象;采用因子分析法对税务机关业绩进行综合评价,并取奖惩相结合的办法,有助于提升税务人员的纳税服务质量。本文主要致力于数据挖掘技术在国税管理中的应用研究。目的是通过研究数据挖掘技术中的关联规则挖掘和分析预测,将已有的税务历史数据充分运用,为国税管理工作提供新的研究思路。主要工作为:1.通过比较目前广泛应用的关联规则挖掘算法Apriori的优点与不足,结合税收数据的特点,对关联规则挖掘在税务系统中应用的可行性和必要性进行了研究;通过对PSO与神经网络基本原理的学习,对两者结合的可行性做了分析,为神经粒子群模型在增值税税收预测中的应用奠定了理论基础,为数据挖掘技术在税务系统中的研究与应用提供了一个新的思路。2.将改进的关联规则挖掘方法分别应用于税务稽查、税收分析、税收执法管理中。第一种改进的算法G-Apriori将其应用于税务稽查中,对历史稽查数据中纳税人采用的主要违法违章手段之间的关联关系进行了数据挖掘,得到了一些合理的规则,对稽查工作有效开展有一定的指导意义;第二种算法是基于数据立方体的维间关联规则挖掘算法DC-Apriori,因为数据立方体允许以多维对数据进行建模和观察,很适合挖掘多维关联规则,在税务系统中,针对增值税税收数据进行多维关联规则的挖掘,根据挖掘出的规则,税务系统管理决策层可以从不同的角度和面进行税收分析,所以基于数据立方体的维间关联规则挖掘算法,具有一定的针对性;第三种是基于Hash、AVM的关联规则挖掘算法H-AVM算法。首先将事务数据库转换成比特向量表示形式,通过向量的与运算来计算项集的支持度,在挖掘过程中只需扫描一遍数据库;运用Hash技术,在第一次扫描数据库的过程中,直接生成频繁2-项集,提高算法的执行效率。实验结果表明,H-AVM算法提高了关联规则挖掘的效率。进一步将H-AVM算法应用到税收执法管理中,得出了对国税系统加强税收执法管理具有重要参考意义的结论。3.以RBF神经网络和微粒群算法作为理论工具,在微粒群的惯性调整策略中选择了步长较小的线性调整策略,防止微粒群在寻优过程中陷入局部最优值。然后将构建好的神经粒子群预测模型应用于到企业增值税税额的预测,经实验对比分析,神经粒子群预测模型可以作出更为准确的增值税额预测,从而为领导决策提供更为可靠的依据。