论文部分内容阅读
随着计算机技术的不断发展,大数据技术日益成熟和完善。大数据技术的广泛应用给社会运行与发展带来了深刻的影响。大数据、“互联网+”等信息技术在推动现代经济快速发展的同时,也推动着国家治理机制的不断完善和治理水平的不断提高,逐步走向现代化。审计机关作为国家治理体系中的重要组成部分,审计监督方式的转型当然也应该与时俱进,利用好大数据技术开展审计工作是国家推动数据透明、共享和开放,提升国家数据能力的必然要求。审计是促进国家治理现代化的重要保障,传统的数据审计技术已经满足不了当今社会快速、准确和低成本的要求,大数据审计是国家审计实现全覆盖的必由之路。本文在充分调研财政数据审计知识和认真分析相关需求的基础上,通过离线和在线数据采集方式,构建财政大数据审计平台。平台利用大数据技术实现了包括总体预算、部门预算和专项预算的全方位审计,并结合数据分析中的关联规则和回归预测等相关算法,对财政数据进行深入分析,发现数据之间的内在联系,挖掘新的审计模型。本文的主要工作包括:(1)详细分析了Apriori算法的原理后,针对候选项集的生成过程,提出了一种添加过滤集的方法,通过利用已知的非频繁项集,进一步减少候选项集的数目,甚至减少数据集的扫描次数,提高算法的性能。在此基础上,通过关联规则算法,在大量数据中找出频繁项和关联规则,根据挖掘出的有用规则,建立财政数据审计模型;(2)针对局部加权线性回归算法,在采用高斯核函数赋予邻近点更高的权重时,需要设定参数k来表示权重的变化快慢程度,为了权衡训练误差和测试误差,提出了一种参数k的计算方法,涉及到真实值与预测值的相关性和误差平方的计算;研究分析了另一种用于回归问题的梯度提升树GBDT算法,并结合财政数据和线性回归进行对比;通过局部加权线性回归算法建立预测模型,根据历年收入预算和执行情况的财政数据,预测下一年的收入预算,为决策者正确制定下一年计划提供参考和数据支持;(3)财政预算审计系统的设计和实现,系统包含了常规的数据查询、报表查询、比对纠错等功能,此外,实现了从总体预算,部门预算和专项预算的全方位审计。(4)对财政预算审计系统进行了功能测试,基本满足了系统的建设目标和要求。