基于有向图的虚开增值税发票行为检测方法研究

来源 :西安科技大学 | 被引量 : 0次 | 上传用户:wnt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在侦破虚开增值税发票案件的实践中,从资金交易流中找到资金环路是检测虚开增值税发票行为的关键环节。资金交易流可以抽象成由顶点和边组成的有向图,因此研究基于有向图的虚开增值税发票行为检测方法是非常必要的。本文首先研究了虚开增值税发票行为中的增值税发票环路虚开行为表象与检测方法,将从资金交易流中搜索资金环路问题抽象成对具有多重边的有向图环路搜索问题,其次研究了有向图的存储以及图的环路搜索常用算法,并对算法的适用性进行比较,发现常用的环路搜索算法均不能很好地解决具有多重边的有向图环路搜索问题,因此,提出了基于深度优先的有向图环路搜索算法。先对原始数据预处理,将资金交易流和账户信息使用账号编号关联起来,找出每个顶点的边集合并按交易时间升序排列,避免在运算过程中多次遍历所有边,通过约束边的权值来避免遍历无效边,搜索过程采用逐层退回的方式来保证能遍历到有效的多重边且能找到有向图中的所有环路,并在单机上验证了算法的正确性。但是当有向图的边数增大到100万条以上时,算法执行会发生内存溢出,从而无法得到结果。针对该问题又提出了一种基于Spark的有向图环路搜索算法,先将原始数据抽象成Spark中GraphX图数据结构,然后利用数据缓存、尾递归等方法并使用GraphX框架及Scala语言在本地模式下验证了算法的正确性,但是在相同的数据集下该算法时间效率明显低于最初提出的算法。为了提高该算法的执行效率,通过优化循环、建立索引等方法对其进行优化,在本地模式下验证后,使用边数为10000条以上的图数据集在Spark集群下实验,结果表明,优化后的算法不仅能够解决具有多重边的大规模有向图环路搜索问题,具有良好的扩展性,而且执行效率得到明显提高。最后,本文设计并实现了界面友好且可操作性强的虚开增值税发票行为检测系统。经测试,该系统能够从资金交易流中搜索出资金环路并能够查询出环路关联账户的详细信息,为稽查部门检测虚开增值税发票行为提供了重要的依据,节约了稽查成本。
其他文献
<正>唐朝张彦远《法书要录》卷十《右军书记》录有王羲之尺牍四百余通,首列《十七帖》,以卷首有"十七日"三字而名之。该帖传世刻本有多种,其中最著名的是唐摹馆本,后有大字行
随着经济和能源的可持续发展,可再生生物质燃料和化学品的生产可以满足对能源的需求,减少对环境的污染,生物质和生物燃料的转化有很多的发展机遇。生物柴油是生物炼制技术的一种绿色产物,可以有效满足经济发展对能源的需求。甘油是生物柴油制备过程中的一种副产物,含有多个官能团,是生物平台分子之一。目前甘油产量大量过剩,需要提出新的方法将甘油转化为其他有价值的产品。甘油氧化是一种简单的化学转化方法,可以得到小分子
本文运用《江西商人信范》等新史料,对江西商人经营方式、与牙行的关系、帮会组织、所利用的交通运输业等几个前人研究尚薄弱的问题作了新的探讨。由此可见,江西商人带着夏布
<正>每一个时代都应有其时代的特征,每一个地域都应有其地域的颜色。—方地域的颜色是由此地经济、文化、艺术等综合形成而来,文化最能代表一个地域的底蕴,艺术则为这一颜色
随着现代企业经营机制的不断发展,很多世界知名企业对存货的管理工作日益重视,而我国部分企业至今对于存货管理的重要性认识尚不够清楚。针对这一问题,提出了相应的解决措施
控制温室气体CO2的排放已经成为全球环境研究的热点问题。对当前国内外利用微藻技术固定CO2以达到CO2减排的研究现状进行了综述,重点从可高效固定CO2藻种的筛选与育种、微藻
目的:探讨头针对大鼠脑缺血再灌注后血脑屏障(BBB)超微结构、血清S100B含量及脑水含量的影响,揭示头针对BBB的保护作用。方法:选取SD大鼠,采用线栓法复制右侧大脑中动脉缺血再灌
<正>园林画是实景画的一个重要类型,在盛唐已出现,如传为卢鸿的《草堂十志图》和传为王维的《辋川图》。中唐时期造园活动兴盛,诗文中经常提到园林画,如王周《早春西园》曰:"
近几年番禺文化旅游业发展迅速,已确定为番禺新兴支柱产业。本文围绕番禺文化旅游业发展现状、分析其发展的必要性,并提出相关建议。
<正>隋牟号予觉。1968年生于山东胶南。先后受教于石齐、卢沉先生。现居北京。任教于中国人民大学艺术学院。特聘教授,画家,书法家,篆刻家出版有《隋牟画集》《名家画人物之