虚开税票行为识别融合算法研究与系统实现

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:mhappy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,不法分子利用各种手段虚开增值税专用发票进行犯罪的现象时有发生,此类案件严重危害了我国的税收安全。面对虚开税票这一场景,当税务部门将海量嫌疑数据移交给公安部门时,如何利用智能化手段实现大量税票数据的自动化分析和有效识别,为侦查工作提供强有力的辅助支持,显著提升办案水平和效率,是值得深入探索的问题。本论文立足于上述问题,针对虚开税票行为,深入调研与分析了当前的虚开税票特征,重点研究了企业税票数据中进项、销项商品品名的自然语言特征,提出了一种基于本体知识推理和神经网络模型的融合算法进行企业虚开税票行为识别,基于此算法实现了一个虚开税票行为辅助识别系统,并在实际应用中取得了较好效果。本论文主要贡献有以下几点:1.数据预处理与特征提取。本论文计算所用数据,是对原始增值税专用发票数据,提取并计算得到的企业汇总税票模拟数据。为增强模型泛化能力,使用K-Means聚类算法筛选企业全部进、销项商品,提取企业的主营进、销项商品品名。同时,将企业主营进、销项商品品名进行拼接,并使用BERT-wwm模型转化为特征向量。2.基于本体知识推理的虚开税票行为识别。深入调研公安民警办案经验,总结出虚开税票的特征和研判依据,将其转化、设计为基于本体知识推理的识别算法。该算法先根据企业主营商品品名进行商品类别识别,再由主营进、销项商品类别对应关系推理是否具有虚开税票行为。为解决企业开票品名随意性导致程序难以辨别商品类别的问题,爬取了移动通信设备商品数据,抽取其中商品类与子类知识,基于Neo4j图数据库构建了商品类别识别库,结合算法有效提高了识别效果。3.基于神经网络模型的虚开税票行为识别。针对BERT-wwm模型提取出的文本向量,设计并实现了基于神经网络模型的分类算法,分别使用全连接神经网络、TextCNN和Text-RNN识别模型进行了训练、调参,使用混淆矩阵等多种指标评估,其中全连接神经网络识别模型的效果最优,认为可以作为融合算法的神经网络模型部分。4.基于融合算法的虚开税票行为识别。本体知识推理的识别算法是办案经验中总结出的虚开税票特征与知识图谱技术的充分结合;神经网络模型的识别算法是通过学习向量中更深刻的特征,提升算法整体准确率。本论文将两种算法进行有效融合,应用于实际场景,融合算法在识别虚开税票行为上效果最优,两种算法优势互补综合验证了融合算法的有效性。5.虚开税票行为辅助识别系统的设计与实现。在分析虚开税票行为辅助识别系统需求的基础上,基于融合算法设计并实现了虚开税票行为辅助识别系统。经测试,系统设计合理、功能实用。利用该系统,某市公安部门从2020年税务稽查局移交的70万条可疑数据中,成功挖掘出一批嫌疑企业并进行重点侦查,最终确认虚开税票企业700余家,验证了系统的实际应用效果和可靠性。
其他文献
随着国内金融环境向着金融脱媒加剧、利率市场化加速、互联网金融兴起以及民营银行准入放开等多样性局面发展,面对激烈的红海竞争,农商银行(农村信用社)由于网点优势不断下降、盈利能力逐渐降低、发展速度持续放缓等综合因素,必然也必须走上网点转型发展的必由之路。本论文以R农商银行为研究实例,在国内外网点撤并转型背景下的人员配置相关研究基础上,首先,聚焦Ban K 4.0理论,利用PEST模型分析研究R农商银行
学位
在实施整本书阅读教学中引入项目式学习法,综合考虑教材单元、学生学情和整本书文学价值,整体创设问题情境,确定核心问题及一系列驱动任务,有助于让学生在解决问题的实践活动中发展语文学科素养。本文以《安徒生童话》整本书阅读为例,从提出项目问题、解决问题和评价与反思这三个维度探讨项目式学习法在整本书阅读教学中的应用。
期刊
水泥在我国基础设施的建设中发挥着重要作用,由于其产品具有同质性特征,行业竞争激烈。在国家推行碳减排目标的大背景下,能源消费改革势在必行,在投资扩张受限的情况下,水泥行业已经步入了微利时代。如何有效成本控制,对提升企业自身竞争力具有积极作用。本文详细分析Y公司SAP系统标准成本应用的现状,探讨了进行有效成本管控的应对方法。本文选取了较早引入SAP系统的Y水泥公司为研究对象(以下简称Y公司),以期提出
学位
随着民航、高铁、私家车、地铁、共享用车等交通工具的普及,以及国家新能源政策的退坡,客车销量在2017年结束了连续十余年的增长,持续4年销量下滑,预计后续几年下降趋势仍将持续。YT公司以客车为主业,客车业务收入与毛利贡献常年在90%以上。YT公司是全球客车龙头企业,公司客车产品谱系齐全,涵盖公交车、客运车、旅游车、团体车、校车及专用车等细分市场,覆盖了5米至18米不同长度的市场需要。然而,世界经济积
学位
党的十九届四中全会提出,要加快推进构建税收制度治理体系现代化,使我国税收制度优势转变为国家治理效能,而完善现代税收制度的关键在于通过直接税促进社会公平。我国自1980年正式确立个税法以来,一直在探索完善个税制度,为适应经济社会发展新形势和新挑战,2018年我国个税法第七次修正应声落地。此次时隔七年之后的新一轮个税改革,在免税额和税率级距的设置上进行了较大幅度调整,新增专项附加扣除,并首次引入综合税
学位
在党召开十九大会议以来,在中国经济腾飞的时代,中国经济进入了新时期。在新的使命和时代召唤下,市场经济体制进一步完善,国家、政府出台了多项政策,促进市场主体稳步发展,为我国企业带来了前进的契机,尤其是珠三角地区,广东省市场经济的发展完善给越来越多的企业创造了良好的市场发展条件。这些都为稳定劳动关系提供了良好的环境,劳动关系在我国的经济发展中占的地位比较重要,是目前经济转型期、改革期最重要的社会关系,
学位
个人所得税制在2018年进行了重大改革,税制的改革推动了征管配套的改革,管理对象发生了重大的变化,税务部门从只需要面向扣缴义务人,变成在面对扣缴义务人的同时,还要面对数以亿计的自然人纳税人。随着社会和经济的不断发展,共享经济、平台经济都应运而生,税收环境日益复杂化和多样化,税源信息的隐蔽性、流动性和跨区域性更加突出。在这种大环境下,过去的管理方式已无法满足当前的管理需求,我国提出了“国家治理体系和
学位
从2015年3月湖北省开展首批控排企业碳核查工作开始,时至今日已走过6个年头,湖北的工作开展成果对于研究试点省市的碳核查问题有一定代表性。从2015年的138家受核查企业发展至2021年的392家核查参与企业,纳入核查范围的相关方越来越多,由此涉及的对象和问题也成为我们研究视角之一。湖北省从当年并不突出的七个试点省市之一发展成为当前国内最大的碳交易市场,在2017年更是获得全国碳排放权注册登记系统
学位
近年来,随着课程改革的深入,整本书阅读逐渐成为语文研究的热点话题。《乡土中国》整本书阅读作为部编版高中语文教材中重要的教学单元,由于教材的实际使用周期较短,教学中仍然存在一定问题。项目式学习以建构主义、实用教育主义等作为理论基础,注重强调学生在学习过程中的主体性、实践性以及深度性。本论文从教学中的实际问题出发,意图探究项目式学习下《乡土中国》整本书阅读教学策略,解决相应的教学问题,提升其教学质量,
学位
报纸