企业欠税风险预测与优化技术研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:huahuaaixue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
税收是大多数国家包括我国的财政收入的一个主要的来源,同时,它也是衡量一个国家经济能力的一个非常核心的指标。税收征收是世界各国都非常看重的工作,它关系到国家财政收入的数量。但是企业在生产经营过程中,必然不会总是盈利的,为了经济利益,有些企业就会少缴税款或者不缴纳税款,这些都属于欠税行为。欠税行为会给国家和社会带来很多负面影响,包括:国家和政府的财政收入减少,社会经济秩序变得混乱,使广大人民群众的利益受到损害。政府税务部门在对企业进行纳税评估之前,无法准确地识别认定企业是否有欠税的行为,同时由于工作量的原因,政府税务部门没有办法对所有企业进行纳税评估工作,因此,通过预测出企业的欠税风险而筛选出疑似欠税企业,对于保障国家财政收入,具有重要意义。目前,对税源企业的欠税风险预测,主要有两部分构成:一是政府税务部门对大数据情报平台里的企业数据进行规则判定识别风险点,二是税务专家根据经验知识对前期自动化识别的风险点进行人工判断。也就是说目前欠税风险预测的自动化部分召回率较高,准确率较低,仍然依赖税务专家的人工经验。随着税源企业的日益增多,以及税收管理信息系统上线之后,企业相关数据越来越多,仅凭简单的规则判定和人工经验知识难以完成风险预测任务。本文研究针对当前企业欠税风险预测召回率高但准确率低、依赖人工经验判定的问题,利用企业税务和社保数据,使用数据挖掘(Data Mining)方法对企业欠税风险进行预测,消除对人工经验判定的依赖,提高欠税风险预测的效率。本文的主要工作包括:1、利用企业税务和社保数据,使用Weka工具中内置的多种数据挖掘分类模型,对企业欠税风险进行预测。主要包括:抽取政府税务部门大数据情报平台里的部分企业税务和社保数据,对其进行数据预处理;使用weka软件内置的分类算法对处理后的数据进行模型训练和测试,选取F1分数作为欠税风险预测问题的评价指标,比较各算法的预测效果。实验结果表明随机森林算法对企业欠税风险预测效果最好。2、在税务大数据背景下,海量的企业税务和社保数据将导致模型训练时间不可接受。本文针对随机森林模型训练时耗时较多的缺点,对随机森林算法进行并行优化。在充分理解随机森林算法的原理和构造的基础上,提出并行优化随机森林算法的两种思路:决策树之间并行与决策树内部并行,并将两种思路结合起来应用。使用Java代码实现了上述并行优化方案,在8颗CPU机器上同样使用企业税务和社保数据进行测试,实验结果表明并行优化方案能够在一定程度上利用多核资源,加速随机森林模型训练过程。3、针对人工使用Weka GUI步骤繁琐的缺点,实现面向Weka API的数据分类与自动处理系统,并将改进的随机森林模型集成至Weka软件内,解决Weka软件使用时需要人工不断操作的不足。通过调用Weka软件提供的API,间接调用优化过的随机森林模型,使用程序自动化地进行模型的训练和预测,用户只需提供企业税务和社保的训练数据集和候选企业测试集,一键点击,即可自动完成模型训练和预测任务,减少人工操作Weka软件的步骤。
其他文献
传统聚酰亚胺(PI)加工成型难制约了PI材料朝细分化、多元化和定制化方向的发展,如何提高PI材料熔融、溶解性是PI改性研究的重要方向之一。从PI分子结构设计、合成及改性角度出发,综述了不同分子结构改性PI溶解性的研究进展,介绍了引入柔性结构单元、大侧基、扭曲非共平面结构等改性PI的效果和优缺点,分析比较了这些分子结构设计、合成改性PI的原理和优点,提出了未来可深入研究结合多种分子设计思路改性PI、
长期以来,我国的税收征管一直以企业和组织为重点,对自然人相关的税收征管主要依附和参照企业和组织的管理模式,自然人税收征管体系既不独立也不完善。这与我国长期以来居民收入水平较低、家庭财富规模有限有关,也与我国以间接税为主体的税制结构密切相关。近年来,随着我国经济社会发展,个人收入与居民财富水平大幅增加,政府征税的收入来源结构也正在发生重大变化。《中共中央关于制定国民经济和社会发展第十四个五年规划和二
目的 调查护理人员工作相关肌肉骨骼疾患(WMSDs)发生情况及其影响因素。方法 采用判断抽样方法,选择某三级甲等医院305名护理人员为研究对象,采用《肌肉骨骼损伤情况调查问卷》调查其近1年内WMSDs发生情况。结果 护理人员任一部位WMSDs的年患病率为82.3%,各部位按WMSDs患病率从高到低依次为颈部、肩部、下背(腰)部、踝/足部、上背部、膝部、手腕/手部、臀/大腿部和肘部(P<0.01),
今年以来,洛阳市公安局交警支队按照上级部署,认真贯彻“以打促防、以打促管”交通安全管理新理念,完善办理酒驾醉驾案件机制,探索出一套“公、检、法、司、社”五方联动的醉驾综合治理模式,成效显著。醉驾综合治理“洛阳模式”,既节省了司法资源,缩短了办案时间,又提升了执法办案质效,因而备受关注。
期刊
随着更多新兴应用的出现,例如变化环境中的动态热伪装、温度自适应辐射制冷以及航天器智能热控等,传统的静态红外发射率工程已经不能满足需求,发射率动态调制成为研究热点。红外发射率动态调制涂层是指在外场(如热、光、电等)刺激下,红外发射率可以发生可逆变化的材料。根据调制方式的不同,系统总结了热调制、电调制、光调制、应变调制、湿度调制等几大类红外发射率动态调制智能涂层的研究进展,概述了其基本原理、相关材料及
中小微企业为国民经济做出了巨大贡献,但其长期存在融资约束仍然是制约自身发展的主要因素,为此国家出台了大量的优惠财税金融政策改善企业的融资环境,但仍然未能满足企业巨大的资金需求。随着ABCD等数字化技术不断向金融领域渗透,积极拓展企业的融资渠道、降低企业的融资成本,对改善中小微企业的融资环境,减轻疫情冲击下企业的生存压力,进一步支持企业发挥了积极作用。该文以中小微企业为观察对象,探讨其存在融资约束的
热辐射是一种热能传递的基本方式,通过热辐射进行能量的传递在热电转换、红外目标隐身、红外热成像、探测等领域有着非常广泛和重要的应用。近年来,随着材料制备工艺和微纳加工技术的飞速发展,在热辐射控制材料领域形成了包括超材料、纳米线阵列、光子晶体、多层膜等多种形式的微纳结构,在热辐射的高发射率、频谱选择性、温度特性等诸多方面较自然传统材料调控更灵活;通过表面等离子体激元(SPP)、谐振效应、光子禁带效应等
由于草原禁牧及追求养殖效益的原因,目前滩羊的养殖方式通常采用舍饲育肥,最终引起宰后肉品质的劣变。本试验旨在研究日粮中添加α-硫辛酸(α-lipoicacid,α-LA)对滩羊肉品质和抗氧化能力的调控作用。选取18头健康状况良好、体况相似的4月龄滩羊,随机分为3组:对照组(Con)、低剂量组(600mg/kg α-硫辛酸,LS)和高剂量组(900mg/kg α-硫辛酸,HS)。采集滩羊股二头肌,测定
自从乌拉圭、加拿大和美国部分州将中药“火麻仁”的基原植物大麻Cannabis sativa合法化以来,工业大麻的市场价值逐年提高。高市值推动大麻基础研究迅猛发展,其遗传转化研究也实现了质的突破。目前,发根农杆菌介导的大麻毛状根转化、根癌农杆菌和纳米材料介导的大麻瞬时转化、病毒介导的基因沉默和大麻稳定转化均已实现,但是稳定遗传转化效率仍然不高。而建立高效的大麻遗传转化体系,不但可加速大麻分子生物学的