基于Stacking集成学习的减税降费风险预测模型研究与应用

来源 :湖北大学 | 被引量 : 0次 | 上传用户:ning0001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
税收是我国财政收入的主要来源,落实好税收政策就相当于稳固了国家经济。减税降费政策基于2015年提出,具体到2019年落实。如何落实好政策也成为了税收事业的重点。随着互联网技术的快速发展,税务结合互联网模式在国内已经应用得越来越广泛,对于减税降费这种近几年提出的新政策,需要良好的税收管理机制,这样不仅可以提升税务人员在处理风险时的效率,也能减轻税务人员核对风险数据的负担。目前的减税降费税收管理机制有两大不足:(1)数据采集过程中由于国税局和地税局的合并,导致很多错误数据被提取出来。(2)税务人员处理识别减税降费风险数据耗时耗力,根据已定的政策去比对数据太过于花费时间,数据逻辑关系紊乱,人员工作任务繁重。本文将针对上述两点,研究机器学习技术在减税降费中的应用情况,结合算法实现减税降费预测与管理系统的开发。本文完成的主要工作有:(1)税务数据的清洗。通过建立规则体系来从金税三期系统、数据汇聚平台以及其他平台获取数据。针对数据质量问题,规则体系建立对应规则处理来源不同的数据。(2)构建了基于XGBoost的减税降费风险预测模型。首先,对经过数据清洗的样本数据进行归一化等操作,使用PCA降维将数据降至低维,选取低维度特征子集用于构建基于XGBoost的减税降费风险预测模型。然后,运用网格搜索方法与五折交叉验证进行模型参数调优与训练,形成基于XGBoost的减税降费风险预测模型。实验结果表明,经过最优参数化后,相比于逻辑回归、KNN、随机森林、Bagging算法、支持向量机,XGBoost模型在风险预测上表现更佳。(3)提出基于Stacking集成学习的减税降费风险预测模型,根据(2)中的实验结果分析,采用Stacking集成学习多模型融合的特点,将KNN、随机森林、Bagging模型作为Stacking算法的第一层初级学习器,使用XGBoost减税降费风险预测模型作为Stacking算法的第二层次级学习器,运用Stacking将模型进行分层融合解决单个模型对于少量风险类别精准度低的问题,提高减税降费风险预测模型的风险预测性能。并将该模型与四种单个模型进行实验对照,结果显示,相比于单个模型,Stacking模型具有更好的风险预测性能。(4)基于Stacking集成学习模型的减税降费风险预测系统的实现。本文通过ASP.NET技术和Oracle数据库实现系统的开发,实现了对减税降费风险数据的预测。
其他文献
近年来重金属污染问题日益严重,对人类社会和生态环境的危害也成为了人们热议的话题。重金属污染在环境中无处不在,它可以通过食物链传递的方式影响生物体的生长发育和繁殖。本文利用ZnSO4,设置3种不同Zn2+浓度(0 mg/mL、0.25 mg/mL、0.50mg/mL),研究重金属锌通过食物链(培养基-黑腹果蝇-沟渠豹蛛)在沟渠豹蛛体内的积累,以及对黑腹果蝇、沟渠豹蛛生长发育和繁殖的影响。本研究将丰富
学位
群居生活有诸多好处,但也有相应的成本——即增加被寄生虫感染的风险(广义上包括细菌、病毒、原生动物、蠕虫和真菌)。为了降低这一社会成本,许多社会性动物(包括昆虫)进化出了一系列的适应。社会免疫行为就是生活在群体中的个体,为了提高自身适合度和广义适合度,免受传染病的侵害,进化出的一种有利于自身和生活在群体中的其他成员的免疫适应。梳理行为是一种重要的卫生行为,目的是为其他个体清除暴露在个体体表的传染性病
学位
大别山区属长江中下游湿润季风气候,位于河南、安徽和湖北三省交界处,资源丰富、蜘蛛多样性高。本文对采集自大别山区皿蛛进行初步分类学研究,采集工作从2020至2021连续两年,通过手捕法、筛网法、扫网法等采集方法采集到皿蛛共22属36种。全文共分为五个部分。第一部分:绪论,简述皿蛛科的研究历史和在分类系统中的分类地位、世界及中国分布的皿蛛属和种的数量统计、皿蛛科蜘蛛身体各部分特征。第二部分:各论,记述
学位
愉悦蓼(Polygonum jucundum),是蓼科(Polygonaceae)一年生草本植物。这种植物在中国分布广泛,常被用于提取甾醇类药物来治疗多种人类疾病。愉悦蓼是二型花柱植物,已有研究表明愉悦蓼是虫媒传粉植物且具有自交不亲和性,二型花柱特征在这种植物的有性繁殖过程中可能促进了异交。但由于对愉悦蓼缺乏系统的传粉生物学研究,使得在愉悦蓼二型花柱特征对有性繁殖过程及结果的影响未能被充分认识。本
学位
异叶梁王茶为Nothopanax davidii为五加科Araliaceae梁王茶属Nothopanax Miq植物,药用部位主要为树皮及根,系民间草药,具有抗风湿、强筋骨等功效,主要用于治疗跌打损伤,风湿关节痛等疾病。目前对其茎皮和叶的化学成分和药理活性进行了研究,从中分离得到多个具有抗炎活性的新三萜皂苷类成分,但其根的研究尚未见文献报道。为了较好地开发利用此植物,本研究对此药材根的化学成分和抗
学位
背景和目的:肝细胞癌(Hepatocellular carcinoma,HCC)作为常见的原发性肝癌之一,具有发病机制复杂、转移性强、恶性程度高及预后不良等特点,导致其临床治疗效果非常有限。天然产物是药物研发的重要资源库。二酮哌嗪类化合物(Epipolythiodioxopiperazine,ETP)是一类具有多种生物活性的天然产物,具有很强的抗肿瘤、抑菌、抗病毒和免疫抑制等药理作用。Chaeto
学位
《长物志》一书形成于明代商品经济发达、资本主义有萌芽端倪的时代背景下。文震亨的《长物志》,作为文人对身边清玩事物的品鉴之作,反映了当时的社会文化风气与知识分子的精神世界,体现了中国古典美学的生态审美智慧。《长物志》从七个方面论述“长物”,本文也从这七个维面来探究其中蕴涵的生态美学意蕴,即从屋室到园林、服饰到器物、家具到饮食等来揭示古人的艺术化人生与诗意化生存。古人的住居、饮食、郊游与休闲等多种生活
学位
铁硫簇是生物体内存在的最古老的的物质之一,普遍存在于生物体氧化还原系统中,在生物体内起着举足轻重的作用。不同的铁硫蛋白包含不同的铁硫簇,承担着电子传递、氧化还原反应、催化中心、铁和氧的感应器、维持DNA稳定、蛋白质翻译、能量转换等多种功能。铁硫簇种类繁多,最常见的为[2Fe2S]、[3Fe4S]和[4Fe4S]。铁硫簇虽然结构简单,但其组装的过程复杂,包含多种不同的组装途径。目前,在自然界中已经鉴
学位
大冶作为一个因矿而生,因矿而兴的资源型城市,经过几千年的人工采冶活动,积累了深厚的矿冶文化。矿冶文化是工业文化的主要类型之一,它是人类利用自然矿产资源,在环境中留下了一系列文化现象的综合体,矿冶文化是人类工业发展过程中所有行为的动态展现。大冶的矿冶文化中所体现“愚公移山”的敢想敢干精神、“抚夷属夏”的包容创新精神、“舍身为国”的爱国情怀,都对我们后辈有着深远的启示。而大冶铜绿山古矿遗址博物馆则是矿
学位
随着时代的发展和科技的进步,不断地衍生出一些新材料、新思想、新传播方式。这些能够促进水彩画发展的新产物,我们都可以统称为“新媒介”。艺术家们逐渐改善传统媒介的缺陷,将新媒介融入当代水彩艺术之中。本文通过探索新媒介种类、分析新媒介对水彩画创作的影响,让我们更深入的认识和理解新媒介,更好的让新媒介为水彩画创作服务。文章从传统媒介的束缚、新媒介的应时而生、新媒介的应用特征以及新媒介对水彩画创作的影响,这
学位