机器学习算法在税收风险监控平台中的应用研究

来源 :湖北大学 | 被引量 : 0次 | 上传用户:javaname39
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
税收风险监控在我国税收事业的发展过程中即是重点也是难点工作。互联网、信息技术的快速发展为税收风险监控工作带来了极大的便利,良好的税收风险监控机制,不仅能减轻税务人员繁重复杂的风险排查工作,还能提高税务人员在风险应对中的应对质效。在风险应对案例抽样评价(以下简称案例评价)的风险评价工作中,面对大量已完成应对的风险案例,现有的案例评价工作机制在使用中主要存在两点不足:(1)抽样方法无法尽可能多的将有风险的案例抽取出来,造成税收的漏管问题;(2)面对税收风险监控平台(G税务局)风险识别准确,税务人员应对结论与平台识别结果一致,最后案例评价结果为满意的案例造成重复应对的问题。传统的抽样方法无法有效提高风险案例的命中率,且案例评价流程复杂,人员工作量大。本文结合案例评价中产生的相关问题,研究机器学习技术在税收风险监控平台中的使用情况。介绍了指标体系的构建和特征数据的生成,用案例评价中的评价结果和风险特征作为样本数据,通过案例评价结果满意度将样本数据分为“满意”与“不满意”两部分数据。采用相关的分类机器学习算法对样本数据建模,根据IV(Information Value)统计量筛选特征变量来提高模型的预测精度。最后,用AUC等评价指标对各个分类机器学习模型预测能力进行评价。经实验结果分析,由指标体系生成的风险特征数据,在GBDT进行特征处理后的Logistic回归算法适合案例评价数据的建模,能有效的区分风险应对案例在评价过程中的满意度。
其他文献
实际生活中众多图像都具有相似性,利用图像部分与整体之间相似性来实现图像的压缩编码算法,还有后续提出的利用图像部分与部分之间相似性,都可以被认为是基于分形理论的图像压缩编码算法,算法因其高的压缩比和良好的图像恢复质量而备受关注。然而,在编码过程中,基本分形图像编码算法需要消耗大量的时间去进行全局搜索,不利于编码效率的提高,同时,采用的减少码本数量的方法来优化编码时间,会给恢复图像带来块效应的不良效果
荧光共振能量转移(Fluorescence resonance energy transfer,FRET)是指供体分子以非辐射能量转移的形式将能量转移给受体分子,使供体分子荧光减弱,受体分子荧光增强或猝灭的光谱分析技术。近年来,基于荧光共振能量转移技术设计的生物传感器,具有噪声低、灵敏度高、抗干扰能力强等优点,备受医疗、农业、军事安全等领域研究人员关注,是目前的科研热点之一。通常,利用有机荧光染料
随着《中国制造2025》理念的提出,智能化制造技术成为工业界未来十年的主流研究方向。工业机械臂作为具有代表性的高端制造产业,具有更为广泛的应用场景。基于示教器编程的机械臂,自动化和智能化水平低,而将机械臂与视觉融合,使得机械臂更加灵活。虽然融合了视觉的机器人能够完成很多出色的任务,但是对于一些特殊任务需要人的参与,因此可以采用人机协作的方式来完成。为了提高人与机械臂的交互能力,提升机械臂的智能化水
本试验旨在研究在奶牛围产期添加不同水平的过瘤胃氯化胆碱(RPC),对其产奶量﹑奶成分以及部分血液生化指标的影响,探究RPC对奶牛相应血液指标的影响,为RPC在奶牛生产实践中提供
作为5G的关键技术之一,超密集网络的结构复杂,部署节点数量众多。若出现故障不及时消除影响,会导致网络性能显著下降。自组织网络的自治愈功能可以自主检测网络并对故障进行定位与恢复,而小区中断补偿作为自治愈的关键因素可以自动调整网络参数以消除故障的影响。因此,研究超密集网络(UDN,Ultra Dense Networks)场景下的小区中断补偿问题是非常重要的,但现有工作主要针对4G场景下的小区中断补偿
在我国经济发展步入新常态阶段后,城镇化、扩大内需是实现经济进一步增长的重要举措。2014年浙江省首次提出特色小镇这个概念,并结合当地实际进行了有效探索,被证明是行之有
近年来,多源数据的获取变得越来越容易,大规模的多源数据集为研究多模态学习提供了便利。同时深度学习的发展帮助多模态学习完成了巨大的飞跃。多模态学习是深度学习技术应用在计算机视觉领域的常见方法,例如跨模态的图像识别任务、多媒体内容分析与理解任务等。多源数据的普遍性和深度学习技术的发展使得研究多模态深度学习具有重要的理论意义和实际价值。多源特征融合作为多模态学习最早的研究方向之一,也是目前应用最广的研究
近年来,跨界融合成为了现代服务业中企业经营活动的新常态。通过跨界融合,新的业务不断被开发,用户因此享受到优质、新颖、便利的服务。与此同时,跨界融合也大大影响了企业组织架构的稳定性,为适应业务的调整,企业组织架构也在不断地进行调整和优化。而业务流程作为企业业务表达和实现的载体,应具备更强的自适应能力,以帮助企业和组织快速实现业务的深度融合。因此,如何提升业务流程的自适应能力成为业务流程管理领域的一个
苯并呋喃类化合物在许多天然产物和药物中普遍存在,研究发现,以苯并呋喃环为核心的杂环化合物是各种具有生物活性的天然药物和合成化学原料的重要中间体,它们的合成和应用在化学和制药行业中引起了相当大的关注。在前人及本课题组研究工作的基础上,本论文致力于发展钯催化的2-卤代苯并[b]呋喃与有机铝试剂的交叉偶联反高效合成2-取代苯并[b]呋喃类衍生物的制备方法。论文主要研究了金属钯搭配Xant Phos催化的
在当今创新驱动、共享经济大背景下,由于技术创新活动的复杂性以及创新风险的不断加剧,合作创新成了必然选择,企业间合作形成的创新网络目前已成为进行重大科技创新的重要组织形态。然而许多实践表明,创新网络这种组织形态失败率较高,一个重要原因就在于企业网络权力配置的低效。在创新网络中,节点企业由于所拥有知识、能力以及占据网络位置不同使得企业间网络权力各有差异,创新行为和网络效率受到权力配置的影响。因此节点权