基于数据挖掘技术的纳税人等待时间预测

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:wn206403
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着税务种类的增多,各种税务的办理前提和办理对象互有区别,并且有部分税务可以线上办理,给纳税人更加便捷的纳税体验。但是,有着大量的业务要求纳税人去线下进行办理,办税服务厅的纳税人数依然较多。纳税人不能知道自己将要等待的时间长度,并且在高峰时间段的等待时间过长,增加了纳税人的焦虑,以及浪费了大量的等待时间。因此,明确纳税人等待时间,能有效地减少纳税人等待过程中的焦虑,并能让纳税人根据需要等待时间的长度,合理地利用等待时间。本文则针对一办税服务厅提供的基本数据,利用数据挖掘技术,构建新的特征丰富数据维度,研究不同的基本模型最佳的特征组合,对纳税人的等待时间进行预测。通过得出影响模型预测能力的特征,不仅能准确预测等待时间,有效降低纳税人的焦虑,提供办税服务厅的服务质量,同时还能为在其它领域中,预测等待时间的研究,提供一定的参考价值。本文首先对影响办税服务厅等待时间的部分特征进行了介绍,阐述了本文研究的主要内容,总体路线和研究方法,提出了基于数据挖掘技术的纳税人等待时间预测的研究。本文重点介绍了如何利用数据挖掘技术,对纳税人等待时间进行预测研究。首先本文进行了数据分析,根据业务种类和服务窗口的不同,对数据进行了合并和分类。然后,从业务类型,等待时间,办理时间等多个维度来进行数据分析,并结合专家建议和人工排查,对某些异常数据进行了修改和删除处理。之后,因为业务学习日的下午会关闭办税服务厅,导致当天下午的数据样本缺失,所以,对此进行了人工合成正常数据,主要方式是迁移其相邻日期下午的数据样本。最后,通过对特征工程的介绍,本文从正办理,正等待,已办理等多个维度进行了特征构建,生成了众多高级特征,丰富了数据的维度。在模型构建上,本文通过使用不同的五种模型,对比随机预测和顺序预测的实验结果,证明了在随机预测上的采样分布更加均匀,弥补了由于数据样本过少导致顺序预测的训练集和测试集差异大的问题。通过对比特征工程前后的实验结果,证明了本次特征工程的正确性。通过对比特征选择前后的实验结果,证明了结合前后逐步法和校正决定系数的特征选择法的有效性。最后,几个不同模型得到了比较理想的预测结果。
其他文献
随着信息技术的迅速发展,每个人在享受着信息时代带来的高速信息传输体验的同时,海量数据也在持续产生,这其中往往蕴含着大量有待发现与利用的宝贵信息。数据挖掘的目标在于从这些大量的、模糊且有噪声的数据中提取出知识,近年来受到越来越多研究人员的重视,已经成为目前人工智能和数据库领域研究的热点问题。分类作为数据挖掘中的一个重要研究方向,旨在通过分类算法分析训练集,刻画重要数据类的模型,其中随机森林是一类分类
学位
近年来,瞬态成像技术作为一种变革性的成像技术,引起了人们的广泛关注。瞬态成像技术目的在于拍摄光线在场景中传播过程的瞬间状态,区别于传统的二维图像,瞬态图像通常是三维的,包含空间上的两个维度及时间维度。通过对瞬态图像的数据进行有效分析,人们能够准确的获取传统成像技术难以得到的与场景语义密切相关的关键信息(位置、边缘、材质等),进而实现其在混浊介质下的深度测量、材质识别、非视距下的成像等计算机视觉相关
学位
目的:调查某院口腔科中成药使用现状,探讨用药安全管理策略。方法:随机选取2019年8月—2022年8月医院口腔科患者收治的500例患者为研究对象。分析患者一般信息、疾病构成、中成药剂型、中成药使用情况、使用期间不良反应发生情况,并统计口腔科中成药不合理处方类型与因素分析,并通过分析各因素的相关原因,整理综合后绘制鱼骨图,探讨用药安全管理策略。结果:500例患者种涉及口腔疾病前三位分别为牙髓炎、口腔
期刊
人类的生产活动离不开对物体颜色的感知,色彩是我们观察、理解世界的重要途径。对物体颜色的精准采集能够促使我们更好的理解世界。随着成像技术的发展,数字化图像的应用,我们不用到现场便能得到有关物体的颜色信息,可以使我们更为方便快捷地了解世界。成像技术发展的同时也促进了计算机视觉技术的进步,因此也带来对高精度色彩获取的更高要求。而高光谱成像技术为计算机视觉任务所面临的高精度色彩获取问题提供了高效的解决办法
学位
云计算技术的日益成熟,使用云端存储数据在日常生活中逐渐得到普及。出于对隐私的保护,用户往往会在数据上传到云端服务器前对其进行加密。虽然云端服务器容量非常大,但随着大数据时代图像视频数据等的指数级增长,云端面临在无解密密钥情况下对加密数据进行压缩的问题。接收端获取加密压缩数据后,对其进行联合解压和解密操作,以高质量恢复原始数据。现有加密图像有损压缩文献中,云端通常采用基于压缩传感、标量量化、均匀下抽
学位
目前,推荐系统在人们的生活中应用广泛,尤其是餐饮业,给用户带来便利的同时更带来巨大的商业价值。用户使用相关的餐饮APP时,产生相应的就餐信息,包括消费者注册产生的用户属性信息、对消费餐馆的评分信息、评论信息、就餐时间等。餐馆经营者上线餐馆产生的餐馆属性信息,如地址、营业时间、环境、口味等。如何利用这些信息,实现对用户的精准推荐,已成为众多推荐系统研究者研究的重点。本文通过融合用户评论信息、用户社交
学位
基于通用3D(Three-Dimension)建模系统的传统手工建模方法存在学习周期长、建模效率低和模型质量依赖人工经验等不足。在上述背景下,鞋企对专用鞋类3D建模系统的需求越来越大。本文在鞋类产品开发流程分析的基础上研发基于2D(Two-Dimension)设计稿的3D建模系统,旨在为鞋跟的自动化建模提供一种快速有效的解决方案。作为鞋类产品的重要部件,鞋跟是产品外观和穿着舒适度的重要影响因数之一
学位
目的:调查分析某三甲中医院口腔科中成药应用现状。方法:从医院信息管理系统中提取2020年口腔科中成药用药处方600张,调查中成药应用现状。结果:疾病构成主要为牙周炎、牙髓炎、口腔溃疡、智齿冠周炎和牙龈肿痛。剂型为颗粒剂、胶囊、口服液、喷雾剂和散剂。DDDs排序在前6位的中成药有康复新液、口炎清颗粒、黄连上清胶囊、外用溃疡散、口腔炎喷雾剂、银黄颗粒,均为低价中成药。结论:医院口腔科中成药以消炎抗菌、
期刊
随着商品市场竞争的加剧,目前商品市场上用来防伪标识的条形码、二维码还是存在着很多局限的地方。条形码的存储信息方式目前只有水平方向存储,垂直方向不存储,高度通常是为了便于扫描设备的对准;保密性较低,损污后的可读性差。鉴于以上条形码和二维码的局限性,本文提出一种新的防伪标识码—分形码。本文设计的分形码结构是基于一种根式函数曲线表达式生成的结构,这种分形码的形状是个正立的三层满四叉树结构。这种分形码的结
学位
大数据时代已然来临,价格预测已成大势所趋。2019年下半年生猪市场受到非洲猪瘟的影响,价格波动剧烈。生猪价格预测已经成为了许多学者研究的热点。生猪价格的预测,不仅具有一定的学术意义,而且对于生猪养殖企业的战略布局和生产调控有很大的应用价值。企业根据预测结果对生猪产能进调控后,不仅能扩大收益减小损失,而且生猪市场的生猪价格会随着生猪的供应量稳定逐渐平稳。本文通过研究温氏集团历史生猪价格的涨跌规律,建
学位