企业与自然人数据归集的设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:lunlunyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国家税务总局作为统筹全国税务数据的负责单位,在金税三期工程在全国范围内顺利推广上线之后,提出了将全国税务数据集中予以挖掘分析以及利用,因此金税三期子项目即大数据云平台项目应运而生。大数据技术在各行各业的不断普及应用,使得运用大数据技术解决税务问题已经成为税收现代化建设的重要指标之一。全国税务数据范围覆盖国、地税70+个上线单位的源头数据、总局和各省局的外部门交换数据以及从互联网渠道获取的开放数据。考虑这些数据量大冗杂的特性,本文系根据国家税务总局提出的关于数据归集的实际需求,完成了企业与自然人数据归集系统的设计与实现。本文基于软件工程处理问题的思想,描述系统的需求分析和设计实现的语言采用的是UML(统一建模语言),采用RUP(统一过程)的软件开发方法,利用阿里搭建的税务专有云平台为框架,全面分析了企业与自然人数据归集系统的6个子系统,并且对各个子系统进行了详细的设计与实现。目前,系统完成了包括数据同步配置文件产出管理、datax脚本调用管理、同步任务执行管理、编码转换管理、数据预处理管理、数据相似度计算管理以归集MapReduce实现管理等在内的一系列功能模块。应用于税务专有云平台开发环境中,经过测试后基本满足了总局提出的关于归集的业务指标,达到了预先估定的效果要求,较好的实现了全国71家税务单位企业与自然人数据的高效准确归集,增强了税务数据的可用性,为后续税务数据的应用展示提供了高质量的数据服务。由于本次研究所用的数据为特点明显的税务数据,所用的平台为阿里的MAXCOMPUTE平台,因此只适用于处理税务相关的需求,具有一定的局限性。但在处理税务数据方面仍具有很强的可用性。
其他文献
随着计算机技术的迅速发展以及计算方法的不断进步,计算机分子模拟技术广泛应用于科学研究领域,已经成为与实验、形式理论并驾的科学发现的三大支柱。在计算生物方面,利用同
为了降低固体燃料消耗和强化烧结,在考虑烧结用焦粉和烧结工艺特点的基础上,制备出适用于焦粉燃烧的催化助燃剂,并在河西堡铁厂进行了添加助燃剂的工业试验.结果表明,在该厂
今年9月初,新疆富蕴金山矿冶有限公司直接还原球团项目启动,业主对所有设备实行公开招标。通过激烈的投标竞标,中冶长天以其先进的专利技术和制造技术、合理的投标价格、良好的
研究了高铁低硅烧结矿的铁品位和SiO2含量与固体燃耗的关系,以及提高生石灰配比和添加蛇纹石对烧结矿产质量和固体燃耗的影响,从而找到了降低高铁低硅料烧结固体燃耗的途径.
如何提高学生的整体素质是摆在高等职业教育面前急待解决的问题,本文从学生的德育素质和智育素质两方面进行探讨。
为了及时、准确诊断烧结过程的异常状况并及时消除异常,本文将Rough集和神经网络相结合,建立了烧结过程异常状况智能诊断系统.基本思想是首先利用Rough集对知识库进行约简,然
文章分析了常见智能审校软件的不足,简要回顾了方正电子研发智能审校系统的背景,并从产品定位、优势特点、功能设计等方面进行了较为详细的阐述。
川渝自古一家亲。日前,四川省党政代表团赴重庆市学习考察,双方签署了《深化川渝合作深入推动长江经济带发展行动计划(2018-2022年)》和12个专项合作协议。这标志着两地继近年来
报纸