ETL中数据清洗技术在税务系统中的应用

来源 :科技广场 | 被引量 : 0次 | 上传用户:nwhitewolf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
ETL即数据抽取、转换、装载的过程,它是构建数据仓库的重要环节,而数据仓库是面向主题的、集成的、稳定的且随时间不断变化的数据集合。数据清洗是一个减少错误和不一致性、解决对象识别的过程,目前有很多数据清洗研究和ETL研究,但是如何在ETL过程中进行有效的数据清洗,此方面研究不多。本文将以此为问题出发点,探讨ETL中的数据清洗技术在税务系统(贵州省省直属局和九个地市州的原始数据)中的应用。
其他文献
目的:建立麦迪霉素胶囊效价的微生物比浊法。方法:分别采用微生物比浊法和管碟法对麦迪霉素胶囊的含量进行测定和比较研究。结果:麦迪霉素胶囊效价测定的线性范围为1.0—3.3U/ml;r=0
铸造充型过程的数值模拟技术是铸造领域的前沿技术。采用这些技术进行充型过程的数值模拟可以帮助人们更清楚地了解充型过程中金属液流动的自由表面和速度分布。为了给薄壁压
目的:通过对硫酸头孢噻利合成方法的研究,为研制适合我国国情的硫酸头孢噻利的生产工艺奠定基础。方法:以3-氯甲基型新型活性头孢菌素中间体ACLE为起始原料,合成硫酸头孢噻利。
目的:建立降糖宁胶囊中人参皂苷Re的含量测定方法。方法:采用甲醇超声,二氯甲烷脱脂,水饱和正丁醇提取,双波长薄层色谱法测定制剂中的人参皂苷Re的含量。结果:人参皂苷Re对照品在0.5
随着当前互联网的飞速发展,当前使用的基于IPv4网络协议下的地址数显得越来越匮乏,因此IETF提出用IPv6协议取代IPv4协议。IPv6具有诸如海量地址、组播、邻居发现、自动配置等许
很多物理问题中都直接或间接含有“约束”,这些约束的存在增加了题目的难度,强化了思维的复杂性,给我们解题设置了障碍,然而这些“约束”也是解决问题的关键点和突破口,倘若我们能
反证法是分析问题和解决问题的一种科学方法,它是通过证明与论题相矛盾的反证题不成立,来确定论题是正确的间接证明法.在应用反证法时,首先要假设,即假定原命题的反面正确,然后从假
患者,女,20岁,无业,因鼻衄、呕血、血尿3 d于2006年10月23日入院。患者于1周前因“上呼吸道感染”(当时测体温正常),自服速效伤风胶囊(2粒,3次/d)3 d,遂出现鼻衄、呕血、肉眼血尿
近日,国家发展与改革委员会与建设部、公安部、财政部、监察部、环保总局等六部委联合下发文件,要求各地不得以缓解交通拥堵为理由,专门对节能环保型小排量车采取交通管理限制措
【正】看到题目您一定会说,如今谁不会用空调啊?其实不然,随着夏季的到来,空调的使用频率逐渐增加,那么如何使用、如何保养,才能让空调在正常使用的情况下,既省电节能,又有利