基于模型驱动的数据清洗组件研究

来源 :云南电力技术 | 被引量 : 0次 | 上传用户:qutong19921107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据清洗能够提高数据质量,保证数据的可用性、可靠性、一致性、完整性、有效性和唯一性,有效满足不同业务场景的数据分析和清洗需求。本文通过对数据清洗的功能架构、技术架构、数据备份、数据清洗、数据存储模型和清洗模型驱动的研究,建立面向多类型数据库的自定义数据抽取机制,自由灵活的建立数据分析清洗对象集,基于建立的数据集,进行纵向计算与分析,数据列与列之间的横向逻辑和数学计算,掌握数据集的特征。通过对数据相似度比较、数据异常识别、数据越限判断和数据缺失统计等算法的融合,结合基于模型驱动的数据清洗流程,可根据统计分析
其他文献
近年来,我国中小企业获得了蓬勃发展,可是,在资金融通上,尽管中小企业的融资渠道逐步拓宽,但与中小企业发展中旺盛的资金需求相比,还是难以满足现实需要。银行由于为了降低信贷风险
近年来国际社会积极倡导低碳经济,以应对全球变暖的气候环境。在低碳经济浪潮崛起的背景下,国际碳交易市场应运而生,并形成了多元化市场格局和不同层次的制度框架。开放经济条件
为了打破欧美燃气轮机组在国内海洋开采领域内的垄断地位,中海油湛江分公司东方终端自备电站项目通过引进乌克兰UGT6000轻型燃气轮机为核心,依靠国内技术力量进行辅助、配套
介绍了一套输电线路带电补加销子工具,通过在绝缘操作杆一侧安装补加销子专用工具,来解决输电线路销子缺失故障。经过模拟实验和实际线路作业验证,该工具可以避免停电作业,同
炼油企业现行吨油加工成本对反映原油加工过程的成本状况存在一定缺陷,造成吨油加工成本指标纵向和横向的可比性都存在一定问题,不能很好地反映炼油企业的成本状况和盈利能力。
随着现代社会的发展,能源已经成为我们社会发展不可缺少动力,为人们的生存发展提供了物质条件,而电力就是现在社会发展不可缺少的一种能源,变压器这种店里传输的重要设备,也
介绍在进行现场电压互感器检定时,负荷箱作为提供二次负荷的设备需要放置于被试互感器下方,每进行一次负荷切换都需要人工完成。而进行试验的位置离负荷箱的距离随电压等级的升
为了复现配电网单相接地故障时的暂态过程,需要对接地时刻相位角度准确控制。对相角控制技术进行了研究,用实时调整或阶段调整的方法缓解相位控制技术一致性差的问题,该技术应用
总述:16万亿元人民币,这是中国“十二五”规划到2015年化工行业的总产值目标,而发展目标为年均增速保持在10%以上。中国化工行业中的企业如何在“十二五”的“科技、标准化、质量
一、检定依据JJG49-1999《弹簧管式精密压力表及真空表》检定规程。