【摘 要】
:
数据集成是大数据技术的初始环节,通过将相互关联的多源异构数据集成到一起,为数据的分析和应用提供基础。不同来源的数据质量良莠不齐,存在诸多问题,依靠人工分析解决费时费
【机 构】
:
军事科学院系统工程研究院后勤科学与技术研究所
论文部分内容阅读
数据集成是大数据技术的初始环节,通过将相互关联的多源异构数据集成到一起,为数据的分析和应用提供基础。不同来源的数据质量良莠不齐,存在诸多问题,依靠人工分析解决费时费力。针对这一情况,提出基于关联规则的数据质量分析与修复方法,通过定义数据项之间的关联规则,建立数据关联模型,自动根据模型检测数据集合是否满足关联关系,判断数据是否符合质量要求;通过指定数据修复策略,对发现问题的数据进行自动修复。通过示例形式对方法进行了说明,并在方法基础上设计了数据质量分析与修复系统。
其他文献
针对工业控制器等对异步串行通讯应用的广泛需求,基于Verilog HDL语言设计了一种波特率、校验类型、帧长度等参数可灵活配置的UART模块,并采用Modelsim进行了行为级的功能仿
针对分布式电源(Distributed Generation,DG)出力的随机性和负荷的波动性,以有功网损、电压偏移为目标函数建立有源配电网多目标无功优化模型。采用改进三点估计法将不确定潮
目的以精湛的技能服务于患者为目标,实施规范化培训,努力提高护士的专业技能.方法根据护士职称进行分层次培训.结果护理三基能力、专科护理能力、科研创新能力、自学专业能力
随着腔镜外科和胎儿手术的发展,妊娠期间行外科手术治疗的病例越来越多。为这类患者实施麻醉时,必须确保母体和胎儿的安全,尤其要注意全麻药可通过胎盘对胎儿的神经发育造成
创意生态平台是互联网平台经济与文化创意产业相结合的一种新的经济形态。在创意生态平台中,腾讯通过在内容层、渠道层和用户层搭建子平台群,将众多创意个体和文化企业吸纳进
目的规范临床教学查房,确保临床教学质量。方法选择2007年在本院实习的临床医学本科班学生80名,进入普外科实习后,采用规范的临床教学查房方法:查房前师生准备、查房中系统病史查
目的探讨特大地震后成批伤员的现场急救处置和有序转运效果。方法回顾性总结汶川特大地震后青川木鱼中学98名伤员的现场急救和转运。结果通过医务人员现场急救处置后98名危重
对于中职院校的学生而言,公共艺术(美术)课程是一门必修公共基础课,对于专业知识的学习意义重大。本文从美术课程校本化的目标出发,对其校本化实践方式进行了分析和讨论。
目的探讨早期康复训练对脑卒中患者吞咽困难的治疗效果。方法将82例脑卒中患者随机分为治疗组和对照组各41例。对照组采用常规治疗,治疗组在常规治疗的基础上实施早期吞咽功
目的:探讨肺内直径≤10 mm纯磨玻璃密度结节(pure ground glass nodule,pGGN)进展的危险因素。方法:将2010年3月-2016年3月广东省深圳市南山人民医院收治的67例经CT检查确诊