基于函数依赖与条件约束的数据修复方法

来源 :软件学报 | 被引量 : 0次 | 上传用户:zhaohui1590
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济与信息技术的发展,在许多应用中均产生大量数据.然而,受硬件设备、人工操作、多源数据集成等诸多因素的影响,在这些应用之中往往存在较为严重的数据质量问题,特别是不一致性问题,从而无法有效管理数据.因此,首要的任务就是开发新型数据清洗技术来提升数据质量,以支持后续的数据管理与分析.现有工作主要研究基于函数依赖的数据修复技术,即以函数依赖来描述数据一致性约束,通过变更数据库中部分元组的属性值(而非增加/删除元组)来使得整个数据库遵循函数依赖集合.从一致性约束描述的角度来看,函数依赖并非是唯一的表达方式,还存在其他表达方式,例如硬约束、数量约束、等值约束、非等值约束等.然而,随着一致性约束种类的增加,其处理难度也远比仅有函数依赖的场景要困难.考虑以函数依赖与其他一致性约束共同表述数据库的一致性约束,并在此基础上设计数据修复算法,从而提升数据质量.实验结果表明,所提方法的执行效率较高.
其他文献
2009年对于中国是一个充满挑战的年份,国际市场需求萎缩带来的国内市场竞争加剧,更加要求企业从机遇型向战略型过渡。如果哲学地看待市场循环周期,经济低迷时代恰恰是企业向
<正>没有人会就此指望方法论。在各种情况下,这样的话语即使不空洞也是抽象的。因为,科学的方法论不应产生先验论,而应证明是针对具体挑选出的问题和对象。今天,我身为教师拒
青年教师在地方高校教师队伍中比例大,是学校发展的主要依靠力量。从弗鲁姆的期望理论出发,结合青年教师的期望特点,研究地方高校青年教师管理工作的激励问题,探讨期望理论在
目的分析优质护理模式在耳鼻喉科护理中的应用方法以及效果。方法于2016年3月~2017年4月作为本次研究时间段,在该时间段内选择在我院耳鼻喉科接受治疗的100例无典型特征的患
研究生是大学培养的高层次科技人才,是大学为提高国家在经济和科技全球化趋势下的竞争力而为社会储备和输送的资源。近年来我国的研究生教育规模不断扩大,接受研究生教育的人
我国高职院校国际合作办学在国家宏观规划和具体政策的引领下,经历了从尝试探索走向多元开放的发展历程。但是惠生性的合作目标与逐利性的合作现实的冲突、规范化的质量管理
中药质量标准是中药质量控制的核心文件。本文从中药新药研究与评价的角度,对既有的中药质量标准拟定模式和质量控制的思路进行了探讨。全面分析了中药质量控制研究所面临的
【研究目的】多胺包括精胺、精眯和腐胺,是调节细胞生长的重要物质,它可以通过改变DNA结构和调节信号传导途径等方式调节基因的表达,从而在细胞生长和分化过程中发挥着重要的
开发了一种叶片开孔曝气的新型搅拌设备, 并以清水实验条件为基础, 研究了该设备中气泡运动规律,选择传质理论中的溶质渗透模型, 从单个气泡的产生到上升至液面这一过程入手,
顶岗实习是高职土木工程专业教学的很重要的实践性教学环节,是将所学理论与实践结合的重要教学手段,学生在顶岗实习过程中的安全问题日益增多,在一定程度上影响到学生的顶岗