记录匹配相关论文
对于建立在数据仓库之上的决策支持系统,数据的正确性对避免错误的决策是至关重要的,错误的数据将会导致"垃圾进,垃圾出".因此在构......
在信息集成等应用领域,会产生同一实体的不同描述记录,这些记录往往会在属性值上存在描述性的差异。导致描述性差异的原因有很多,例如......
数据质量已被公认为是数据管理的首要问题之一。针对数据质量管理领域的数据记录不匹配及不一致问题,本文分别从记录匹配检测及不......
记录匹配的主要工作是合并两个及多个不同来源的文件,当文件中缺乏唯一的标识符时,此问题的研究则被视为一个富有挑战性的问题。本......
实体匹配旨在找出多个数据源中表示同一实体的记录。实体匹配是数据有效使用的前提和关键,广泛应用于数据清洗、数据冗余检测、数......
美国路易斯安纳州,靠近查理湖边不远的地方,侦探列斯正站在路边试图寻找着什么.这里就是当年发现莎瑞尸体的地方,七年过去了,还没......
一、PES数据分析模型由于抽查不只是对普查的重复,而是针对已进行的调查来收集"真实值"的一种方法.在中国,PES的入户访问是按与普......
为了提高数据集中相似重复记录的检测效率,提出一种基于属性权值的分组聚类算法。该方法在记录集中选取特征属性,通过设定的权值对......
链接跨组织数据库中表示同一实体的记录,同时保护存储在这些数据库中实体的隐私,是安全有效地整合多源数据资源的核心技术之一。然......
记录匹配算法在异构数据的集成和数据开采等领域应用广泛,其主要任务是找出来自不同数据源中代表同一对象实体的记录,这些记录具备......
实体识别是确定多个数据记录对应的是否为同一个真实世界实体的过程。在基于相似度和概率的记录匹配技术的基础上增加数据预处理和......
提出了一种基于聚类技术的多数据源记录匹配算法,该算法运用的罩盖(Canopy)聚类技术是一种专门对付大型数据的聚类方法,此算法不仅......
传统实体识别中有两种常用的方法:一种方法是基于概率模型的机器学习方法;另一种方法是依靠领域知识作度量标准匹配的方法。在基于......
针对现有记录匹配方法需要相关领域专家大量的人工参与或严重依赖于启发式规则,且无法处理大规模数据的问题,提出一种基于局部CON......
随着计算机网络和数据库技术的飞速发展以及人们获取数据手段的多样化,我们所拥有的数据量急剧增加。但是基于劣质数据的决策是不......
移动互联网颠覆了人们的生活方式,互联网+商户为吸引客户消费出台各种优惠信息,但是这些信息散落在互联网各处,用户有时需要同时安......
在当今世界,企业信息化的要求越来越迫切,其中一个重要的的方面就是企业的数据的管理,根据“进去的是垃圾,出来的也是垃圾、(garbage i......
信息技术的飞速发展使组织的管理者进行决策分析时对数据的依赖性越来越强。于是在数据库的基础上产生了能够满足决策分析所需要的......