重复记录识别相关论文
针对重复记录清理中的"排序、识别、合并"算法存在的问题进行了改进。改进后的重复记录清理算法在保证记录匹配率的情况下有效地提高......
数据清理转换是数据仓库中的一个重要研究领域,其技术难点之一是重复记录的识别。介绍了与重复记录识别相关的字符串匹配方法,详细......
本文改进了重复记录清理算法中所存在的缺陷。改进后的算法,有较好的记录的匹配率保证,而且显著提升了记录排序的效率;在重复记录识别......
采用对不一致数据上的修复以及将记录上的属性值用概率表示来解决不一致数据库中相似重复记录的识别。目前对重复记录识别的研究都......