重复记录清理相关论文
该文较详细、全面、简明地论述了数据仓库中的数据清理问题:介绍了国内外的研究现状,分析了数据中存在的问题(“脏数据”)、数据清理......
随着计算机的普及与Internet的发展,信息技术的大量应用,人们做决策时对数据的依赖性越来越强.通过了解数据清理的概念、意义,分析......
针对重复记录清理中的"排序、识别、合并"算法存在的问题进行了改进。改进后的重复记录清理算法在保证记录匹配率的情况下有效地提高......
本文改进了重复记录清理算法中所存在的缺陷。改进后的算法,有较好的记录的匹配率保证,而且显著提升了记录排序的效率;在重复记录识别......