论文部分内容阅读
实体分辨是数据集成、信息检索等领域的重要研究内容,目的是发现数据集合中的不同实体和同一实体的不同描述.将实体分辨过程划分为数据分块、记录比较和匹配决策等3个主要步骤.从记录聚集方式的角度介绍了实体分辨的数据分块方法;从字符串划分粒度的角度分析了实体分辨的记录比较方法;从记录关联方式的角度阐述了实体分辨的决策模型.最后对实体分辨研究下一步需要解决的问题进行了展望.