近似复制文本检测相关论文
如今的互联网领域时刻都在产生海量的数据,文本数据是重要的组成部分。在这些文本数据中,存在大量的近似复制文本,这些相似程度很高的......
如今的互联网领域时刻都在产生海量的数据,文本数据是重要的组成部分.在这些文本数据中,存在大量的近似复制文本,这些相似程度很高......
海量文本数据近似复制文本检测在现实生活中具有广泛应用,如相似网页检测.提出了一种基于MapReduce的相似文本匹配算法,给定一个文......