文档相似性相关论文
关键词是能表征文档特征和主题的最小单元。关键词提取任务是指从文档中自动提取主题性或重要性的词或者短语。由于信息技术不断发......
现在随着人们对互联网上的信息需求越来越大,能够准确快捷的获取到信息已经成为了搜索引擎研究方面的热点问题。在这其中,排序成为了......
PCCS是为了帮助 Web用户从搜索引擎所返回的大量文档片断中筛选出自己所需要的文档 ,而使用的一种对 Web文档进行快速聚类的部分聚......
为了克服现有文档相似性模型对文档特性拟合的不完全性和缺乏理论根据的弱点,本文在统计语言模型的基础上,提出了一种基于混合语言模......
PCCS是为了帮助Web用户从搜索引擎所返回的大量文档片中筛选出自已所需要的文档,而使用的一种对Web文档进行快速聚类的部分聚类分法,首先对......
相似文档检索在文档管理中是很重要的,提出一种在大文档集中基于模糊聚类的快速高效的聚类方法,传统方法大都通过词与词之间的比较来......
针对基于EMD(Earth Movers Distance)的文档语义相似性算法不满足度量公理因而难以在信息检索与数据挖掘中推广应用的问题,该文提......