词关联度相关论文
随着互联网的发展,网络上出现越来越多的文本,人们迫切需要通过文本关键词快速获取文本的主要内容,以判断文本是否是自己感兴趣的......
本文回顾了通用的信息检索技术,尤其是向量空间模型及其改进、倒排索引技术。分析了现有方法的长处和不足。基于对语料的统计分析,......
随着Web信息多元化趋势的增强,给所有用户提供同一个通用搜索引擎入口已经不能满足特定用户更加深入的查询需求。在这一情况下,面......
如今网页排名算法很多,基本上可以分为两类:基于超链接和基于内容。比较成熟的算法主要有PageRank、HITS、LSI等。本文基于向量空......
基于对语料的统计分析,提出了词关联度的概念。通过对文本库中词语出现的频率,以及任意两个词语共同出现的频率进行统计,获得了各......