论文部分内容阅读
随着科技与时代的发展,Internet已经成为我们学习和工作的重要工具,与我们的生活密不可分。随着网络应用的普及,信息量以惊人的速度增长,并且更新频繁。人们面对的问题不再是缺乏有用信息,而是如何找到自己所需要的信息。传统信息检索技术满足了人们的一定需要,但仍然面临低查准率和低查全率问题。多数商业搜索引擎提供的信息检索服务,由于其通用的性质,不能满足不同背景、不同目的和不同时期的查询请求,用户如何在这浩如烟海的信息中找到自己想要的信息已经成为互联网技术的一个非常重要的研究课题。目前,对用户意图的信息检索的研究正处于十分活跃的阶段,许多自然语言处理、机器学习、人工智能等领域里的知识被应用到了意图信息检索的设计和实现中。本文探索如何从用户的查询和搜索引擎返回结果中获取用户的潜在意图,并利用获得的意图信息对检索结果进行改善。首先,给出了用户潜在意图的定义;之后提出了用TopicRank算法提取特征对用户的意图进行表示,并实现了基于TopicRank的意图聚类方法;然后给出了基于意图分析的网页重排,意图聚类后的类别排序基于TopicRank算法,意图聚类后的类内排序采用一种改进的向量空间模型;最后给出了一个基于意图检索原型系统的实验结果。实验表明,在检索中加入对用户意图分析能有效改善一般检索结果的显示,使不同用户能在很小的操作代价下迅速缩小检索范围,直接进入满足自己意图的搜索结果中。