论文部分内容阅读
由于互联网的高速发展以及搜索引擎的技术限制,目前搜索引擎的查询信息很难覆盖到整个网络。有调查表明,现有搜索引擎所返回的查询结果往往不符合用户的查询需求。如何真正以用户为中心进行搜索,把与用户相关的搜索结果排列在搜索结果集的前面,同时滤除与用户无关的信息,让搜索到的结果具有更加明显的个性化特征已经成为当前搜索领域的研究热点。为了解决互联网海量信息与无差别的信息获取之间的矛盾,个性化搜索技术应运而生。 本文从用户兴趣模型、网页分类算法和个性化网页排序算法三个层次对基于用户兴趣模型的个性化搜索进行研究。主要工作如下: (1)通过用户兴趣主题树的结构组织建立用户兴趣模型,应用一种改进的TF-IDF算法,通过引入文档结构权重的定义对传统的基于词频的 TF-IDF算法进行修正。