论文部分内容阅读
基于用户兴趣的个性化搜索引擎是为了满足不同用户的需求,利用用户的兴趣主题内容,提出的以用户个体为中心的搜索引擎。其目的是更好地为不同兴趣的用户提供个性化服务。随着网络信息的快速增长,个性化搜索引擎为不同兴趣、不同知识背景的用户提供更为方便的检索系统,并能够得到更好的检索效果。
本文围绕着基于用户兴趣的个性化搜索引擎的研究逐步展开,针对个性化搜索引擎的关键技术——用户兴趣存储模型的定义和算法进行了深入的剖析,并在传统的用户兴趣树结构基础上改善了原有的存储结构,并设计相应的创建、更新用户兴趣树等算法。
其次,本文提出了用户更新速率(UUR)的概念。用户更新速率,是用来判断用户兴趣变化的快慢,依照用户更新时,兴趣特征词的权值变化和新词的增加数量,量化用户兴趣变化的快慢。这样可以使系统自动的设定下次用户兴趣树的更新时间,从而可以根据用户不同的浏览行为,更好的拟合用户兴趣,以获得更好的查全率和查准率。
另外,本文深入介绍了有关个性化搜索引擎的相关技术,着重介绍了兴趣相关度的定义以及获取兴趣相关度的方法。
最后,为了考察用户兴趣模型和用户更新速率(UUR)的作用效果,设计了相应的实验。实验一获取了在用户兴趣模型下,检索系统的查全率和查准率;实验二模拟两个用户的不同浏览行为,获取了UUR参与下的更新速度。实验最后,系统对在UUR参与下和没有UUR参与下的用户兴趣模型进行了检索效果方面的比较。结论是,在用户更新速率(UUR)参与下的用户兴趣模型更能够快速模拟用户兴趣变化,从而在检索系统中能够达到更好的查全率和查准率。