论文部分内容阅读
互联网给人们的生活带来方便。然而,互联网上的数据是海量的,并急剧增长,要从浩如烟海的数据中,找到需要的信息,有时不是很容易。搜索引擎的出现,给人们带来了方便。传统搜索引擎已经很成熟,在商业上也取得了巨大的成功。然而,传统搜索引擎一般基于关键词进行匹配,没有充分使用用户的个性化信息,缺少个性化特征。为了解决这个问题,个性化搜索引擎出现了,使用了用户的个性化信息,具有个性化特征,能满足用户的个性化信息需求。在本论文中,个性化搜索引擎是在传统搜索引擎的基础上,加入了个性化特征,以满足用户的个性化信息需求。个性化搜索引擎使用向量空间模型作为用户兴趣模型,描述用户的兴趣、行为。在个性化搜索引擎中,建立用户兴趣模型,更新用户兴趣模型,使用用户兴趣模型,对查询优化,对结果排序,实现个性化。用户兴趣模型是个性化搜索引擎实现个性化的关键,是本论文研究的关键。用户兴趣模型由特征项及其权值构成的向量表示。特征项及其权值可以描述用户的兴趣、行为。用户的兴趣、行为获取的方式有:注册用户提供兴趣关键词作为特征项,从用户输入的查询词提取特征项,通过用户点击从用户浏览的Web文档中提取特征项。获取用户的兴趣、行为,建立用户兴趣模型。为了更好地描述用户的兴趣、行为,用户兴趣模型需要更新。用户兴趣模型可以用来对查询优化,对结果排序。对查询优化,对于用户,用户兴趣模型中的特征项按权值从大到小排序,列出权值较大的特征项供用户选择,将选择的特征项与用户输入的查询一起进行检索。对结果排序,对于用户,计算每一个Web文档与用户兴趣模型的相关度,对结果按相关度从大到小排序。在传统搜索引擎的基础上,使用Lucene框架,使用用户兴趣模型,用Java实现了个性化搜索引擎PSE。个性化搜索引擎PSE使用了用户的个性化信息,通过建立用户兴趣模型,更新用户兴趣模型,使用用户兴趣模型,对查询优化,对结果排序,能满足用户的个性化信息需求。本论文的研究表明,在个性化搜索引擎中,使用用户兴趣模型,能满足用户的个性化信息需求。