论文部分内容阅读
量的与日俱增为人们带来了信息共享的快乐,同时也带来了“信息迷航”和“知识匮乏”等问题。人们希望快速地得到自己需要的并具有个性的信息。对搜索引擎的检索结果进行个性化研究是解决该问题的有效途径之一。
本文提出利用相关反馈技术进行用户兴趣获取,然后根据用户兴趣对搜索结果进行个性化过滤与重排。即通过提取用户感兴趣的Web文本特征词及用户对初始检索结果的反馈获取用户的兴趣,并以此建立动态的用户兴趣模型,从而使搜索结果呈现个性化特征。
本文研究和分析了实现这些功能的一些关键技术,如特征提取、自动分词、遗传算法等。主要包括Web文本预处理、文本特征提取、网页特征与用户兴趣相似度计算等功能。Web文本预处理模块将Web文本进行清洗,去除内容无关项;文本特征提取将提取网页特征,形成网页向量空间模型;网页特征与用户兴趣相似度计算是分析网页与用户需求相关度的最重要的手段。
本文详细介绍了系统的设计与实现过程,讨论了提供网络搜索个性服务的途径和技术,并将之与流行的几大搜索引擎的搜索结果进行了实验比较,得出本系统在个性化方面的优势。