论文部分内容阅读
本文针对化工专业领域对元搜索引擎的个性化搜索进行了研究和实验。
在对当前搜索引擎技术、文本分类技术、用户兴趣建模技术,还有中文分词技术、网页解析技术等相关技术的分析与研究的基础上,对各种技术进行了很好的融合,提出了一种面向化工领域的、基于领域类别和用户兴趣的个性化搜索的解决方案,并实现了该方案的系统原型chemMetaSearch。
主要工作包括:
(1) 完成了化工领域元搜索引擎的个性化搜索系统原型chemMetaSearch的设计。提出了一个基于向量空间模型VSM的用户兴趣模型,在模型中实现了用户长期兴趣和短期兴趣的相互转换关系,并且引入遗传因子参数,模拟人类的遗传特性实现用户兴趣的实时更新。
(2) 设计和实现了化工领域文本分类器,构建了一个具有一定规模的化工领域文本分类语料库和较为合理的领域类别体系,并利用该语料库对贝叶斯分类算法与Rocchio分类算法进行性能测试,在系统原型中使用贝叶斯分类算法作为分类器的实现算法。
(3) 构建了一个具有一定规模的化工领域同义词库,对查询关键词进行扩充。
(4) 在系统原型中嵌入了用户信息定制功能模块。
以上工作已经在系统原型chemMetaSearch中实现。本文在对个性化搜索模块进行实验的过程中,通过实时跟踪用户兴趣模型权值的变化情况,可以发现系统能够根据用户的反馈动作实时更新用户兴趣模型,能较好的把握用户的兴趣并提供相应的个性化服务,达到预定的目标。