论文部分内容阅读
虚拟实验室是一个全面支持e-Science的综合性协同工作环境,是由支持资源共享与协同工作的硬件、软件、数据、信息等资源和人员组织共同构成的有机的整体。其中,协同文档库(Colibrary,简称CLB)是其重要的核心工具集之一,负责提供文档协同部分的功能。随着信息量的增加,面对用户个性化的信息需求,传统搜索引擎日益显现其不足。如何快速的进行文档定位,使用户快捷有效地找到感兴趣的文档是CLB需要解决的一个关键问题。
本文旨在研究和实现一个个性化文档检索系统,通过收集和分析用户信息来了解用户的兴趣,为不同的用户推荐其感兴趣的文章。本文研究分析了通用搜索引擎技术和基于用户偏好的个性化搜索技术,并在此基础上,结合开源项目Lucene和实验室项目CLB,研究协同工作环境中个性化文档检索技术,从而为科研用户提供个性化的服务,使其信息需求得到最大程度和最高效的满足。
本文取得的主要成果有:提出了一种协同工作环境中个性化文档检索系统的体系结构:围绕该体系结构重点研究了用户建模技术,包括数据收集、模型表示、模型学习和模型更新等技术,并给出了各个模块的算法;并在分析和利用开源项目Lucene的基础上,结合实验室项目CLB的需求设计和实现了一个原型系统;最后通过实验证明了本文设计的个性化文档检索系统的有效性。
本文是对协同工作环境中个性化文档检索技术的一个探索,取得的成果在有关科研项目中得到初步应用,并为进一步研究基于标签搜索打下一定的基础。