论文部分内容阅读
对于现今的互联网用户来说,要从这个巨大的信息库中找到自己感兴趣的资料委实不易,他们往往需要付出很大的代价去仔细搜寻。而目前大多数的信息检索工具都把重点放在了信息资源的内容和结构的分析上,而没有考虑去理解用户的真实意图。事实上,用户访问互联网的过程中隐含了大量能够反映用户需求的信息,其本身也能够用来协助用户的检索过程。从这个角度出发,本文提出一个基于用户访问模式的文档数据库信息检索模型。根据用户的访问记录,以及每次检索输入的关键词挖掘出用户的访问模式,然后以发现的用户访问模式作为用户信息需求,将文档数据库中的文档分类,建立用户信息需求与文档类别间的映射关系。在用户访问过程中,结合用户当前的浏览动作,利用贝叶斯网络对先验知识较好理解的特点,对用户的信息需求进行分析推理,动态跟踪用户需求意向,并优先返回用户感兴趣的文档,简化检索过程,提高WEB资源的使用效率。本文从访问模式挖掘方法的一般步骤出发,详细描述了整个模型的构建过程,具体分为五个部分:首先是本文研究的理论基础和工作背景的简单介绍;接下来阐述对数据源的预处理,包括数据裁剪以及在此基础上所定义的一些概念;然后是用户访问模式的挖掘和文档的分类;第四部分描述了贝叶斯网络在模型中的具体应用;最后是对模型性能的分析。其中用户访问模式发现以及贝叶斯网络的引入是本文的主要工作,也是模型的核心组成部分。