论文部分内容阅读
科技文献是由文章的作者、标题、摘要、子标题、正文和参考文献等内容组成的,这些内容构成了科技文献的结构化特征。现有的科技文献检索系统都是基于关键词的检索,就是指将科技文献的这些内容以关键字的形式作为检索条件来进行检索。本文一方面结合用户的偏好关系,通过粒计算的理论和方法来讨论科技文献粒的构建和结构,并以此为基础构建了科技文献检索模型;另一方面,针对用户偏好关系的获取情况设计了一个眼动实验。
本文的主要工作如下:
1、现有的研究主要是结合用户的偏好关系,通过粒计算的理论和方法来讨论科技文献粒的构建和结构,并以此为基础构建了科技文献检索模型。本文针对科技文献的结构化特征,并基于这种结构化特征把科技文献表示成几种不同的形式,通过粒计算的方法来分析关于科技文献的粒结构和层次结构的表示。对于用户的偏好关系,通过粒计算中粒结构的特性来对用户偏好关系进行形式化描述。基于用户的偏好关系,来推断科技文献之间的相关度。利用布尔模型和向量空间模型对相似度的计算,来对检索结果进行排序,以此来提高科技文献检索的效率。
2、对于用户偏好关系的获取情况,本文设计了一个眼动实验。在信息检索中,结合多种信息源可以提高搜索的准确性。通常情况下,从一个较大的文献集合中最快最有效的搜索到用户想要的科技文献是很困难的。大多数信息检索系统都是依赖于显式反馈机制,就是使用户可以明确地知道其检索到的文献是否相关。为了更好地处理这种较大的数据集,使用户能够查找到最相关的文献。本文提出了一个新策略,结合科技文献的结构化特征,以及从用户眼动获取的隐式反馈信息对检索结果进行排序。
总之,本文就是基于信息检索系统的特点,从科技文献的粒结构表示以及用户的偏好关系的角度出发,建立了一个基于用户偏好关系的科技文献检索粒计算模型。