论文部分内容阅读
本文研究联合数字图书馆的信息服务技术,力求合理地对各类海量数字信息进行组织、存储、检索和访问,并且有效地利用互联网的优势向用户提供海量数字信息服务。 本文首先研究了联合数字图书馆信息服务的基础构架,它提供联合数字图书馆信息服务所必须的基本功能,即一组核心服务;并详细阐述了联合数字图书馆的数字对象体系结构。数字对象体系结构提供对分布式数字对象的持久保存、安全访问、管理以及索引服务,从而使联合数字图书馆中的海量分布式数字资源成为用户的知识源泉。 数字对象体系结构中的信息检索技术具有挑战性,其发展趋势为:采用人工智能技术对分布式的联合数字资源进行语义检索。本文重点研究了这方面的若干关键技术,其中包括:联合信息检索中的搜索引擎选择;基于贝叶斯网络模型的智能信息检索技术;个性化信息服务。 本文的主要研究成果如下: (1)采用关联规则发现的方法挖掘术语之间的语义概念关系,提出了四种高效地计算术语间条件概率的方法,将这些语义概念关系存储于信息检索系统的贝叶斯网络模型中,从而支持基于语义概念的信息检索。 (2)引入相关术语集来描述资源的内容,并对术语问相互独立的假设进行改进,从而提高联合信息检索中搜索引擎选择的精确度和减少搜索引擎选择时的计算量。该描述方法为:用关联规则发现的方法得到相关术语集,存储相关术语集中的术语及其出现频度,通过得到术语间的相关关系来提高搜索引擎选择的精确度。 (3)采用基于知识和基于机器学习相结合的方法进行用户兴趣建模,其中包括采用多个特征向量表示用户的兴趣模型,以及提出了将用户的相关反馈信息和页面访问挖掘的方法相结合更新用户兴趣模型,从而快速、准确地发现用户的兴趣,并且将搜索结果结合用户兴趣模型进行分类和排列。 (4)提出了基于贝叶斯网络模型的用户兴趣联合推送方法,它利用贝叶斯网络模型表示术语间的条件概率和概念语义关系,预测不同用户兴趣的相似度以及用户兴趣模型和文档间的概念语义相似度,因此可以根据具有相似兴趣用户的访问信息主动推送信息,从而使用户方便地从联合数字图书馆中获得所需的高质量内容。 继续深入研究联合数字图书馆中的基于语义概念的信息检索和导航,以及更精确地进行个性化服务仍将是一些很有前景的引人入胜的课题。