论文部分内容阅读
元数据在许多领域都有其具体的定义和应用,其最简单的一个定义是:关于数据的数据,即描述某一资源的结构化数据。它为各种形态的数字化信息单元和资源集合提供规范、普遍的描述方法和检索工具。海洋文献元数据是关于海洋文献信息的数据,是对海洋文献各个对象的描述,这种描述就是对文献作者,文献发表时间,作者研究领域,作者所属机构等反映文献基本信息的定义。目前大量的基于XML/RDF描述的元数据已在使用,但对资源对象元数据的检索却沿用传统数据库检索技术,仍使用基于关键字匹配的传统图书馆及信息科学编目语言查询技术,查准率和查全率都不高,不能满足用户的需求,所以如何有效地查找和发现对用户有用的信息已经成为信息系统要解决的关键问题。目前,信息检索技术可分为3类:全文检索,数据检索和语义检索。其中,语义检索强调的是基于知识的、语义上的匹配,因此,在查准率和查全率上有更好的保证。本体具有良好的概念层次结构和对逻辑推理的支持,因而在信息检索,特别是在基于知识的信息检索中有很好的应用前景。所以,把本体的语义推理能力合理有效地应用到使用元数据的信息系统中,是前景很广阔的方法。本文是在王存刚的基于ontology的智能信息检索系统的研究基础上,针对其原型系统中面向海量元数据,检索速度迟缓的问题,在语义检索领域引入分布式并行检索方法,以海洋文献本体为例,提出基于海洋文献本体的分布式并行检索策略,建立了基于本体的分布式并行检索模型。该模型实现了基于本体的同义词、近义词、上下位词的并行检索,解决了其面对海量数据检索速度迟缓不能满足实际需求的问题,从而使系统更加趋向实际应用,拥有实际应用的价值。实验结果证明,该方法不仅平台容易搭建,检索时间比传统检索短,而且可以减少服务端的负载,从而有效提高检索效率。