论文部分内容阅读
随着全球网络化、信息化的发展,信息检索技术在处理网上爆炸性增长的信息资源时显得尤为重要。但传统的信息检索技术主要是基于字符串匹配的关键字检索技术,对语义匹配的支持能力较差,信息检索的查全率和查准率难以令人满意。为此,Tim Berners-Lee于2000年提出了下一代万维网语义Web的概念,旨在赋予万维网上资源唯一的标识,并在资源之间建立起机器可处理的各类语义联系。语义Web是对当代万维网的扩展,能够以一种明确的、形式化的方式来表示信息资源。语义Web的提出和发展为语义检索的实现开辟了一条崭新的思路。要实现语义Web的美好远景,Web中的知识表示是最根本、最重要的问题。本体(Ontology)作为共享概念模型的形式化规范说明,可以把现实世界中的某个领域抽象成一组概念和概念之间的关系,提供对某个领域的普遍、共享的知识表示,并且这种知识能够被计算机理解。本体作为实现语义Web远景的桥梁,一端是对现实世界的语法表达,另一端是这种表达的抽象概念模型。通过将各种信息资源向知识本体层的映射和语义推理处理,可以充分发掘资源之间蕴含的关联关系,从而在根本上解决了检索中的资源对象语义信息缺乏的问题,满足用户对资源对象语义检索的需求。本文先分别介绍了语义Web和本体的知识以及它们的应用,并对信息检索理论进行了研究。详细比较了传统信息检索与基于本体的语义检索的差别,并列举实例进行功能对比。信息的存储是信息检索的前提,为此我们接着研究了本体的存储,并对一种存储方式进行了改进。最后我们提出了一种基于本体的语义检索系统模型,对模型的关键功能模块进行了分析,并对关键技术进行了研究。根据本体的构建方法,我们构建了专家信息本体,并对语义检索引擎进行了研究。为了验证语义检索理论上的可行性,在理论分析的基础上,我们构建了计算机课程信息领域的本体,并开发了语义检索系统原型。本系统实现了相对简单的语义检索,提供了语义推理的功能,这些功能都是传统检索方式所难以实现的,充分体现语义Web检索技术相对于普通检索技术上的优越性。