论文部分内容阅读
Tim Berners-Lee于2000年12月在XML2000会议上,提出下一代互联网的概念——语义网(Semantic Web),目的在于赋予万维网上所有资源唯一的标识,并在资源之间建立起机器可处理的各类语义联系。语义网对当代万维网延伸和扩展,以一种明确的、形式化的方式来表示信息资源,提高异构系统之间的有效检索和访问,实现信息资源在语义层上的全方位互联,并在此基础上,实现更高层的、基于知识的智能应用,促进知识共享。目前因特网在信息表达和检索方面存在严重的缺陷,主要在于其设计目的是面向用户直接阅读与处理,没有提供计算机可读的语义信息,因此限制了计算机在信息检索中的自动分析处理以及进一步智能化的信息处理能力。实现信息资源的语义检索,提高数字化信息资源的利用率,这些问题是信息检索领域所面临的挑战。本文分析研究了传统信息检索的基本原理、技术及工具、信息检索发展现状,结合万维网的具体特点,构建了基于语义网的信息检索体系框架,对信息检索系统的设计思想和检索流程进行了详细描述,并对系统模型的合理性进行了论证。本文通过深入的分析研究智能信息检索模型中所涉及的若干关键技术,提出了有效的解决方案,奠定了智能检索实验系统的顺利实施的良好基础,这些技术主要包括:领域本体构建、信息资源收集、语义推理和检索结果排序。最后在理论分析的基础上,设计了基于语义网的文献检索实验系统,该实验系统以计算机领域的科技文献为检索对象,构建出领域本体——文献本体和语义词典本体。通过各种文献资源向知识本体层映射和语义推理处理,可充分发掘各文献之间蕴含的语义关联,从而在根本上解决了检索中资源对象语义信息缺乏的问题,满足用户对资源对象语义检索的需求。文献检索实验系统实现相对比较复杂的知识检索和二次检索功能,提供领域资源的增值服务。传统的基于关键字的检索方式难以实现以上功能,本文通过实践验证了信息检索系统模型的可行性。