论文部分内容阅读
目前,万维网的信息每天以爆炸式增长,如何高效地获取有价值的目的信息是信息检索研究面临的最大挑战。传统信息检索系统主要基于内容分类目录的检索和基于关键词的检索,基于关键词的检索很大程度上由用户的经验所左右,而且关键词容易产生语义混淆;而基于内容分类目录的检索虽然通过人工加入了人类的知识,但是加入的人类知识很难保证及时性和准确性。因此,传统信息检索系统帮助用户找到的信息资源总是差强人意。针对传统信息检索系统存在的问题,本研究设计了基于领域本体的信息检索系统框架。该系统框架以领域知识的定义和分类为基础,构建了领域本体,并采用Oracle 11g对领域本体中的概念集合和概念之间的关系集合进行存储,通过用户自定义的领域规则进行选择推理,从而提高检索精度。本论文的研究内容主要有:深入研究了语义web和本体技术的基本理论,如本体的基本要素、本体描述语言、本体建设工具等;深入研究了本体构建方法,并使用protégé构建领域本体。要实现专业领域的检索系统,需充分发挥语义在检索系统上的优势,提供专业化的优于大型通用检索系统的网络信息检索服务。因此,需要建立充分、完整、权威性的领域本体库,并在本体库中充分利用和体现该领域的特点,以达到更佳效果;利用自定义规则使用jena实现向后推理,利用它作为逻辑推理和语义分析的工具和平台,为实现语义Web提供基础,重新设计检索系统,使检索系统更具智能化,检索结果更能符合用户的需求;利用JSP技术,基于Eclipse3.1+Tomcat5.0+Lomboz3.0构建本体检索系统,实现领域用户和服务器的动态交互。本论文的研究成果主要有:本研究不仅构建了领域本体知识库,还实现了专业领域的检索系统。由于引用了jena推理机,使用用户自定义的推理规则进行选择推理,系统在查全和查准方面都有所提高。系统利用了JSP技术加强领域用户和服务器的交互,而且借助本体库资源,设计出更容易被用户接受的人机接口智能化界面。本研究还采用了Oracle 11g数据库持久化本体,这使得我们维护为本体更为方便容易。