论文部分内容阅读
随着人们对专利数据的重视以及计算机技术的进步,越来越多的研究者选择通过专利检索来获取最新、最重要的信息,对产品和技术进行不断改进和创新。面对迅速增长的专利数量,用户在进行专利检索时虽然有了范围更广的选择结果,但是出现了更为棘手的问题——如何快速而准确地获取自己真正所需要的信息。并且,专利检索与传统信息检索存在一个很大的不同——对检索用户的要求较高,用户必须掌握待查询领域的知识。这就导致当前的检索方式出现“表达意思不完全”、“不能理解用户真正需求”、“用户不知如何下手”等各种问题,在检索过程中缺乏对用户的引导,而且用户对专利检索的要求越来越高,人们希望通过技术的改进来让检索系统辅助用户完成信息的获取,真正意义上实现语义理解和扩展推理的功能。针对以上出现的问题,本文首先调研了领域本体、语义检索、专利检索的国内外研究现状,并在此基础上提出了借助领域本体进行专利语义检索的核心思想,并设计了专利语义检索系统的框架结构。然后对基于领域本体的专利语义检索系统中涉及到的关键技术和工具进行了深入的研究和分析,为基于领域本体的专利语义检索平台的实现提供了良好的技术基础,这些关键技术主要包括:领域本体的构建、语义解析与推理,工具主要包括:本体构建工具protégé、语义解析与推理工具Jena、基于Java的系统开发平台Eclipse等。其次针对专利语义检索系统框架结构中的几个关键流程进行了详细阐述和实例研究:借助protégé实现了领域本体的半自动化构建、借助Jena实现了领域本体的推理及扩展。最后将几个关键流程进行整合,通过自定义一些个性化的推理规则,用Java在Eclipse平台上实现了基于领域本体的专利语义检索系统。本文中基于领域本体的专利语义检索系统的实现,在一定程度上解决了当前检索方式缺乏语义知识的问题,提高了专利检索的效率和专利检索结果的完整性,在检索过程中很好地引导用户明确检索需求。并且以新能源汽车领域为实例,构建了相应的领域本体、设计了个性化的语义推理规则,并将关键过程进行集成,实现了试验系统。整个过程具有一定的通用性,可以为其它领域本体的语义检索提供一定的借鉴意义和参考价值。另外,本文中提出的半自动化构建领域本体的方法和领域本体的语义推理过程,对今后语义检索系统的大规模应用提供了一定的理论基础和技术经验的支持。