论文部分内容阅读
专利信息是人类智慧的结晶,它几乎囊括了一切应用领域中的技术成果,涉及经济发展、科技创新和战略决策等最重要的信息资源。在当今国际市场竞争极为激烈的形势下,专利信息是各国发展经济技术不可缺少的重要资源。本文将不确定语义检索和专利信息检索相结合,在传统基于关键字检索的基础上给专利检索赋予语义含义,以提高检索的查准率和查询效率。本文主要工作包括如下几点:(1)对国内外知名专利检索系统的数据结构进行分析,并着重研究了当前专利检索中存在的专利检索数据异构分散、专利检索准确率不高等问题,同时还对数据集成和信息检索的研究现状、相关技术进行了综述;(2)从我国及七国两组织专利数据结构分析入手,提炼出各国各组织异构专利数据组织结构的共性,设计了通用数据转换模型(CDTM),同时考虑专利信息的海量需求,为提高查询速度,减轻服务器压力,对数据库集群技术进行研究,并且采用Oracle数据库集群技术将专利数据集成结果本地化;(3)对不同用户的个性化专利检索需求进行研究,构建用户兴趣本体。首先,从用户静态和动态特征中获取用户兴趣关键字,计算关键字权重,筛选出用户关心的关键字,构成用户兴趣文本,然后根据用户兴趣文本构建用户兴趣本体。用户兴趣本体中描述了用户感兴趣的检索词及词与词之间的关系,结合领域本体进行检索,以提高检索效率,同时用户兴趣本体在信息的推送过程中也起着重大作用;(4)以上述技术为基础,构建了一个专利信息服务平台,并依据该平台,实现了对专利信息的有效查询,同时专利数据的本地化给用户专利分析提供了便利,实验证明,异构专利数据的有效集成和用户兴趣本体的加入使得专利检索效率在一定程度上得到提高。