论文部分内容阅读
专利信息资源蕴含着丰富的科技、经济、法律等多方面的专利相关信息,是一项重要的信息资源。研究人员往往通过线上检索获取专利信息,进而分析取得重要的专利相关情报,以服务于科技领域的各个方面。但是在目前的专利信息检索服务中,检索结果往往比较单一并且缺乏对用户的引导,用户在一次检索中很难取得多方面的信息,比如与检索词有多重语义关联的其他科技词所对应的专利信息,相关发明人和机构的具体信息等。如果能够通过技术的改进将这些相关信息聚合到一起,使得用户尽可能地通过一次检索取得更多的专利相关信息,将大大提高检索效率。基于以上考虑,本文引入关联数据技术,利用关联数据的规范性、关联性、普适性等特点,尝试基于关联数据技术将多种汉语专利信息资源关联起来,构建汉语专利信息资源的聚合。在研究过程中,本文首先分析了关联数据与专利信息资源聚合的国内外研究现状,在此基础上提出问题——基于关联数据构建汉语专利信息资源的聚合;其次,研究了关联数据与汉语专利信息资源的相关理论,为接下来的研究打下理论基础;然后,在此基础上选取了恰当的汉语专利信息资源作为研究目标:专利单行本、专利法律状态信息、专利重要相关人信息、科技型机构信息、专利代理机构信息,并分析了其间的关联关系,其中在主题角度的信息关联中,借助了中信所前期的研究成果汉语科技词系统智能材料与结构技术卷,并对其中的词间关系进行补充,而且还基于一定的算法对专利的关键词进行了抽取,作为专利领域主题的界定,在此基础上以磁电传感器领域为例,设计构建了基于关联数据的汉语专利信息资源聚合框架;最后,对基于关联数据的汉语专利信息资源聚合的具体构建流程进行设计,采用开源内容管理框架——Drupal,在关联数据的基础上设计实现了汉语专利信息资源的聚合,并对效果进行了展示与分析,以检验本研究的有效性。本研究在基于关联数据技术使得汉语专利信息资源实现聚合的基础上,为进一步地向用户提供更好的专利信息检索与语义分析服务,以及实现与其他领域的信息关联打下了基础。