专利信息语义化和图储存技术研究

来源 :中国科学技术信息研究所 | 被引量 : 0次 | 上传用户:wxrwzzsh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利文献详细记载着发明创造及其不断改进和完善的内容,汇集了发明创造的精华和技术资料。有效地利用专利信息可以帮助企业或国家了解行业竞争形势、科技发展速度等重要信息。  本文首先通过分析专利术语的特点制定了相应的语料标注规则并据此进行人工标注,而后采用条件随机场方法对标注后的数据进行训练,再利用训练好的模型识别专利文献中的术语,术语识别实验的准确率达到了85.9%,召回率达到了80.6%,比最大熵模型、隐马尔科夫模型取得更好的效果。其次,在分类实验中,先利用术语识别的结果,将摘要中的术语全部替换为“术语”两个字,再对文本进行分词、去停用词等处理,利用TF-IDF算法挑选特征词并计算权重,采用支持向量机对专利摘要中的主题句进行分类,识别出摘要的类型、组件、功效主题句,实验结果准确率达到94.9%,优于不结合术语识别的支持向量机分类、朴素贝叶斯分类等。根据分类的结果,针对不同类型的主题句进行专利信息的提取,提取的信息包含组件信息、领域信息、功效信息等。针对主题句类型的特点,采用不同的方法结术语识别的结果进行提取,主要技术包括句法分析、规则模板匹配。  本文采用图数据库存储语义化后的专利信息。首先,根据专利信息概念模型和专利使用的需求等构建了存储模型,根据存储模型的要求存储抽取出来的专利数据并建立索引,以便于查找修改。之后将图数据库与关系数据库进行了一系列查询和存储性能的对比。实验结果表明,在复杂关联数据的存储和查询上,图数据库具有一定的空间和时间优势。  最后,本文开发了专利信息自动语义化平台,将专利信息语义化技术和图储存技术结合起来,实现了专利信息的自动化处理和储存,并构建出用于专利分析的功效矩阵。
其他文献
在数据驱动的科研环境下,为服务于科研机构研究过程中知识资产长期保存管理的数字仓储领域,构建科研知识产出语义化关联组织的模型。总结数据驱动科研的知识对象类型、数据活
在网络环境下,个性化信息服务逐渐成为信息管理领域中一个新的研究热点,并日益受到社会的关注。个性化信息服务涉及到信息服务理念、服务方式、服务机制的变化以及相关的技术、
  本文以“可感知服务质量概念”和“服务质量差距模型”作为数字参考咨询服务质量评估的理论基础,从图书馆和用户两方面对数字参考咨询服务质量的影响因素进行了问卷调查,并
  数字参考咨询是传统参考咨询服务在网络环境下的继承和发展。利用计算机网络技术,数字参考咨询为图书馆用户提供方便、高效的信息服务。这种新型的服务方式适应了网络条件
随着信息技术的飞速发展和应用范围的不断拓宽,数据库系统逐渐进入各个领域,由于数据库主流技术一直在变化,导致了各种不同时期数据库产品的同时存在。为联合使用这些异构数
本论文从物流的基本概念和理论出发,分析了国内外物流业发展的一般现状和趋势。然后,通过案例分析和实际调查,探讨了我国钢铁企业物流管理现状及其信息化问题。指出物流管理落后
《图书馆战略规划:理论、模型与实证》一书于2013年2月由国家图书馆出版社正式出版,全书共计660千字。作者在引入战略管理等相关理论的基础上,构建并完善了图书馆战略规划的
随着我国远程教育事业的飞速发展,远程教育教学质量已经成为我国政府和社会都非常关注的问题。远程教育教学质量评估作为保证和提高远程教育教学质量的重要手段,已经逐渐受到政
  本文从服务机制的角度,对高校档案信息服务工作的创新进行了探索和研究,旨在更好地总结经验,探讨创新服务机制的新思路、新方法,使之能够建立适应现代社会信息需求的高校档案
本人对通知服务的研究成果做了大量调研,结合数字图书馆应用的实际情况,提出了通知服务在数字图书馆中的四种应用模式:基本的通知服务模式、加入事件通道的通知服务模式、加入事