基于功能信息自动标注的专利推荐方法研究

来源 :河北工业大学 | 被引量 : 7次 | 上传用户:zhangnaiyu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利文本由于包含有产品的组成结构、设计目标、组件功能原理等相关内容,一直是创新方法和产品革新最首要的信息源泉。专利是相关领域下的具有革新理念的解决方案,专利包含有许多创新技术信息。产品创新的基础是设计的创新和功能原理的创新。然而在实际的生产活动和创新产品的实践中,创新设计人员往往都会受到自己的惯性思维、知识面以及受教育程度的限制,很难突破以往思维模式的限制来进行产品创新,也无法确定最终要实现的目标的解决方案,无法找到一种能够简化工作人员工作量并且能够启发设计人员突破惯性思维限制的方法。所以,如何向相关设计人员启发性的推荐相关专利的设计目标和功能原理知识已经越来越成为了当今的热点。但是因为在对设计目标信息和功能原理信息进行表述时运用的语言较为随意,不具备固定的格式嵌套,使得对功能信息等的抽取标注具有了一定的难度。本文通过分析中文专利文献的结构与格式,结合了句式分析、词法分析、句法分析以及相关规则与算法,其中采用中国科学院研发的ICTCLAS(汉语词法分析系统)作为词法分析组件来对中文文本进行分词,采用斯坦福大学研发的Stanford Parser(斯坦福分析器)组件作为句法分析组件来得到语句的句法结构树,然后通过制定分析规则来进行专利设计目标的提取和标注。通过对科学效应知识和专利文本物理量的关联,发现了物理量、效应和功能之间的对应关系,并依此制作了物理领域下的物理量效应功能表。通过利用该表并结合物理量对应效应算法和效应对应功能算法,对应并标注出了专利的功能原理信息,并最终将这些信息用于专利设计目标和功能原理的推荐。本文运用“动词+名词/词组”的二元组形式以及“动词+名词/词组+的+名词/词组”的三元组方式来表达上述设计目标和功能原理信息。实验表明,该方法具有较好性能和准确性。
其他文献
从2000年开始,IP多媒体子系统(IMS,IP Multimedia Subsystem)一直受到广泛的关注。IMS可以扩展新的3G业务,提供更强的业务控制和管理能力;融合固定接入网络和移动接入网络,向网络
近年来,随着多媒体技术以及网络技术的迅速发展,网络上的信息资源日益丰富。如何从海量的图像库中检索出满足人们需要的图像已经成为一个研究热点,与此同时,基于内容的图像检
近年来,虚拟化技术受到越来越多的关注。虚拟化技术作为最热门的IT技术之一,因其在降低软硬件资源消耗和提高计算资源的利用率方面的优势而受到青睐。在众多虚拟化技术中,Xen
本文在分析了现有公共卫生与医疗信息系统实现的问题与缺陷后,以公共卫生与医疗信息化的特点为基础,着重研究了以下两点内容:提出了利用Struts和Hibernate技术构建系统应用的
工作流是一个业务流程,用于表达活动及活动之间变化过程。工作流管理与工作流的控制和协调有关,它的主要特点是使处理过程自动化。它根据一系列定义的规则、把文档、信息或任
近年随着多媒体数据成指数级的增长,对于多媒体的分析和分类就变得越来越迫切。当人们在浏览和理解视/音频内容时,作为多媒体数据中标志性部分的音频,为人们的感知提供了重要
信息技术的发展对全世界来说都产生了极大的影响,是当前高技术发展中的主流技术,因为信息在人类生活中无处不在,无时无刻的不影响着人类的生活,对信息的获得和挖掘成为科学界关注
无线传感器网络作为一种新型的具有广泛应用前景的无线自组网络,其有效路由协议是目前研究的热点。随着研究和应用不断深入,对传感器网络提出更高的要求:为不同的业务提供有
虚拟现实技术是由计算机生成的人机交互的三维空间环境构成,它不仅能构建高度逼真的复杂虚拟环境,而且用户还可以和虚拟环境进行互动,增强系统的交互性和沉浸感。随着虚拟现实技
聚类在模式识别、系统建模、图像处理及数据挖掘等工程领域扮演着重要的角色。其基本算法广泛应用于生命科学、医学、社会科学、地理科学、工程科学等领域。聚类就是将数据对