论文部分内容阅读
任何一种产品都是一种或多种功能实现的技术承载体,功能的创新是专利产品创新的核心,决定该产品的应用价值和发展方向。作为发明创造中,集技术、法律、经济信息为一体的特殊的文献,专利具有新颖性、创造性、实用性,蕴含丰富的背景、技术、功能等知识。专利知识的抽取方法,可以使设计者发现知识之间的语义关联,突破固有的思维定式及知识面的限制,提出与众不同的解决方案,最终能缩减工作量还能启发设计人员以独特、新颖的角度进行设计。创新知识以及知识的语义关系的研究已然成为热点,成为发展趋势。 面向中文专利的提取,主要有有关键词抽取、实体关系抽取、技术功效主题提取、实体消歧、创新设计方法等单方面的知识抽取。但是在创新设计角度还有很大欠缺,不能系统化地提取专利中要解决的问题、必要的产品结构、不可或缺的位置特征、采用的作用原理、最终实现的目标功能,以及不同知识之间的语义关联等。 本文主要分析专利的摘要和背景技术,提出基于词和词性特征、句法特征构成的组合特征和最大熵分类器的专利创新知识抽取方法。本系统抽取的专利知识,具体包括表达关键问题信息的问题知识,表达一种需求的目标功能知识、描述的产品结构和实现功能的方式方法与步骤的作用原理知识、表示专利文献中介词短语中的位置特征知识,帮助设计者快速了解产品功能的组成关系和动态关系,启发设计者的创新思维。 实验表明,基于正确的句法树的识别,引入组合特征和最大熵算法,能有效地处理专利要解决的问题、以及技术方案中的目标功能、作用原理、位置特征等创新知识之间的语义角色关系。