一种融合多元问题特征的专利聚类方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:yuxinliuyun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专利信息由发明名称、摘要、背景技术等信息构成,其中的背景技术文本着重描述了专利解决了什么问题,对什么技术进行改进,十分契合发明创造就是为了解决问题的本质。对专利背景技术进行挖掘能够更加快速、准确的帮助技术人员定位当前技术的核心问题,所以对专利的背景技术进行分析有着重要的研究意义。而目前针对专利内容的分析大部分都是基于标题和摘要信息,对背景技术相关的研究较为匮乏,并且研究内容缺乏针对性,无法罗列专利多元化的信息。本文开创性的从专利背景技术中分析出专利问题信息,并完成了包含专利问题信息的问题句定位、自定义问题三元组抽取工作,并在此基础上提出了一种融合专利多元问题特征的聚类方法,本研究将专利分析内容的粒度进行细化,进一步扩展了专利研究领域,本文主要贡献如下:(1)针对专利背景技术句子,本文分别定义了问题句与非问题句,对当前常规分类模型特征表示能力弱、对复杂句式分类不准确的现象,提出了融合注意力机制的ATT-C-L问题句定位模型。将文本特征拆分为卷积特征、将来和过去的上下文特征三类,并针对不同特征在实际的文本分类中,并不是平均的对文本分类起到作用的现象,引入了注意力机制捕捉对问题句定位最有效信息。(2)针对专利背景技术问题特征,本文提出了以<问题源-<问题对象-问题词>>三元组的形式进行表达,对问题源提出了融合相对位置语义特征的3种自定义规则提取,而针对<问题对象、问题词>关联性强的特点,提出了融合相对语义语法特征的5种自定义语法规则进行联合提取,最后使用改进的ATT规则对问题对象进行边界修正。(3)针对目前聚类信息单一的问题,本文提出了一种融合多元问题特征的聚类方法。将专利的背景技术信息表示成背景技术原文和问题元组的二元形式,又进一步融合了专利标题信息,形成了“专利标题-专利背景技术文本-专利问题元组”的表示方法,最后采用谱聚类方法进行了有效的融合聚类,并取得了较好的实验结果。对聚类结果本文认为“专利标题-专利背景技术文本-专利问题元组”这三者在的权重对聚类的影响必然不同,本文通过设计的4个试验探寻了三者的权重关系,通过引入背景技术使聚类效果提升了1.02%,通过引入专利问题元组在前者基础上又一次提升了2.91%,充分证明了本文所提出的融合多元问题特征的专利聚类方法的有效性。
其他文献
信号分析技术经过半个世纪的不停演化已经成为了现代工业中不可或缺的一项辅助分析科技。在当前的车床性能测试领域中,信号分析技术可以通过需求进行目标的信号特征数据采集工作,并通过相关的运算手段或分析手段,将所采集到的信号特征数据转换或转变成所需要的信号形式。因此,在经济一体化的大前提下,将信号分析技术在车床性能测试领域完全符合当前超精密工业生产的客观需求。本课题通过对沈阳车床厂生产的CW系列卧式车床运行
步行作为传统的交通出行方式,始终是城市居民参与城市交通的重要形式。城市化进程的不断推进加快了人口在城市的聚集,大规模的行人交通基础设施也随之兴建。行人交通是现代交通学科的重点研究内容,吸引了众多学者的广泛关注。行人建模研究和常态下行人动力学研究有利于科学掌握行人运动的内在机理和演化规律,为交通规划、设计、管理、优化等提供了理论指导和科学方法。为实现模型对常态下行人交通行为更准确的描述,本文对原始社
学位
异响是汽车NVH性能开发的重要组成部分之一,它是描述一种由低频振动引起的高频的不正常的噪声。80%以上的异响问题主要是由于内饰件之间的相互敲击(咔嗒声)或摩擦(吱吱声)造成的,仪表板是汽车最主要内饰系统之一,它的异响问题也是内饰系统重要的异响来源之一。由于仪表板靠近驾驶员位置,驾驶员对其产生的异响噪声有着更加直接与清晰地体验,异响容易造成顾客对驾驶环境的厌烦感,甚至会使顾客对整车的品质产生怀疑。因
整车疲劳耐久性能开发周期日益缩短,现已逐步演变为前期CAE分析,后期台架与道路试验共同验证的基本流程。在开发前期,零部件疲劳耐久分析需要输入基于真实耐久路面的边界载荷,整车疲劳载荷分解意义重大。本文结合某乘用车项目在实际产品开发中的疲劳载荷分解工作开展研究。研究建立了基于整车多体动力学模型和虚拟轴耦合道路模拟器的虚拟疲劳耐久测试系统,并以整车在试验场采集的载荷谱为模型输入条件,提取车辆模型的部件或
学位
随着京津冀地区经济社会的迅速发展,能源问题日益突出,地热资源作为可再生能源之一,受到广泛关注。目前面临的主要问题为地下水水位不断下降,从而引起地下换热器换热效率低、泵耗大、热贯通等问题;以及在实际应用中判断热贯通主要采用实践经验的方法,缺乏先进的理论指导。并且,实现地热资源的可持续和高效利用涉及到岩层的沉积环境、岩层热物性、水文地质参数、地球化学、地热能等多个学科领域。本文结合《京津冀协同发展黄骅
城市污水处理过程中碳源不足所引发的问题日益凸显,而污泥的减量化、资源化处理也备受人们关注。采用物理、化学等方法破解污泥,使有机物溶出,并将有机物作为补充碳源使用成为目前研究的热点。伴随有机物的溶出,氮、磷同时释放,使得污泥碳源回用时氮、磷负荷增加,系统出水存在氮、磷超标的风险。因此,本文使用复合高铁酸盐溶液(Composite Ferrate Solution,CFS)破解污泥,利用高铁酸盐的化学
学位
核电利用核反应堆中核裂变所释放出的热能进行发电,具有清洁高效、安全稳定、经济性好等优点,目前,我国正开启安全、高效、高质量发展的核能产业之路。堆芯运行状态监测仪通过对堆芯温度和中子通量分布等参数的连续监测和分析,能够实时准确地获得反应堆堆芯的功率分布和运行状态信息,为反应堆操纵员操控反应堆提供数据,对核电厂的安全、稳定、经济运行具有重要意义。堆芯状态监测仪因为生产环节多、被控制量繁多、模型复杂,设