专利技术主题分析:基于SAO结构的LDA主题模型方法

来源 :图书情报工作 | 被引量 : 0次 | 上传用户:crazyasp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的/意义]改善现有专利技术主题分析方法主题辨识度低、主题词二义性、无法识别技术信息中的“问题”与相应“解决方案”等问题。[方法/过程]本文通过抽取专利文本中的SAO结构,并从SAO结构中识别“问题和解决方案”(P&S)模式,基于“bagofP&S”假设,构建基于“主语-行为-宾语”(subject-action-object,SAO)结构的LDA主题模型,实现对专利文献主题结构的识别和分析。[结果/结论]案例研究表明,该方法能够有效识别主题分布,并在主题辨识度和语义消岐方面较传统LDA模型具有较大优势。 [Purpose / Significance] To improve the theme identification method of the existing patented technologies with low subject identification and ambiguous keywords, and to identify issues such as “problem ” and corresponding “solution ” in technical information. [Method / Process] Based on the “bag of P & S” hypothesis and the “Problem and Solution” (P & S) pattern from the SAO structure, (Subject-action-object, SAO) structure LDA theme model to realize the identification and analysis of the subject structure of patent literature. [Result / Conclusion] The case study shows that this method can effectively identify the topic distribution and has more advantages than the traditional LDA model in terms of topic identification and semantic disambiguation.
其他文献
当前,人们开始越来越重视公路的管理和安全服务等方面,而对于我国公路企业来说,如何真正的实现公路经济效益的最优配置,并为社会提供高质量的社会服务,成为了我国公路企业首要解决
大学英语教学中,语音层面、词汇应用、句法层面都存在着标记现象。教师应树立标记意识,以标记性内容为教学的重点,科学有效地将标记理论与教学实践相结合,以提升教学效果、增强学
本文着重阐述了智能化油船的装卸货系统概貌。
近些年随着经济水平的提高,我国各项发展项目正在积极稳定地开展,这对于国家现代化建设具有重要的意义。在我国发展的进程中,城市建筑水平逐渐提升,空调的出现与利用对于城市
德意志银行北美证券研究所近日对智利太阳能开发商进行了一轮调查。调查显示太阳能是目前智利最便宜的能源,2015年装机量超过1 GW。从长远来看前景虽好,但是良好的输电线路和
<正>4月18日,中国雅虎邮箱启动整体迁移计划。雅虎邮箱的官方提示称,用户可以选择注册并绑定一个新的阿里云邮箱,直接自动保存原历史邮件,并可以保持代收发往原雅虎邮箱的邮
姜黄植物根茎一般经过加工作为食品辅料使用,而其药用价值也很早就被开发出来,具有悠久的历史。中国、印度、泰国等地的传统医学将姜黄应用于多个方面。姜黄植物根茎主要化学
<正>随着计算机和网络技术的高速发展,高校基于网络的自主学习教学模式开始出现并不断发展,但结果并不令人满意。网络自主学习缺少有力监控是一个主要原因。笔者通过对高校网
针对湿地植被存在典型的季节及年际变化特征,常用的遥感识别手段无法对湿地火烧严重程度实现准确评价的问题,提出了一种适用于湿地火烧严重程度的评价方法。基于2001年9月扎
积极运用法律武器是维护国家海洋权益的重要途径。维护国家海洋权益,需要大力加强法律思维培育,尽快制定国家海洋战略,积极推动国内国际立法,灵活应对现实机遇挑战,不断强化