面向语义推理的多视角学术知识图谱构建方法研究与应用

来源 :吉林大学 | 被引量 : 0次 | 上传用户:dfhdgfhdgf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识是人类创新的发展力。人们在实践中发现、研究知识并且创新知识,人类通过知识不断地改造社会。如今,网络世界的信息纷繁复杂,许多冗余、重复的信息干扰了人们的视线,因此,让学术人员快速、准确地定位到其感兴趣的知识是一项十分重要的任务。搜索与推荐可以帮助人们实现这一目标。但是,以往的搜索与推荐一般只是从统计的角度出发,经常被点击的项目具有更高的权重,而并不是从人类理解的角度出发,真正得到语义相关的知识。知识图谱的出现使这一问题迎刃而解。知识图谱将网络上的实体整合成一个语义网络,通过在知识图谱上的路径推理,系统可以将真正语义上有紧密联系的实体展示出来。在学术研究领域,学术论文是人们获取知识的中心来源,而学术论文以解决学术问题为宗旨。为了解决各种各样的问题,创新性的方法也是论文的主要贡献。由此可见,问题与方法都是理解论文的不同角度。从前,很少有人将论文的问题及方法抽取出来作为知识图谱中的节点,而如何从非结构化文本中抽取出这两种实体也是一个难点。与此同时,一般的实体抽取算法需要大量标注数据,这在大数据量的情况下十分损耗人力物力。因此,本文的目标是用少量标注数据完成大数据量下的问题及方法抽取,并构建一个将问题及方法作为节点的学术知识图谱,以进一步解决语义推理等问题。本文的主要工作如下:(1)提出了基于图神经网络的多视角概念抽取算法。已经有许多学者成功构建出学术知识图谱,但将问题与方法抽取出来作为节点的知识图谱少之又少。而与已有方法不同的是,本文提出了一种关于领域、问题及方法的假设,能够准确地区分问题及方法,在迭代自训练过程中应用由该假设所作的约束,实现半监督学习。针对论文中的每一个句子,给句子中的每个单词分配标签,标签是问题或方法。在学习特征向量的过程中,单词的上下文向量表示会与所属关键词在网络中的结构向量表示进行融合,使用神经网络学习融合后的特征,用两个不同的目标函数进行最终的预测;在模型自训练过程中加入由假设所做的约束,使模型能够自动向着分类结果更准确的方向发展,从而节省大量标注数据的工作。(2)提出了基于胶囊网络的学术论文推荐算法。以上一步构建出的知识图谱为辅助信息,根据某用户点击的论文,在知识图谱中得到与其语义上紧密相关的论文作为候选论文列表,通过用户的点击行为学习用户与论文的特征,使用胶囊网络提取上述特征,预测用户对于论文的评分,从而对候选论文进行评分排序,选取排名靠前的论文推荐给用户。在数据集上验证了实验结果的准确性。
其他文献
日本是一个实行君主立宪政治制度的国家,其地方议会制度自明治初期实施以来即在日本国家政治制度中占据着极其重要的地位.日本地方议会的职能主要表现为:政策形成方面的职能;
在全球气候持续变暖的大趋势下,极端气候事件的频发也逐渐引起了世界各国政府和学术组织的高度重视。而青藏高原因其脆弱的生态环境,更是气候变化的敏感地带,极端气候的变化已成为影响当地植被生长发育与覆盖分布的重要因素之一,继而也会对全国乃至整个亚洲的气候和植被生长情况产生重要的衍生影响。因此,探讨青藏高原地区植被的时空变化及其对极端气候事件的响应,既有利于促进当地植被生态环境的保护,也能够为应对极端气候事
表面肌电信号(Surface Electromyographic,简称SEMG)是肌肉收缩时产生的一种电信号,是人体组织活动的外在表象。因而是一种优良的天然人机交互接口,已经被广泛地应用到肌电假手控制领域。肌电假手的基本工作原理是利用模式识别技术对采集的表面肌电信号进行分类,根据分类结果驱动机械假手执行相应的手势动作。虽然目前的肌电假手已经实现多种手势姿势的识别,但依然存在各种不足:(1)以往研究
光纤传感器,因其结构简单、不受电磁干扰等优点,被广泛应用于传感领域。在各种光纤传感器中,光纤法布里-珀罗(F-P)传感器可做到光信号单端收发,干涉光谱对比度高,响应迅速而被广泛应用于压力、温度等传感量的测量。近年来,多种基于F-P干涉原理的光纤传感器被设计制作出来。随着对光纤F-P传感器研究的深入,如何提高传感器的测量灵敏度成为了学者最为关心的研究方向之一。本文基于游标效应设计了一种分离型双F-P
通过低年级的口语交际课为写话教学探寻有效策略,可通过选好切入点,做好正强化,在口语交际中激发写话兴趣;可通过对话引导积累写话素材,借助充分表达提炼写话方法,利用多元交
犊牛水中毒是指犊牛口渴时在短时间内一次性饮喝大量的水,从而引起阵发性血红蛋白尿。该病又称犊牛血红蛋白尿症、阵发性血红蛋白尿症。该病一般是在炎热的夏季,特别是8月龄以