面向中文知识图谱的知识推理算法研究与应用

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:chyfandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识推理作为完善知识图谱的重要手段,在构建知识图谱过程中发挥了关键作用。中文领域的知识图谱普遍存在数据稀疏、质量参差不齐等问题。同时,由于中文文本的特点会导致知识推理容易受分词错误的影响,并且现有可用的中文领域训练集较少,给中文知识推理模型训练造成了一定的影响。目前,知识推理模型多是基于神经网络、分布式知识表示学习和逻辑规则的方法。这些模型在提取特征构造特征向量的过程中存在着明显的信息损失,导致提取出的特征向量质量较差,同时推理结果具有较低的可解释性。为了提高模型推理效果,本文从编码实体特征向量的方式、模型推理的可解释性两个方面出发,做了相应改进。(1)为了减少编码实体描述信息造成的语义损失,本文通过深度神经网络结合翻译模型设计了一种新的实体描述信息编码器。首先使用双向长短期记忆网络获取实体描述信息完整的上下文,避免了DKRL只是使用描述信息中的部分高频词造成的语义损失,然后通过注意力机制重点关注描述信息中的局部特征词,最后结合翻译模型进行联合训练得到实体描述向量。(2)基于神经网络进行知识推理的模型没有充分考虑与实体关联的描述信息和类型信息中包含的丰富语义。本文使用上述的实体描述编码器和TKRL算法分别融合实体描述信息和实体类型信息,然后利用神经张量网络对知识图谱进行建模完成知识推理,通过融合多源信息提升模型推理效果。(3)针对基于复杂路径推理的知识表示学习模型在路径向量表示方面存在较低的解释性,本文引入逻辑规则和关系加权两种形式的路径表示方法对其进行优化。通过利用AMIE+算法挖掘Horn规则辅助路径建模,提高模型推理的可解释性。(4)将模型付诸于工程应用,设计并构建了一个知识推理系统。本文针对提出的改进思路设置了相应的对比实验。通过融合实体描述信息以及实体类型信息,模型在三元组分类任务中的准确率提升了4.06%。在链接预测任务中的MRR和Hits@10指标分别达到了72.43%和81.93%,说明了多源信息融合的有效性。利用规则指导路径表示学习,在链接预测任务中的Hits@10指标可以达到82.15%,说明利用规则指导路径表示的方式在提高可解释性的同时,也显著提升了推理效果。
其他文献
随着生物与医疗技术的发展,对生物分子的分离、捕获和聚集等提出了更高的要求,从而对介电泳操控技术的操控准确度要求越来越高,因此作为介电泳操控技术核心的介电泳频谱受到了广泛关注。但当前介电泳频谱的研究存在明显不足——因(?)|E|2在空间分布的不均匀及缺乏对速度获取过程中影响因素的分析,而导致所获取的介电泳速度不准确,进而导致获取的介电泳频谱不准确。为弥补传统方法的不足,提出了单自由度介电泳的频谱获取
桩基础是液化场地建筑物基础的主要应用形式,液化场地中群桩基础动力响应规律一直是建筑物抗震领域研究的热点。本文通过研究国内外文献,结合国内对群桩基础在液化场地中的横向动力响应特性以及桩土相互作用的研究进展,避开目前研究模型与现实工程群桩受力过程中应力应变关系差距较大的问题,展开原型应力应变关系条件下对液化场地中群桩基础横向动力响应及桩土相互作用问题的研究,主要内容包括:在不同峰值加速度正弦波和EL-
锂离子电池具有能量密度高、循环寿命长等优势,在手机、笔记本电脑、规模储能等领域得到了广泛的应用。为了满足日益增长的应用需求,人们对锂离子电池的能量密度、安全性能和循环寿命等方面提出了更高的要求。一方面,科研人员致力于开发新型高能量密度的电极材料,如富锂锰基正极材料(LMR)、镍钴锰三元正极材料、硅碳负极材料;另一方面,碳酸酯类电解液体系在高压或高温下容易分解,与新型电极材料的匹配效果不佳,严重影响
人体动作捕捉技术是在三维空间下复现目标人体的动作信息。目前所应用的人体动作捕捉技术有可穿戴标记式动作捕捉系统和机器视觉无标记动作捕捉系统,但是两种捕捉技术都存在自身难以克服的缺陷与不足。本文将结合Delsys IMU和Kinect传感器各自的优势,研发一种人体动作捕捉系统。该系统发挥两种传感器在人体动作捕捉技术上的优势,具有数据采集简单、准确度高、直观性强、对时间与地点要求低等优点。本课题研发的动
近年来,风电作为一种绿色能源受到世界各国的青睐,随着风电机组装机容量的增加,风电机组所暴露出的多种故障问题不容忽视,对于其中的叶片故障问题,如果不能及时发现、维修,不仅会降低风电机组的发电效率,还可能引发严重事故。本文针对风机叶片的故障诊断问题,主要研究内容如下:一、对基于声频信号和振动信号的故障诊断国内外研究现状进行总结分析,选取梅尔倒谱系数法(MFCC)和原型聚类作为本文研究风机叶片声音信号特
近年来,随着住宅不断产业化,钢管混凝土结构得到了广泛的应用。作为关键部位的梁柱节点连接形式较为复杂、施工容错性小,在一定程度上限制了该结构形式的发展。为推广钢管混凝土结构的应用,有必要研究一种装配方便、施工容错性大的节点形式。为此本文拟通过上焊下栓的方式进行钢管混凝土柱与工字型钢梁的连接,并进行上焊下栓节点的抗震试验和有限元分析,为该类型节点的结构设计提供充分的参考依据。本文提出一种带外肋环板的隔
近年来,不断发展的脑成像技术为理解大脑特定区域与其功能提供了很大的帮助。多模态脑影像分析方法利用不同脑影像数据提供的多种信息,能够帮助医生分析脑疾病的病变机理。目前多模态脑影像分析还面临一定的困难,如多模态脑影像数据样本量少,脑影像的特征维度高、数据异构等问题,找出与疾病相关的特征,提高脑疾病诊断的准确率是目前多模态脑影像数据分析的重点。现有的脑影像分析方法通常只利用一种脑影像数据,或者将多种脑影
永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)的功率密度高且工作效率高,优点显著易于控制。因此在工业生产,新能源汽车等方面以及伺服控制系统等方向都大量使用,PMSM的控制已经成为众多学者的研究热点。目前PMSM控制系统已经比较成熟,然而在很多场合,控制系统需要对系统外可能存在的干扰、负载的变化以及电机本身参数的变化等具有适应修正能力。当电机在实际运行
随着互联网科技的迅猛发展,网民数量和上网时长日益增加,特别是“互联网+”战略的推进,互联网已日益成为公众日常工作、生活、学习不可或缺的平台和助手,深刻地改变着人们的生活方式、行为方式和价值观念,随之产生了蕴含着丰富信息的用户网络行为数据。分析网络用户行为可以深入挖掘用户的行为偏好和性格特征,不仅对社会学、安全领域等有着理论价值,而且对于网络信息、动态监控和威胁预警等应用具有实际意义。现阶段,针对网
近年来,随着神经网络的不断发展,以深度学习为基础的各类目标检测算法应运而生,并广泛应用于行人检测、目标追踪和无人驾驶等领域。YOLO目标检测算法因其检测速度快而成为实时目标检测技术中的研究热点。而目标检测所应用的公共场所监控画面、医疗影像结果以及防空预警中的红外摄像等,普遍为黑白图像,为了突出黑白图像中的检测目标,对图像着色技术也有很强的应用需求。本文针对YOLO目标检测算法和着色技术进行研究,主