基于低维向量空间的知识推理方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ldpjk77
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,数据量爆炸性的增加,人们对搜索的精准性和智能化的需求日益增长,知识图谱的兴起拉开了智能信息检索从字符串匹配跃迁至智能理解的序幕,可以实现深度挖掘和精准回答,是智能化的核心技术之一。然而现有的知识图谱仍然面临严重的知识缺失问题,知识表示可以促进知识获取、融合、推理,完成知识图谱补全。传统基于离散符号的知识表示存在复杂度高、不易拓展等问题,基于向量空间的知识表示是解决这类问题的新趋势。然而大多数知识表示学习方法得到的向量仅包含知识图谱三元组结构的语义信息,没有融合实体描述、类别等提供关于实体的语义信息,在大规模稀疏知识图谱上区分能力较差。因此,如何实现嵌入多源信息的知识表示学习方法以及通过知识表示向量之间的计算进行推理,挖掘新的知识是本文的主要研究内容。针对知识表示向量无法包含实体描述全部语义信息的问题,本文基于TRANS*表示学习模型和DOC2VEC、LSTM等深度学习模型设计了一个新的嵌入实体描述的知识表示学习算法RLCD。最早提出的嵌入实体描述的知识表示学习方法DKRL的输入仅仅是知识图谱三元组和实体描述中部分高频词,所得到的知识表示向量并没有包含实体描述的全部语义信息。本文提出的RLCD算法采用文档向量化表示模型,将实体描述直接作为输入最小化信息损失,并加入了语序信息,得到的知识表示向量不仅包含知识图谱三元组语义信息也包含实体描述的全部语义信息。最后实验结果表明,在FREEBASE百科数据集和PHONECARD数据集上与DKRL算法相比,本文算法的链接预测效果更好、运行所需时间更少,更有利于后续的知识图谱补全与知识推理。面对严重的知识缺失问题,如何高效地基于已有的知识图谱进行知识推理,从而挖掘出新的知识是当今的研究难点。传统知识推理方法基于谓词逻辑和关联规则挖掘的推理策略,存在覆盖率低、推理速度慢、可拓展性差、无法表示不确定的知识等问题。基于分布式表示的知识推理方法通过知识表示向量之间更高效的计算代替图的遍历和搜索进行知识推理从而挖掘出新的知识。然而大多数知识表示学习方法都是基于单个三元组结构学习出知识表示向量,从而无法实现复杂关系推理。本文将通过知识表示学习技术和神经网络技术训练出包含关系路径信息和实体描述信息的分布式知识表示向量,从而挖掘出实体之间的关系路径所隐含的间接关系,实现复杂关系的推理。
其他文献
访存性能是现代计算机系统性能的主要瓶颈。近二十年来,由于生产工艺、电路设计等方面的进步导致处理器主频每年以60%的速度提高,而DRAM的工作频率每年却只有10%左右的提高。
中国加入WTO后,世界经济全球化使我国电信企业面临着前所未有的挑战。能否快速而科学的决策密切关系着电信企业的成败。目前各电信运营商普遍采用依靠手工报表分析数据的决策
在当今计算机领域中,网络安全是最热门的课题之一,而网络主动防御则是网络安全重要的一环。网络主动防御系统是一种智能化的网络保护手段,它可以让网络管理员减轻负担,而提高网络
电子商务改变了企业与客户的沟通方式,从而使传统的企业商务模式发生了深刻的改变.近年来,随着信息技术的飞速发展,移动通讯与互联网融合发展的趋势日趋明显,作为电子商务领
Petri网是描述和分析并行与分布系统的有力工具,为扩展Petri网的建模与分析能力,使之能够处理时间相关的问题,人们将时间约束引入Petri网模型中,形成带时间约束的Petri网.Mer
近几年来,由于移动终端设备的蓬勃发展,各式各样的硬件设备,软件平台都被开发出来.但是程序员如果想要写出能够跨越这么多平台的应用来,不是一件容易的事.因此,本身具有跨平
工业界,尤其是棉纺织行业,对计算机图像识别及检测处理技术有着十分迫切的需要。目前,棉纺织行业中原棉异纤检测环节急需一种代替人工的自动异纤在线检测系统的出现。随着微电子
校园网的监测和管理成为现在高校的一项重要课题。蓬勃发展的校园网,使现在高校师生的学习、生活和工作变得越来越离不开网络。但网络的极度膨胀,使网络的运行效率、安全问题日
本课题主要研究的是基于角色的访问控制技术如何在网络安全中得到实现。传统的网络安全技术手段,不能实现网络区域的有效隔离和用户访问的有效控制。采用基于角色的网络访问控
音视频传输是网络多媒体的一个重要内容,涉及到多媒体和网络通信方面的内容,同时必须满足一定的服务质量。为此,研究音视频传输必须考察适合通信的多媒体技术和合适的通信技