时序知识图谱语义推理技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:shlpsfs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是表示实体间结构化关系的三元组表达形式,引入时间信息后变更的四元组则组成了时序知识图谱。由于时序知识图谱具有语义丰富、动态更新、图结构完备等特性,时序知识图谱已成为推理认知和人工智能的热门研究方向,且广泛应用于推理的相关应用,如知识图谱补全、智能问答、推荐系统等。以往的知识图谱研究大多关注静态的知识图谱,忽略了随时间变化的动态特征,但是在实际应用中,很多结构化的知识只在特定的时间内有效。这些问题会极大影响知识图谱推理的准确性和有效性,语义间的动态变化也会导致推理模型的失真。因此,如何在时序知识图谱中实现对未来事实的推理,同时提升模型的推理性能、准确度和可解释能力,已经成为知识图谱领域新的研究热点。认知科学中的双通道理论把人类的思考方式划分为了两个阶段。当面对未来事实的推理任务时,人类通常会在记忆中无意识地搜索有用的历史信息,即“快思考”阶段。随后会有选择地对未来事实进行逻辑推理,即“慢思考”阶段。受此机制的启发,提出了两阶段时序推理模型(Two-Stage Temporal Reasoning Model,TSTR)。具体地,在“快思考”阶段,从大量历史信息中挖掘出可用的信息,基于历史信息的频率来推理出未来事实发生的概率。在慢思考阶段,考虑到时序间依赖关系和邻域节点间的语义信息,采用基于注意力机制的关系图卷积网络的方法聚合邻域节点的语义信息,再通过循环神经网络进行序列化推理,得到预测概率。最后,对两阶段推理的候选实体概率进行加权,选择概率最高的候选实体作为最终的结果,实现两阶段融合的预测。为了验证TSTR模型的可行性和有效性,在三个公开基准数据集上测试了模型的性能。实验结果表示,相比于现有模型,TSTR模型在各个数据集上的表现都较为优秀。在链接预测任务上,平均倒数排名最高提升3%,准确率最高提升4%。
其他文献
随着位置服务应用的风靡,位置服务运营商在收集大量的用户移动数据用于数据分析的同时,也带给用户隐私泄露的风险。为避免这一风险,数据发布方在发布数据前通常会对用户的原始数据进行隐私保护处理。但是扰动后的数据在一定范围内仍然保留了用户的轨迹分布特征和轨迹间相似度,隐私泄露的问题依然存在。发现隐私保护方法中存在的隐私泄露场景,对未来的保护方法的完善具有现实意义。现有的移动数据推理研究中,针对差分隐私保护的
学位
电弧增材制造技术因沉积率高、短周期、高利用率和低成本等优点,具有广泛的应用前景。但在其生产过程中,存在很多干扰因素使零件表面产生缺陷,影响零件的成形精度。在电弧增材制造过程中,检测零件表面缺陷并对缺陷区域进行修补可以提升零件的最终成形质量。基于电弧增材制造点云数据的表面缺陷检测系统可以应用于电弧增材制造的在线监测领域,提高电弧增材制造生产过程的自动化程度和成形零件的精度。首先,将系统的功能模块划分
学位
物理不可克隆函数(Physical Unclonable Function,PUF)是在资源受限设备上实现硬件安全的一种重要解决方案,具有轻量级和唯一性的优势,其结构主要为数字电路PUF。目前攻击PUF的机器学习方法主要包括逻辑回归、可能近似正确、布尔函数等,这些方法大多存在着准确率较低、数据量大的问题。高效机器学习算法的研究主要是提出新的建模攻击方法或者改进当前已有的算法,从以下两方面展开。首先
学位
在脑部CT血管造影成像(Computed Tomography Angiography,CTA)图像中对脑颈动脉供血区域进行分区,对于脑梗死和脑肿瘤等疾病的诊断和治疗非常重要。目前广泛使用人工对脑颈动脉供血区域进行分区的方法,存在对医生专业水平要求高且质量难以控制和效率低的问题。针对人工分区方法的缺点,提出一种全自动的基于CTA图像的脑颈动脉供血分区方法,先使用深度学习网络自动标记出脑颈动脉的不同
学位
随着大数据时代的到来,数据隐私保护问题逐渐成为各方关注重心。安全多方计算技术实现了数据的“可用不可见”,为这一问题提供了解决方案,其中秘密共享技术是其当前实用性最强的技术分支,而隐私保护机器学习是其最热点的研究方向。然而,秘密共享技术仍存在计算效率低下、扩展性不强等限制。最新的CryptGPU方案通过将计算迁移到GPU上提升了计算性能,但其主要关注线性计算的效率提升,而忽略了非线性计算的效率问题,
学位
数字水印作为信息隐藏技术的一个重要分支,在防泄漏溯源、信息防伪、版权保护等方面具有重要作用,得到了广泛的关注和研究。目前基于深度学习的数字水印技术逐渐成为主流,在许多性能指标上都远超传统方法。而Stegastamp模型作为深度学习数字水印模型中的佼佼者,其各方面性能,尤其是鲁棒性,处于领先水平。但是Stegastamp模型仍然存在以下不足:数字水印嵌入痕迹肉眼可见,图像失真严重,并且当数字水印受到
学位
睡眠是人类基本的生理活动,高质量的睡眠为白天高效率地工作、学习、生活提供保障。睡眠分期是评估睡眠质量的技术,同时也是诊断治疗各种睡眠障碍相关疾病的重要依据。传统的人工睡眠分期方法存在高耗时、劳动密集且主观性强的缺陷,随着信号处理技术、机器学习和深度学习方法的发展,睡眠分期任务逐渐向自动化过渡。虽然目前的睡眠分期研究已经在分期准确率、泛化能力等方面取得了不错的成果,但仍存在着睡眠信号数据不纯以及现有
学位
随着神经网络模型规模和复杂度的不断升级,计算开销和内存需求逐渐成为神经网络在资源受限设备上落地的桎梏,因此,模型压缩优化成为了学术界和工业界研究热点。但目前提出的模型压缩算法还存在着严重破坏网络精度、压缩效果不理想及压缩方式单一等问题。针对二值量化离散性导致了二值网络严重的信息丢失上问题,提出了基于残差单元及多阶段梯度近似的二值量化算法。在二值网络的前向传播阶段,基于残差单元的网络结构,将类似的s
学位
中文临床诊断术语实体链接是自然语言处理在医学领域的一个重要应用。在临床上,对于同一个标准术语,由于术语表达多样性以及医生个人书写习惯不同等因素,往往有很多不同的表述。临床术语实体链接就是为了给临床上各种不同的表述找到其在标准知识库中的标准术语。临床术语实体链接系统大体上包括候选术语生成、候选术语重排序和不可链接处理三个阶段。由于中文临床诊断术语数据量大、书写方法不统一等特点,导致中文临床诊断术语实
学位
知识图谱能够展示信息间的发展和联系,并对隐藏信息进行分析和挖掘,支持智能问答和高效信息检索等应用。制造业是工业的基础,数控技术是横贯现代制造业的关键技术,构建数控设备维护领域的知识图谱是迈向工业智能化坚实的一步。与百科图谱不同,构造面向数控设备维护领域的知识图谱存在着诸多问题,包括实体的多义性、存在复杂的非单一名词性实体类型以及图谱的稀疏性等问题。基于数控设备维护领域的数据特征以及对知识图谱构建的
学位