TransPath:一种基于深度迁移强化学习的知识推理方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:cywxp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于深度强化学习(Reinforcement Learning,RL)的知识推理旨在推理缺失事实并补全知识图谱,RL智能体在知识图谱上搜索路径,并基于路径进行事实预测和链接预测.由于具有良好的性能和可解释性,基于深度RL的知识推理方法近几年迅速成为研究热点.然而,对于特定实体来说,动作空间中存在大量的无效动作,RL智能体常常会因选择无效动作而终止游走,所以路径挖掘的成功率很低.为了解决无效动作的问题,本文提出一种基于深度迁移强化学习的知识推理方法—TransPath,在目标任务之外增加了单步游走选择有效动作的源任务.首先在源任务上训练单步游走,帮助RL智能体学会选择有效动作,然后迁移到目标推理任务上进行路径搜索训练,提高路径挖掘的成功率.在数据集FB15K-237和NELL-995上的对比实验结果表明,本文方法不仅大幅提升了路径搜索的成功率,而且在大多数推理任务中性能优于同类方法.
其他文献
针对烟草工厂底层物联设备检修体系落后,设备检修效率低的问题,设计智能烟草工厂底层物联设备远程检修系统.采集现场设备运行数据,并将采集的数据存储至设备故障经验知识库,应用故障专家子系统调用设备故障经验知识库的数据信息,实时监控现场设备运行状态;利用故障树最小割集的故障诊断方法,诊断智能烟草工厂底层物联现场设备,依据诊断结果,故障远程报警子系统通过全球移动通信模块,向设备检修者发送报警短信,实现设备远程检修.实验结果表明,其检修时间和停机时间降低,设备故障检修效率提高.
在社会经济持续发展过程中,城市化建设的进程逐渐加快,人们逐渐加大了对房产的需求.而在我国房地产繁荣发展的背后,存在建筑装修行业不规范,缺乏有力的监管等现象,所使用的装修材料会对人体带来巨大危害,严重威胁到人们生命财产安全,同时还严重威胁到生态环境安全.人们对装修材料的质量有了更高的要求,通过选择环保,绿化无害的建筑装修材料,有效促进我国建筑行业的发展.基于此,在本次研究中就加强分析建筑装修材料中有毒物质所带来的危害效应,并采取积极有效的措施加强防治,为建筑装修等相关工作提供有效参考.
为了提升财务管理预警精确度,构建基于数据挖掘的财务管理预警模型.首先利用财务管理预警指标体系,然后通过数据挖掘技术中的决策树算法实现财务环境和财务活动中财务风险的有效预警,最后进行了财务管理预警仿真实验,试验结果表明,该模型的预警精准度可达98%,可清晰判断财务指标异常情况,具有较高的实际应用价值.
文中对配电房视频智能分析系统软硬件功能、结构和原理等进行了详细介绍,以视频采集信息为基础,实现授权管理、安全穿戴、环境监控等方面的智能识别,并通过实验验证了此次研究的系统的有效性,提高配电房全天候监控系统维护工作效率、运维效果,并能够减少人员、设备等的故障,具备实际应用意义.
随着推荐系统的广泛应用,它正在对社会产生越来越大的影响.由于数据、算法等原因,推荐系统可能会对具有某些特性的群体产生带有偏见的结果,导致不公平现象的产生,从而引发各种问题.消除偏见并在推荐中实现一定的公平性,会使整个推荐系统的结果更加平衡、友好.对推荐系统的公平性进行评价是提高推荐系统公平性的基础,近年来,研究者提出了各种不同的推荐系统公平性评价方法.本文系统总结了近几年的研究成果,从3个维度对推荐系统公平性进行了分类介绍,重点从利益相关者的维度详细分析并总结了在各种推荐环境下出现的公平性定义和评价标准,
自动语音识别系统(ASR)能将输入语音转换为对应的文本,其性能因深度学习技术的发展得到了显著提高.然而,通过在输入语音中添加微小扰动而生成的对抗样本,可以使人类毫无察觉的同时让ASR系统产生不可预测的,甚至是攻击性的指令.这种新型的对抗样本攻击给基于深度学习的ASR系统带来了诸多安全隐患.本文对语音对抗样本作了系统性的分析和梳理,提出了对现有对抗样本的分类.其次介绍了面向ASR系统的对抗样本生成方法.同时,阐述了典型的对抗样本防御策略.最后讨论了对抗样本带来的挑战,并分别就如何使生成的攻击更加逼真,和增强
共识算法作为区块链的核心技术,决定了区块链系统的性能.其中,PBFT是最具有代表性的一种共识算法,但它存在以下缺点:通信代价大、共识时延长.由此诞生了许多通过各种方法减小共识节点规模来提升PBFT效率的一类算法,但是它们都不是基于距离因素的,并且具有与PBFT类似的缺点.基于此,本文提出了一种基于距离的面向区块链的共识算法.首先通过Grouping算法对节点进行分组,将距离较近的节点分成一组进行共识,从而在缩短共识节点之间距离的基础上减少共识时延.同时结合speculation技术,降低节点间通信的时间复
基于面部视觉特征的抑郁症诊断方法借助计算机视觉技术,通过分析被试的面部肌肉和眼球相关运动特征来辅助抑郁症的早期检测.与目前临床上通常采用的医生访谈方式相比,基于面部视觉特征的抑郁症诊断法具有被试无须与外人外物交流接触且客观高效、普及性强与成本低的显著优点,可极大缓解医生患者比例不足、误诊率偏高现状,拥有广阔应用前景.本文从抑郁症患者的面部行为特点入手,综合介绍了目前常用的诱发实验范式、现有面部视觉特征公开数据库及基于面部视觉特征的抑郁症诊断的最新研究成果,最后简要讨论了存在问题与发展动向.
任务调度问题是空间众包的核心问题之一.现有工作主要针对欧式空间中的个人任务,忽略了群组任务以及底层的路网信息,实用性有待提高.有鉴于此,本文研究路网场景下群组任务匹配和调度问题,提出了基于网格索引的群组任务匹配和调度算法框架.该框架由网格索引、搜索有效工人集算法和组建团队算法组成.该框架首先通过网格索引存储的路网信息和工人信息快速过滤掉不满足时间或预算约束的工人,避免大量无效的最短路径计算.然后利用基于剪枝策略的搜索算法搜索到满足任务约束的有效工人集.最后通过组建团队算法迭代地在有效工人集中选择最小成本覆
区域覆盖算法广泛用于群机器人解决资源勘查、目标搜救、地形测绘等问题.目前,对区域覆盖算法的研究主要是用传统计算机仿真和数值计算方法对算法模型进行测试,然而,软件系统缺陷可能会使测试结果出现偏差,导致任务失败.因此,本文采用定理证明的形式化方法,基于交互定理证明器HOL-Light中集合库、实分析库等定理证明库,实现了群机器人工作场景的高阶逻辑表达;完成了机器人移动概率和平均移动概率的建模与验证;最终验证了一定时间步长内群机器人在特定区域内的覆盖率的正确性.为实现多种复杂场景下群机器人区域覆盖算法的高阶逻辑