基于深度强化学习的固体放射性废物抓取方法研究

来源 :计算机应用研究 | 被引量 : 1次 | 上传用户:gaoaiping0322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对固体放射性废物分拣作业中,放射性废物杂乱无序、远程遥操作抓取效率低、人工分拣危险性大等典型问题,提出一种基于深度强化学习的放射性固体废物抓取方法。该方法使用改进深度Q网络算法,通过获取的图像信息,使机器人与环境不断进行交互并获得回报奖励,回报奖励由机械臂动作执行结果和放射性区域内放射性活度的高低构成,根据Q值的大小得到机械臂的最佳抓取位置。用V-REP软件对UR5机械臂建立仿真模型,在仿真环境中完成不同类型固体放射性废物抓取的训练与测试。仿真结果表明,固体废物在松散放置时该方法可使机械臂抓取成功
其他文献
<正> 不同国家的自然条件和技术条件不同,所得木材切削参数各异.因此,必须逐步建立起我国自己的一整套木材切削参数. 我所与东北林学院木机系协作,于一九七三年开始对木材切
由于中医文献内容繁杂数目庞大、专业术语词汇较多,且包含使用文言文、古人口语等多样的书写方式,使用通用领域的分词器进行分词的效果较差。为了解决这一问题,构建了基于BiLSTM-CRF的模型对中医领域的文献尤其是文言文文献进行分词,并在中医领域文献上对比了BiLSTM-CRF模型、BiLSTM模型及主流通用中文分词器jieba、Ansj的分词结果。结果表明基于Bi-LSTM-CRF模型的分词取得了更优
属性基加密(ABE)方案在云存储中得到了越来越广泛的应用,它能够实现细粒度的访问控制,但是现有的大多数ABE方案存在撤销方案效率低、开销大的问题。为了解决这一问题,提出一种更高效、细粒度的支持属性撤销的属性基加密方案。该方案将部分加解密运算外包给代理服务器,从而降低用户的加解密计算量。同时还提出了一种有效的属性撤销方法,该方法只需更新与撤销属性相关联的密文和用户密钥,所以属性撤销的代价很小。并结合
目的观察温补心肾方治疗慢性心衰的疗效。方法慢性心力衰竭患者随机分为治疗组37例和对照组36例。两组给予西医基础和对症治疗,治疗组加用温补心肾方,治疗前后主要观察心功能
以培养高质量人才和出高水平成果为学科中心工作。迄今培养出180多名博士,600多名硕士,1500多名学士。在科研方面,每年承担的科研项目包括国家自然科学基金、国家863项目、
云计算系统是一个高度动态的分布式计算环境,对系统中的节点负载进行实时监控和预测,是防止集群节点过热的主要途径。不同于传统方式基于原始信息来进行负载预测,提出了一种带人工干预的特征融合热点预测方法。首先,基于稀疏自编码网络对不同的性能指标进行特征提取来获得单性能特征;然后,基于特征融合模型和人工干预模型分别得到融合特征和人工特征;最后,利用上述三种特征来学习和训练神经网络模型,用于预测热点。在Goo
随着油气钻采条件的日益恶化,对石油钻头使用性能和工作寿命的要求越来越高。其中,硬质合金胎体作为石油钻头的重要组成部分对其使用性能和工作寿命有重要影响。目前,石油钻
随着电力体制改革的不断推进,用电量需求预测在电力行业的重要程度越来越高,预测结果越精确越有利于相关企业对资金作出合理的配置,积极有效地应对电力现货市场。基于RFE选择较高质量的特征值作为预测模型的输入,得到了较好的预测结果。进一步通过PSO算法对SVR模型参数进行择优选择,更进一步提高预测精度。通过两模型之间的对比分析,PSO-SVR模型能够更好地拟合实际用电量需求的走势,尤其是在用电量需求波动较
股票指数数据是典型的时间序列,对其预测具有极强的不确定性。针对这一问题,提出了基于主成分分析(PCA)和多层门控神经网络(GRU)相结合的预测模型。采用1993—2018年上证综指指数前5 800天的每日基本数据进行训练,剩余数据作为测试集,并与传统的循环神经网络(RNN)和长短期记忆网络(LSTM)进行对比,通过多次对比实验求均值的方法,发现在测试集中通过构建PCA与RNN、LSTM、GRU的一