基于深度强化学习的核机器人分拣作业方法研究

来源 :西南科技大学 | 被引量 : 0次 | 上传用户:markhai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
放射性废物分拣作业通常面临非结构化、局部放射性的复杂工作环境,随着机器人控制技术的提高和发展,人工分拣方式逐渐被取代,遥操作核机器人进行分拣任务的方式成为主流。但目前遥操作分拣作业存在分拣效率低、操作难度大、人员培训周期长以及自主控制能力差等典型问题。针对上述问题,本文以提升机器人非结构化环境中适应性和自主作业能力为目标,基于深度强化学习对核机器人分拣作业方法进行深入研究。首先,本课题对核机器人分拣作业任务的特点进行深度剖析,设计由环境感知、数据训练与运动控制三个部分共同组成的核机器人分拣作业系统框架,并对视觉系统与机器人之间的部署方式进行讨论和选择。同时,对系统中的机器人进行运动学和逆运动学分析,结合相机标定原理构建手眼标定模型得到图像信息与机器人控制之间的转换关系。然后,提出基于深度强化学习的FR-DDQN核机器人分拣作业方法。该方法对传统深度Q学习算法进行优化,使用基于双深度Q学习及经验优先级采样的算法框架,提升了算法的训练效率与稳定性。另外,基于马尔科夫决策过程对分拣作业数学模型进行设计与构建,设定图像输入的状态空间与机械臂的动作空间,使用全卷积神经网络的值函数,对输入图像信息中每个像素点进行评价输出。设计有效的回报函数并在放射性区域加入额外的性能指标,达到优先分拣具有高放射性活度废物的目的。此外,该分拣方法对机械臂抓取操作和推动操作分别进行训练,采用协同配合的分拣方式,提高了分拣效率,解决了废物之间相互影响的问题。最后,通过设置多组仿真和实物实验对分拣方法进行验证,完成多类型放射性固体废物分拣的训练与测试,并对提出方法的性能进行评估。实验结果表明,机械臂能够自主完成复杂条件下的分拣任务,使用推动和抓取协同作业的方法可以明显提高工作效率,并会优先抓取放射性区域内具有高放射性活度的物体,且不会受到废物堆叠的影响。另外,实物试验验证了该算法具有迁移能力和良好的泛化性。
其他文献
以"综合扫雷车模拟训练系统"为例,介绍了利用Visual Basic的MSComm通信控件和Media Player媒体播放控件及单片机系统来实现某些装备的模拟操作训练,重点介绍了利用Visual Bas
以Chebyshev神经网络为基础,给出了3个非线性函数的仿真实例,并提出了用模拟电路实现Chebyshev神经网络的方法。
信息技术在各行各业当中的广泛应用,方便了人们的生活与工作,但是也出现了诸多的信息安全问题,从而对计算机信息系统的网络安全提出了更高的要求。基于此,笔者以计算机系统的
介绍了企业计算机电话技术论和PCI工业计算机制造协会正积极协作,共同将开放的且具有互操作性的计算机电话技术规范引入市场。
基于直觉模糊有序加权平均算子的相关思想,提出一种新的集成算子—对称直觉模糊有序加权平均(S-IFOWA)算子.并研究此算子的相关性质及给出基于S-IFOWA算子的多属性决策方法,
随着社会经济全方位的发展对空间信息需求不断扩大,地面三维激光雷达技术作为获取空间信息的最有效手段之一,已经在在许多领域迅速发展并广泛应用。本文主要针对地面三维激光雷
青少年是我国的栋梁,他们的健康成长水平决定着国家的经济社会发展。然而,我国的很多适龄青少年由于饮食和日常生活不符合规律等原因导致了生长发育的提前,同时肥胖、贫血等
目的:基于双心医学模式,应用国医大师张震疏调气机学术思想,采用疏调汤治疗稳定性冠心病伴焦虑抑郁状态(气滞血瘀型)患者,进一步总结名老中医学术经验,探究其病因病机及作用
选取秦岭山脉地区华溪蟹属(Sinopotamon)淡水蟹进行DNA条形码研究,探讨DNA条形码在华溪蟹分类中的适用性。经与模式标本比对,采集样本为光泽华溪蟹指名亚种(Sinopotamondavidi dav
设Pn和Cn是具有n个顶点的路和圈,Sn是n个顶点的的星图,nG表示n个图G的不相交并。E^G(r+1)p+r表示把星Sr+1的r个1度点分别与rG的每个分支的第i个顶点重迭,同时把Sr+1的r度点与另一个