基于深度强化学习的机器人打磨技术的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:hongqinshuling
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人打磨作业磨削力控制是典型的非线性、状态时变型马尔科夫决策过程问题。针对传统机器人力控制方法对环境模型精确度依赖性高、不确定性环境适应差的缺点,研究了一种基于深度强化学习(DRL)算法的智能控制方案。该方案使传统机器人具备拟人化经验学习能力,在与作业环境交互过程中自适应拟合磨削力控制模型,补偿工具位姿修正误差进而实现恒力磨削作业。课题研究过程中的具体工作内容包括:(1)为满足深度强化学习算法的训练需求,开发了力感知机器人开放式仿真系统,避免了大规模训练过程中实体环境的硬件损耗。针对传统机器人仿真系统开放性差、功能兼容性少的缺点,分别使用V-rep创建服务端机器人操作环境、基于Python开发机器人客户端控制功能、并通过Remote API的远程通信连接模块,拓展了系统对Tensorflow深度学习框架等软件的功能支持。(2)为稳定准确地测量工具末端所受磨削力,设计了磨削力信号的在线处理系统,补偿磨削力测量过程中的环境噪声影响。对于六维力传感器的测量值,分别采用卡尔曼滤波器过滤传感器测量误差、设计重力补偿方案消除工具自身重力影响、建立传感器与末端接触位置点的坐标系转换模型计算出真实磨削力值。通过与开发的仿真系统联合实验,验证了磨削力信号在线处理系统有效性。(3)为实现机器人的恒定磨削力控制,设计了基于DRL算法的恒力磨削控制方案。分别针对多维磨削力状态表征、连续空间末端动作修正、变轨迹单步打磨控制的场景应用难题,给出相对应的问题解决方案,并改进算法探索策略和奖励函数,保证了算法收敛效率和性能。通过仿真实验结果表明,基于DRL的恒力磨削控制器能够在无模型平面和曲面工件打磨过程中,通过经验样本迭代训练模型更新,以控制机器人改变初始位置偏差,补偿作业过程中噪声影响,进而有效地执行打磨作业。
其他文献
随着网络科技的不断发展,网络攻击呈泛化、多样化趋势,以高级可持续威胁为代表的新生威胁应运而生。面对这些多阶段、多矢量、可持续的新生威胁,以防火墙、入侵检测系统和入侵防护系统为主的传统防御体系无法达到有效检测,一直处于被动局面。近年来,威胁情报共享成为加强网络安全态势感知和防御能力的一大利器。通过各信息系统的互联互通,使得威胁情报在各组织之间积极流动,从而建立健康高效的威胁情报生态体系。然而,目前相
当今世界经济已经步入了知识信息技术时代,从世界500强企业的发展趋势来看,企业的科技和管理创新能力越强,它的适应能力就越强,可持续发展的动力就越足。没有创新就没有高新技术产业,而传统的产业也得不到可持续的发展。越来越多的企业已经开始把创新作为企业赖以生存和发展的基础,力争在当今激烈的市场环境中占据一席之地。而研发人员是企业实现科技创新必要前提条件。如何招好、用好、留好知识型员工,研发人员的工作绩效
中国汽车市场在过去十年处于高速发展时期。各大汽车制造商对中国汽车市场持有乐观态度,纷纷在华积极扩充生产线。然而,2018年中国汽车市场销售量首次出现下滑。这意味着中国消费者对汽车的需求有所降低,持续十年的汽车增量市场转变为汽车存量市场。截止2019年6月,中国汽车销售量已连续下降了12个月。2020年上半年,受到新冠肺炎疫情的影响,中国乃至全球的经济遭受了严重的打击。消费者的购车欲望持续下降。从中
学位
分子基磁体在高密度信息存储、分子自旋电子学、量子计算等方面具有潜在的应用价值而备受关注,其中稀土单分子磁体的构筑及性能研究是当前分子磁体的研究热点。本论文旨在探索稀土单分子磁体磁弛豫动力学的影响因素,为设计合成具有高能垒高阻塞温度的单分子磁体提供合成策略和理论依据。首先,选择具有强磁各向异性的稀土金属Dy(Ⅲ)为顺磁中心,结合β-二酮类配体和双齿螯合配位模式的辅助配体共同构筑[DyN2O6]型单核
由于中师学生的生源较差,如何让数学学习不良中师生学会自主学习,提高他们自我监控的能力。本文通过对数学学习不良中师生的数学自我监控现状进行调查,研究数学学习不良中师生自我监控的特点及其干预效果,并提出针对性的建议。研究一,采用数学自我监控能力问卷对五年一贯制中师阶段一至三年级学生进行调查,探讨数学学习不良中师生的自我监控特点。研究二,利用自我提问和自我解释整合策略对数学学习不良中师生进行自我监控干预
近几年我国民俗旅游作为一类新型的旅游项目,在国内得到越来越多不同旅游群体的追捧和青睐,民俗旅游的开发形式和内涵已经成为学术界、业内人士的重要的研究课题。延边作为少数民族朝鲜族聚居地,拥有着宝贵的朝鲜族民俗风情和民俗文化,充分开发利用朝鲜族民俗风情和民俗文化作为载体发展的民俗村旅游,不仅能为游客带来独特的旅游活动的内容,更能促进当地民俗村旅游的发展和进步,推动经济发展和改善村民的生活。而民俗村内的村
学位
现如今互联网、AI、传感器、5G通信技术迅猛发展,先进的数字电路领域需要同样高性能的模拟部分与之匹配。模数转换器(ADC)作为模拟与数字世界的转换桥梁,高精度Sigma-Delta ADC成为了研究热点。但是目前国内对高精度Sigma-Delta调制器的研究系统并不完善,电路结构制约性高。因此,本文设计了一个高精度Sigma-Delta调制器结构,并针对以上问题从两个方面对优化精度方面做出了研究。
软件老化通常是由软件故障激活的累积效应造成的,从而导致内存泄漏、操作系统资源耗尽等错误,最终致使软件失效或系统宕机。尽管通过抗衰操作可减少因软件老化、失效带来的系统性能下降等不良影响,然而何时实施抗衰操作仍有待研究。软件再生的频率很关键,过于频繁会延长停机时间,频率过低则无法及时解决老化问题,不能保证良好的运行效果。因此何时采取再生策略的重点在于能否准确预测出软件老化的趋势,根据预测结果适时采取再