基于深度强化学习的多辅助机器人路径规划研究

来源 :沈阳工业大学 | 被引量 : 0次 | 上传用户:yux444
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国老龄化愈发严重且下肢失能患者人数逐年增多,人工护理已经无法满足需求,使用辅助机器人完成老年人及失能患者的日常生活辅助是当下研究的一个热点。当使用环境中同时存在多台辅助机器人时,多台辅助机器人的路径规划与避障是一个首要解决的问题。多机器人系统具有较高的动态性,因此传统的路径规划方法不在适用于多机器人系统中,如何让多机器人系统中的路径规划变得更智能是当今研究的重点。近年来机器学习的热度越来高,机器学习中的强化学习通过不断试错来达到最优策略的机制使其受到众多学者的关注。本文采用深度强化学习方法来对多辅助机器人系统中的路径规划和多机器人避障进行研究,本文的主要内容有:首先,分析养老助残场景中辅助机器人的使用者的特殊性并对辅助机器人路径规划提出了安全性、快速性和舒适性的三点基本要求。指出传统机器人路径规划方法在辅助住机器人使用场景中的不足。将深度强化学习中的深度Q网络应用于辅助机器人路径规划。设计了智能养老院场景下的辅助机器人路径规划仿真实验。通过与VFH路径规划方法对比,发现基于深度强化学习路径规划方法缩短了路径规划时间、提高了轨迹的平滑性,更好的满足了辅助机器人路径规划的安全性、快速性和舒适性的要求。然后,在深度强化学习使用过程中发现其训练效率慢、迭代过程中所需时间步较多的不足。分析这类不足产生的原因,提出重采样机制来提高信息价值重要的样本回放概率。将重采样机制应用于深度深度强化学习中。在智能养老院场景下进行辅助机器人路径规划仿真实验。通过与传统深度Q网络对比,证明重采样机制能缩短深度强化学习迭代步骤、减少迭代过程中的时间步并提高深度强化学习训练效率。最后,建立了多辅助机器人系统,分析多辅助机器人系统的避障要求并建立多机器人避障数学模型。针对经典多机器人避障方法的算法效率较低以及对大规模机器人系统适应性差的不足,设计了基于多智能体深度强化学习的多机器人避障方法。在极端情况下的多机器人避障实验中,对比速度障碍法、最优相互式避障法和多智能体深度强化学习法的结果,发现多智能体深度强化学习法的机器人避障位移更短,机器人速度改变更为平滑,将多智能体深度强化学习法应用与大型机器人系统中仍能保持平稳的避障。研究表明基于深度强化学习的多机器人避障方法是一种可行且优质的多辅助机器人避障方法。
其他文献
<正>近年来,由于外用激素治疗湿疹和皮炎等过敏性疾病疗效显著,造成众多患者长期使用甚至滥用,皮肤屏障受损,原有皮疹加重,并出现干燥、粗糙、变薄及毛细血管扩张,伴瘙痒、灼热感等自觉症状。由于长期使用糖皮质激素,所导致皮损加重的疾病临床称为激素依赖性皮炎(hrmone-dependent dermatitis,HDD),以面部多见。面部激素依赖性皮炎的发病率不断上升,
期刊
数字时代中,志愿服务信息系统发挥着处理志愿者、志愿服务组织、志愿服务项目等相关信息,促进志愿服务领域善治的关键性作用。由于无法满足处理效率、可信度与信息量的同时提升,过去以志愿服务时长为核心数据元的信息系统,难以给予志愿服务项目专业化发展必要的技术与制度保障。通过对志愿服务信息系统发展历程回溯,本文剖析不同信息系统在定位、功能与架构上的时代更迭。并以关爱困境儿童项目为案例,探讨利用大数据、区块链等
目的:比较针刺十三鬼穴联合开心散与单纯开心散治疗围绝经期抑郁症的临床疗效。方法:将60例围绝经期轻度抑郁症患者随机分为中药组(30例,脱落2例)与针药组(30例)。中药组口服开心散加减治疗,每日1剂,早晚分服;针药组在中药组治疗基础上,加用针刺孙思邈十三鬼穴(水沟、少商、隐白、大陵、申脉、颊车、承浆、劳宫、上星等穴),得气后即出针,隔日1次,每周3次,两组均连续治疗12周。分别于治疗前、治疗后、治
西汉司马迁所著《史记》是我国第一部纪传体史书,这部史书以精准的细节描写和高超的艺术手法屹立于史传文学之林,尤其是司马迁对《史记》中112例“哭”的叙写,使得这部著作独步于史传文学之中。本文即以《史记》中记载的“哭”例为研究对象与切入点,针对司马迁“哭”书写的动因、“哭”的类别、“哭”的内在意蕴、“哭”叙写的表现手法、“哭”叙写对后世文学的影响五个方面进行研究,以期能为司马迁《史记》“哭”的文学书写
针对基于最长队列优先配时算法的大规模交通信号灯协同控制模式存在的诸多不足,提出了一种基于多智能体深度强化学习的大规模交通信号灯控制模型。首先形成融合经验学习集和实践应用集的高度动态复杂路段交通运行态势经验池;然后利用深度长短期神经网络建立时间正序下的大规模交通信号灯与多智能体之间的物理映射关系;最后利用深度确定性策略梯度算法实现复杂路段大规模交通信号灯最优协同控制。对模型开展了典型需求场景下的仿真
志愿服务信息管理系统是为志愿者服务队编写的一套信息管理系统,便于对志愿者的信息和服务队日常事务进行统一管理。当前志愿服务信息管理系统存在诸多问题,影响其管理效率和规范化。区块链技术具有去中心化、全网分布式处理、共识机制、集体维护、时间戳等技术特征,将区块链技术引入志愿服务信息管理系统有助于解决其信息记录混乱繁杂、信息处理信度低、信息真实性难以保证和透明度低等问题,具有必要性和可行性。应在志愿服务信
未来天基信息网络(spaceinformationnetwork,SIN)领域将面临结构复杂、环境动态、业务多样等发展趋势带来的挑战。数据驱动的深度强化学习(deep reinforcement learning,DRL)作为一种应对上述挑战的可行思路被引入SIN领域。本文首先简要介绍了DRL的基本方法,并全面回顾了其在SIN领域的研究进展。随后以星地网络场景的中继选择为例,针对大规模节点问题提出
<正>熊科动物是当今陆地上体形最大的食肉动物,它们常给人一种笨重、缓慢的印象,与大型猫科动物比起来,少了一份威武与霸气。不过,在距今1万年前的北美洲,曾经生存着一种巨熊,其外形与今天的熊科动物有很大差别,令人印象深刻。在距今3万年前的更新世末期,地球正处于第四纪冰川期,美国加利福尼亚州的气候要比今天湿润。在一座山谷中,不断传来嚎叫声,原来是一群恐狼正在围攻一头年老的长角野牛。长角野牛此时已经筋疲力
期刊
<正>股份公司第二炼钢厂机修车间根据工种多、日常检修项目多、检修环境复杂、安全管理难度大等特点,以现场为重点,不断强化职工安全意识、提高职工安全防护技能,确保检修过程中的安全作业,努力做到从人、机、环"三个"方面入手,抓好检修前、中、后"三个"环节,树立"三种"观念;确保检修安全,实现了检修零伤害的安全管理目标。一、从人、机、环三方面入手,做好安全本质化建设人员的本质化安全包括人员的安全生理、安全
会议
欧洲志愿服务与福利国家演变历程紧密相连,贯穿其萌芽及发展各阶段。当福利国家陷入困境后,福利多元主义思潮兴起,志愿服务理论也掀起了新高潮。欧洲志愿服务在实践中弥补了福利国家部分功能,并逐渐拥有稳健的运行及支持体系。本文旨在考察福利国家及欧洲志愿服务发展的历史进程,梳理两者之间的理论联系,阐述当今欧洲志愿服务组织运行及支持体系,进而剖析其发展趋势,以期对我国志愿服务发展提供借鉴。