【摘 要】
:
移动机器人已经开始逐渐出现在人们日常生产生活中的各个领域,且发挥着重要的职能作用。课题以三轮全向移动机器人作为研究对象,将移动机器人的路径规划与自主避障作为主要研究方向,主要研究问题为针对单一的强化学习算法应用于处于复杂环境的移动机器人路径规划与自主避障时,容易引起维数爆炸,算法难于收敛等问题,使用深度强化学习在复杂场景下完成移动机器人路径规划与自主避障任务。首先,建立了三轮全向移动机器人运动学模
论文部分内容阅读
移动机器人已经开始逐渐出现在人们日常生产生活中的各个领域,且发挥着重要的职能作用。课题以三轮全向移动机器人作为研究对象,将移动机器人的路径规划与自主避障作为主要研究方向,主要研究问题为针对单一的强化学习算法应用于处于复杂环境的移动机器人路径规划与自主避障时,容易引起维数爆炸,算法难于收敛等问题,使用深度强化学习在复杂场景下完成移动机器人路径规划与自主避障任务。首先,建立了三轮全向移动机器人运动学模型与动力学模型,同时给出了其自身搭载的惯性测量元件(IMU)与激光雷达传感器模型。编写URDF文件与环境交互插件文件,实现了对仿真环境进行感知并建立良好信息传递连接的三轮全向移动机器人仿真模型,利用Gazebo仿真软件进行仿真实验,验证了模型的环境交互能力。其次,针对当前强化学习在处理高维输入状态数据方面的缺点,引入深度学习处理高维输入。结合三轮全向移动机器人运动学特点,从状态空间、动作空间、奖励函数等5个方面设计两种基于深度强化学习的三轮全向移动机器人路径规划与自主避障算法,并进行仿真迭代实验,验证了深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)对于具有连续动作空间的问题有更好的处理效果。再次,针对DDPG算法更适用于连续动作问题的处理,但需要训练四个神经网络引起,算法收敛速度较慢,以及复杂的超参数调试经常使Critic神经网络产生过估计,可能导致算法不收敛的问题,提出基于改进DDPG的避障算法,使用优先经验回放代替经验回放机制,加入了OU随机噪声并设计了避障控制器,并逐条分析了每条改进措施所能带来的算法性能提高。通过进行对比仿真实验,表明了本文所提出的改进DDPG算法,从算法的收敛速度、稳定性、可靠性方面均得到了明显的提升,验证了所提改进措施的有效性。最后,利用ROS机器人操作系统与Gazebo仿真软件,建立了与仿真迭代实验环境完全不同的仿真环境,包括完全由静态障碍物组成以及添加动态障碍物两种仿真环境,使用训练完成的改进DDPG算法进行了测试实验,对其泛化能力进行了测试。
其他文献
随着我国金融改革的深入发展,零售存款呈现向其他市场分流的趋势,商业银行面临着日益严峻的存款压力。为摆脱资金困境,商业银行更多地借助批发性融资弥补资金来源缺口。然而,现有文献主要关注批发性融资对银行风险承担、经营稳定性的影响,较少研究其对商业银行经营效率的作用。因此,本文主题具有一定的理论意义和实践价值。本文首先通过梳理相关文献,总结我国批发性融资的演进历程和发展现状,基于规模经济理论、监管约束理论
税务部门肩负着“为国聚财、为民收税”的光荣使命,税务部门的绩效管理历经从1.0版到7.0版的变迁而日益完善,不仅在政府绩效中是一个特殊的存在,在国际绩效管理研究中也吸引了越来越多的关注。基层税务部门是税收阵地的一线,也是税务系统绩效管理延伸的神经末梢,尤其县级税务部门,其绩效管理的开展直接反映了税务系统绩效管理的落地情况,对税务部门的职能发挥也起着重要作用。2018年7月,国地税征管体制改革拉开序
智慧心理学经过半个世纪的发展,已经在多方面取得了可靠成果,但以往研究多基于经典量表或后继研究者再编量表,在研究工具方面有很大的拓展空间。与此同时,随着互联网、人工智能和大数据的发展,越来越多的非结构化数据,例如文本,开始进入各领域研究者的视线。本研究旨在通过自编程序分析中国被试关于智慧内涵的文本信息来探索智慧心理学新的研究途径和视角。总体研究过程为建立智慧词库,在词库和程序的基础上设计横向及纵向研
声学超表面是一种人工设计的具有亚波长厚度的二维结构,通过亚波长结构的巧妙设计可以实现对于声波的波前调控,从而实现声聚焦、异常折反射、声吸收和源错觉等功能。人们对声学超表面感兴趣的主要原因之一是可以通过薄而轻的结构形式对声波进行灵活调控,推动了器件的小型化发展,从而使新的应用成为可能。由于声学超表面的研究历史较短,还存在许多待解决的问题和技术难点。其中突出的一点是,现有的具有固定微观结构的声学超表面
生物种群的演化行为包括新生个体的加入和年老个体的死去,这使得种群内部不同个体之间普遍存在诸如年龄、尺度和等级的差异,就年龄等级结构而言,当前文献中的模型大都假设年长者在竞争中更占优,但在某些实际情况下可能恰恰相反.基于这样的考虑,本文提出的年龄等级模型假设年轻个体更占优,该模型是一类非线性偏微分一积分方程,其边界条件还具有全局反馈形式.本文研究了模型解的基本性质和解关于收获强度的连续依赖性;讨论了
对于投资额小于5000万的小型精细化工类项目,既体现出典型的短平快特色,又具有原料多样、工艺纷杂、新技术多变等行业特质,在设计过程中需要高度的专业性和技术敏感性。小型精细化工项目工程设计阶段的质量控制是保证化工装置安全、稳定、长寿、满负荷、低能耗、高质量运行的关键。但由于小型精细化工项目存在规模小、投资额少、复杂多变、各具特色等问题,工程设计阶段的质量控制并没有得到足够的重视,也很难进行系统化的研
本文以安徽省两淮煤矿区的典型城市——淮南市和淮北市为研究区,基于RS和GIS技术,采用土地利用动态度、土地利用转移矩阵、土地利用变化图谱、土地利用变化重要性指数、景观指数综合分析淮南市1985~2016年和淮北市1985~2015年土地利用景观格局变化特征。采用Logistic回归模型测度不同驱动因素对各地类变化的驱动作用。参考前人研究,通过引入空间自相关变量对传统Logistic回归模型进行改进
过去十年房地产行业经历了最好的黄金时代,通过快周转模式,碧桂园只用了 6年时间就实现了销售额从329亿至3088亿的跨越,并登顶国内房地产行业年销售额榜首,与此同时碧桂园工
智慧、幸福感和物质主义不仅是哲学领域的重要话题,也受到现代心理学的持续关注。学界对于智慧和幸福感、物质主义价值观和幸福感之间关系做了一定探讨,但至今未形成定论。且较为缺乏对智慧和物质主义价值观之间的关系、以及三者关系的探讨。本文以智慧推理和智慧的德才一体理论为指导,以基于智慧推理模型编制的情境智慧量表和基于智慧的德才一体理论编制的整合智慧量表为智慧的测量工具,探究智慧、幸福感和物质主义价值观三者之
随着对生态学研究的深入,具有功能性反应的捕食模型越来越被人们重视,并且已经成为生态学与生物数学的重要研究内容之一.基于此,本文将系统地分析一个这样系统的性质.首先,对于系统参数是一般非自治的情况,获得了系统的最终有界区域和正向不变集以及二者存在的条件,给出了使系统延续下去必须满足的判别条件,并通过Liapunov函数的方法获得了使系统的任意有界正解是全局渐近稳定的需要满足的条件;其次,对于系统参数