基于强化学习的快速探索随机树特殊环境中路径重规划算法

来源 :控制理论与应用 | 被引量 : 0次 | 上传用户:shanglonghai105
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对移动机器人在未知的特殊环境(如U型、狭窄且不规则通道等)下路径规划效率低问题,本文提出一种强化学习(RL)驱动快速探索随机树(RRT)的局部路径重规划方法(RL-RRT).该方法利用Sarsa(λ)优化RRT的随机树扩展过程,既保持未知环境中RRT的随机探索性,又利用Sarsa(λ)缩减无效区域的探索代价.具体来说,在满足移动机器人运动学模型约束的同时,通过设定扩展节点的回报函数、目标距离函数和平滑度目标函数,缩减无效节点,加速探索过程,从而达到路径规划多目标决策优化的目标.仿真实验中,将本方法用于多
其他文献
水资源的合理开发和利用问题一直备受关注,水环境监测是保证水资源质量的基础和重要途径。水资源监测的质量保证和质量控制为其技术重点,其为合理开发利用水资源提供监测数据和系统资料。本文就当前水环境监测质量的现状进行了分析,并结合笔者工作经验,对水环境监测的质量控制相关措施进行阐述。
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
鞍钢新轧钢股份有限公司厚板厂近期生产的Q235A钢,在冷弯成形时,几次发生冷弯断裂,通过对断裂试样进行分析及查阅有关的原始生产数据,认为钢板的终轧温度,冷却速度是影响Q235A钢的冷弯性能的
从信息视角出发,以北京大兴国际机场项目为例,分析大型民用机场工程进度控制的信息流程。阐述进度控制信息流程的基本要素、信息流程所涉及的进度信息和主客体,并将信息流程
以SPOT5高分辨率遥感影像为例,充分利用SPOT5辅助数据文件(Metadata.dim)中的位置和姿态数据,采用精确拟合推算出影像外方位元素的初值,通过一定的地面控制点,以经典的多中心投影共线方程作为条件,建立条件方程式,进行条件平差,解算出一个修正的矩阵,该矩阵包含了相机与卫星平台之间的夹角,以及轨道等多种因素所引起的误差,然后利用建立的模型进行定位。与SPOT5无控制定位相比,该方法对定位
本文结合潜山县2017年潜山县越冬代马尾松毛虫飞防,进行了AS350B3(小松鼠)飞机施药试验,试验结果表明:采用25%灭幼脲30ml+5.7%甲维盐10ml,喷量为4500ml/hm~2,防治效果最好。
城市地图制图与调绘相配合关系到精准制图新工艺的创新、发展,对地图编制、地图使用起到促进作用。细化调绘方向,将制图工作与调绘工作有机结合,从而提高地图的精准度,成为制图工艺发展的新方向。
以"四位一体"生态模式为载体,种植无公害蔬菜瓜果,利用测土配方成果、施肥技术,利用生物、物理方式、新型高效低毒农药防治蔬菜瓜果病虫害技术,生产无公害蔬菜瓜果,节约能源
马铃薯是世界上栽培比较广泛的作物,是世界上仅次于小麦、水稻和玉米的第四大主要农作物。我国马铃薯的种植面积和产量均居世界第一位,但生产上用的品种、技术水平和单产却较低
<正>何晶,女,蒙古族,辽宁省东港市人。1975年2月参加工作,1981年11月毕业于沈阳农学院后分配到丹东市农业科学研究所工作。1992年6月加入中国共产党,现任丹东农业科学院玉米