基于最小二乘策略迭代的无人机航迹规划方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:lzj60
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统强化学习方法因对状态空间进行离散化而无法保证无人机在复杂应用场景中航迹精度的问题,使用最小二乘策略迭代(least-squares policy iteration, LSPI)算法开展连续状态航迹规划问题研究。该算法采用带参线性函数逼近器近似表示动作值函数,无需进行空间离散化,提高了航迹精度,并基于样本数据离线计算策略,直接对策略进行评价和改进。与Q学习算法的对比仿真实验结果表明LSPI算法规划出的三维航迹更为平滑,有利于飞机实际飞行。
其他文献
介绍了运用神经网络模糊控制技术来实现智能交通灯的经典模糊控制。针对单交叉口信号控制的不足,做出相应的改进,提出了一个简单的相邻路口的协调控制方案,给出了改进的交通模糊
体育设施是进行体育活动的物质保障,通过问卷调查法,对青海高原特色体育设施的建设,少数民族传统体育项目开展的现状以及青海高原地区特色地理环境体育项目的开发状况进行研
2020年9月25日各市、县(区)人民政府,省政府各部门:《江西省政务信息化项目建设管理办法》已经省政府同意,现印发给你们,请结合实际抓好贯彻落实。(此件主动公开)江西省政务
目的探讨腹腔镜下骶前肿瘤切除术的可行性和安全性。方法回顾性分析2006年3月至2015年12月期间于川北医学院附属医院行腹腔镜骶前肿瘤切除术(n=6)或传统开腹骶前肿瘤切除术(n
采用分子动力学方法对氮化铝材料的表面热氧化过程进行了研究,开发了包含Al、N和O三种元素的反应势,探讨了氧化温度和时间对材料结构的影响。发现温度越高氧化反应越容易进行
目的探讨丙泊酚联合氯胺酮对下肢深静脉血栓形成合并肺栓塞小型猪模型麻醉效果及安全性。方法将20只巴马小型猪随机分为观察组和对照组,每组10只,以戊乙奎醚0.02 mg/kg垣氯胺
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
介绍了以微程序控制器(MCU)为核心的一种便携式可通信编程器的基本工作原理及功能,给出了编程器硬件接口电路设计方法及软件流程。基于MODBUS—RTU通信协议设计的手持编程器能用
三、中国罗非鱼出口特征1.我国罗非鱼出口的产品结构分析出口统计数据,活、鲜、冷、腌罗非鱼的出口比例仅仅2%左右,我国主要出口产品是冻全罗非鱼与冻罗非鱼片。早期我国冻全罗非
介绍了矿用隔爆馈电开关内装断路器的主要电气性能指标,分析了馈电开关内装断路器结构及主要电气性能指标之间的内在联系,指出了对应用于馈电开关内的空气式断路器攻关的主要