基于增量式发育深度强化学习的无人机路径规划

来源 :飞行力学 | 被引量 : 0次 | 上传用户:limingxhss2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了克服深度强化学习训练时间长、收敛速度慢的问题,针对密集动态障碍环境下的无人机(UAV)路径规划,引入了增量式发育知识库,对深度确定性策略梯度(Deep deterministic policy gradient, DDPG)算法进行改进。首先,根据模糊匹配的思想建立威胁模式知识库,将飞行过程中遇到的密集动态障碍作为知识进行增量式存储,避免对相似障碍环境的重复训练。其次,在底层DDPG算法规划安全航路的基础上构建避障策略知识库,根据威胁模式直接输出避障策略,缩短训练时间。最后,搭建发育式的威胁-避障映射关系,实现“线上实时避障,线下自主寻优”,不断提升UAV避障性能。对比实验结果表明,所提方法能极大提高DDPG训练效率,满足UAV在密集动态障碍环境中实时避障的需求。
其他文献
目的 分析重庆市肺癌发病死亡和疾病负担归因于被动吸烟的情况,为开展肺癌防治提供建议。方法 肺癌死亡个案数据来源于2019年重庆市肿瘤登记报告系统,被动吸烟率来自2013年重庆市慢性病及危险因素监测。计算人群归因危险度百分比(population attributable risk percent,PAR%)、被动吸烟导致的肺癌发病、死亡和疾病负担。采用Excel 2010与SPSS 25.0进行统
在素质教育背景下,初中体育课程强调学生的团队协作精神。小组合作不仅有利于培养学生的合作意识,提高初中体育的教学质量,还有利于发展学生的体育核心素养。在初中体育教学中,教师应该更新教学观念,坚持学生的主体地位,以小组合作为主要教学模式,实现让学生强身健体的教学目标。文章结合体育学科的特点和教育实践,探究小组合作在初中体育教学中的可实施发展路径。
文章以“细菌和病毒”的教学为例,探讨促进深度学习发生的教学策略:引入情境,促使学生主动学习;优化情境,引导学生进行活动体验;凭借情境,解决核心问题;拓展情境,实现知识迁移应用。上述教学策略在促进学生深度学习发生的同时,很好地培养了学生的生物学学科核心素养。
语文单元教学提倡按照语文课程标准和单元语文要素,以单元为单位重新组织教学内容,使学生能够全面地建立起系统的知识,并形成相应的能力。单元教学是一种综合性的教学形式,也是一种设计和实施教学的理念。与基于“逐个”知识点学习的单篇教学相比较,是更加符合“双减”政策要求的一种教学理念和方式。但是在实践推进中从教学理念到具体实施都存在欠缺的地方。尤其是语文教师缺少系统化设计的专业知识,教学存在经验化、随意化的
当前中小洪水调度对三峡水库淤积的影响尚局限在短期过程,且年内各种调度方式影响叠加,很难单独区分中小洪水调度的影响。为了解长期实行中小洪水调度对三峡库区泥沙淤积的影响,基于一维水沙数学模型,计算分析了有、无中小洪水调度情况下三峡库区泥沙淤积过程、分布特征及防洪库容保留状况。结果表明,长期实施中小洪水调度情况下,三峡水库泥沙淤积增加,影响集中在变动回水区下段及常年回水区,淤积三角洲向坝前推进较无中小洪
近年来,临床研究发现儿童川崎病发病与病原体感染有密切关联。为了给临床提供治疗新思路,本文具体分析病原体感染在儿童川崎病发病中的作用机制,总结儿童川崎病药物治疗进展,旨在为提高临床儿童川崎病治疗效果提供参考。
报纸
针对火箭点火、无线传感等中距离、强电磁干扰环境下的供电问题,设计了一种可见光无线传能系统,利用可见光实现数米距离的无线能量供给。通过光学仿真软件建立了可见光无线传能系统的光学模型,分析了光源轴向离焦量、平凸透镜位移对光能利用率、光斑均匀性、光电转换效率的影响,并确定了系统的实验参数,为实现更大功率、更远距离、更高效率的可见光无线传能和变距离传输自动装置提供了依据。实验测试表明,使用反光和聚光透镜组
<正>一、课程实施背景就业难已成为近年来严重的社会问题,其中有一个不可忽视的原因就是我们在基础教育阶段缺乏对学生的生涯规划引导:学生在高考填志愿之前很少甚至从未思考过自己喜欢的专业领域是什么,自己适合什么,自己想要什么,自己能做什么……也很少了解目前有哪些专业
期刊
<正>学生在高品质课堂上更能实现高品质的学习,而高品质不仅代表学生能学得好、学得多,其基本理念是要坚持突出学生的自主学习,使其能成为学习的主人,与教师、同伴互动,并且能通过交流合作积累成功的学习经验。小组合作学习关注学生的合作行为、突出学生的自主意识,注重师生、生生之间的平等交流与和谐对话。教师通过人文关怀去构建和谐的师生关系,支持学生主动探究、自主探索,是构建高品质课堂、实现减负提质的有效途径。
期刊