基于强化学习多无人机路径规划算法研究及实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ares_ding
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无人机技术已经成为各国战略目标中的重中之重,由于其小型,便捷,低成本广泛地受到商业推广,在军事领域和民用领域应用及其广泛。无人机技术也正从单无人机向多无人机协同工作方向过渡,因此研究多无人机的协同控制也显得尤为重要。目前针对于无人机的任务规划研究多集中在传统的A*算法,人工势场法,D*算法以及一些早期开始流行的智能算法,如蚁群算法,粒子群算法,遗传算法等。针对于单无人机问题,这些算法的运行时间可以接受。然而这些在多无人机协同工作的场景下,以上算法的运行时间会指数倍增加,在紧急情况很难满足时间上的要求。而针对这些不足,本文针对于不同的业务场景设计了基于强化学习的多无人机路径规划算法,并进行系统实现。本文首先介绍了聚类相关基础知识,分析了无人机部署问题上各种方法的优劣,结合DBSCAN算法和k-means算法基于人口密度提出了一种无人机部署方法。其次阐述了强化学习的一些基本知识,再此基础上设计了单无人机单目标的路径规划算法,并且采用提前初始化Q值表和压缩状态空间两种方式对其进行优化使得运行效率显著调高。针对于单无人机执行多目标的情况设计了相关路径规划算法,分析了这种场景的缺点和不足。基于MADDPG算法,设计了多无人机多目标的路径规划算法,通过对奖励函数的设计使得无人机可以在不发生碰撞的前提下以最短距离到达目的地。仿真实验结果表明,该算法适合于不同环境下运行,不需要重复进行训练,相对于传统算法在执行效率上具有显著提升。最后在上述算法的基础上,结合nginx,java,mysql等技术设计网站,实现聚类算法和多无人机路径规划算法的线上执行。
其他文献
目的:了解肠造口患者的病耻感水平,并探索叙事护理对肠造口患者病耻感水平、造口适应管理能力及造口患者生活质量的干预效果,为叙事护理在临床护理工作中的深入推广提供客观
本文将三位演奏家巴克豪斯(Wilhelm Backhaus)、威廉·肯普夫(Wihelm Kempff)、佩拉西亚(Murray Perahia)的演绎版本进行分析比较,通过聆听,对比出不同演奏家在演奏同一首作品的不同之处,从而获得对作品更深层次的理解,在演奏该作品上给予更多的理论支撑,加入自己对作品的理解,更好的演奏出属于自己味道的作品。
随着社会经济的高速发展,人们生活质量的提高以及全民健身计划的推进,人们追求健康的观念逐渐增强。近几年马拉松赛事日益火爆,受到广大健身群众的青睐,而越野跑作为一项与马拉松运动相关、主要依托各地区户外自然环境资源优势的新兴户外运动,参与的人群、赛事的举办数量等每年都在不断的增加。伴随早期路跑人群和徒步人群的运动升级,越野跑是继马拉松之后迅速兴起的一项大众时尚体育运动,即将成为未来户外运动的爆发点,正向
二十一世纪以来,互联网几乎覆盖了人类的各个生活领域,各行各业都趋向于电子化,随之而来也就产生了大量的电子数据,随着近年的大数据新起,人们也逐渐认识到了数据的重要性,而
民事执行和解制度是民事执行案件中的一个创新设计。它在解决“执行难”、解决当事双方的矛盾方面发挥了重要作用,因此该制度越完美就越有利于推进这些工作。民事执行和解协议作为双方在执行阶段达成和解的证据、履行的依据,自身若是出现瑕疵,肯定会影响双方和解的效果,不能缓解“执行难”问题。此外,双方当事人作为和解主体,如果当事人自身出现问题,或者和解过程“变质”,都无法保证案件顺利结束,影响当事人的权益。因此,
在人类生产生活中,表面润湿性(浸润性)具有重要意义。当液体在表面的接触角接近0°(超亲液)或者大于150°(超疏液)时,这种表面被称为超浸润表面。其中,具有液体排斥功能的超
近年来,由于科技进步的发展,各类机器人开始进入各个领域帮助完成各类任务,比如危险环境下的各种勘测机器人,工业环境下的码垛机器人等。机器人事业的蓬勃发展改善了人们的生
通过建立辽宁省高校科技创新指标体系与高新技术产业创新指标体系,采用耦合协调和协同模型对辽宁省高校科技创新系统与高新技术产业创新系统2005-2014年共同协同创新关系进行
学校体育的最根本目的是增强学生体质,保证学生有相应时间锻炼身体。然而现在,青少年学生的身体素质在不断下降,这也体现出了学校课外体育活动被忽视的严重问题。通过文献资
该文详细阐述了气动系统及PLC在散装粒子自动称量包装装置中的应用。文中对称量包装装置中气动系统、PLC控制及采用的硬件和软件做了详细介绍