面向多无人机协同作业的平行学习关键技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:cyydn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,深度强化学习在不同产业应用中取得了很大的成功,特别在游戏领域,通过深度强化学习算法训练的非人类玩家在各方面都有超过人类玩家的表现。在机器人运动控制的深度强化学习研究中,多机器人协同作业的深度强化学习研究是未来发展无人系统的核心内容。但目前多无人系统运动控制的深度强化学习研究面临状态和行为空间维数高、状态信息误差大以及样本量少的问题,为解决这些问题科学家提出了融合先验知识和虚实结合等策略的机器人运动控制深度强化学习框架。其中虚实结合是一种在仿真系统环境下开展机器人的深度强化学习研究,研究结果再迁移应用于实体机器人的研究方法。在当前技术条件下,作为实际系统映射的仿真系统存在模拟匹配度低等问题,这些问题使得在仿真系统下的学习训练结果不能有效迁移到实际系统。平行学习思想的提出为解决上述问题提供了新的解决思路。平行学习思想应用于无人系统的深度强化学习研究,可以进一步扩展无人系统深度强化学习的学习能力和快速收敛能力,然而在实践落地过程中也将面临各种技术难题。本课题基于适合复杂系统的计算理论与方法,结合虚实联动平行学习智能体系开展面向多无人机协同作业的平行学习关键技术研究,来探索解决相关技术难题。本课题研究内容主要包括下列的四个方面:面向多无人机协同作业的平行学习架构设计;针对无人机人工系统,设计实现可扩展的解耦算法与环境的强化学习训练框架(GLUE);基于GLUE探索研究无人机的三维仿真深度强化学习训练实现;最后基于GLUE实现无人机虚实联动实物实验。其中多无人机协同作业的平行学习架构是本文研究的基础框架,本课题研究工作期望为未来多无人机协同作业的平行学习研究提供可参考的解决方案。
其他文献
基于图像的人脸重建有着广泛的应用前景,一直是一个重要且具有挑战的问题。尽管现有的基于多图像的人脸重建方法已经取得了可喜的成果,但由于操作设备价格昂贵和图像捕获困难,使得在实际应用中具有很大的局限性。单图像的获取更容易且不需要昂贵的器材,因此探索基于单个输入图像的人脸重建方法尤为重要,但是单图像中如果存在遮挡情况,则无法捕获到被遮挡区域的语义信息。目前解决这一问题的办法有两大类,一类是基于深度学习的
学位
随着公共数据库中生物序列的大量涌现,出现了很多用于预测基因和蛋白质的功能属性的生物信息学算法。预测基因和蛋白质的功能属性过程中的一个挑战是直观地分析和理解生物序列的统计特征。虽然目前已经出现了一些web服务器和独立程序用于生物序列的特征提取以及特征可视化,但是仍然缺乏一个可以完成多种序列特征可视化的软件工具。因此本文完成了一个生物序列特征可视化系统,这是一个开源的跨平台独立程序,它可以通过特征可视
学位
长非编码RNA(long noncoding RNAs,lnc RNA)在多种生物活动中发挥着重要作用,包括转录、剪接、翻译和细胞凋亡等等。实验表明lnc RNA主要通过与蛋白质的相互作用实现其生物功能,因此研究lnc RNA与蛋白质的相互作用对于探索lnc RNA的作用机制具有重大意义。通过生物实验验证lnc RNA-蛋白质相互作用需要耗费大量的时间和金钱,开发计算模型预测lnc RNA-蛋白质
学位
随着海上交通量的迅猛增长,水域内的交通负担加重,航运事故时有发生,航运相关人员的生命财产安全受到巨大的威胁。为了提升水域交通管理和异常轨迹监管的服务质量,船舶交通服务系统主要采用船舶轨迹预测方案来监测船舶异常行为,维护水域交通安全。船舶的航线预测属于长期预测,而目前大多数轨迹预测模型对于长期轨迹预测的效果并不理想,且不适用没有路网束缚的海上交通情形,因此无法使用传统的轨迹预测模型来实现船舶轨迹的预
学位
随着科技的发展,人们对社会公共安全的关注度逐渐提高,使得世界各地政府和学者在智能安防领域投入大量精力。安防系统无论是在民用还是在军用都有着不可或缺的地位,而安防最重要的手段之一就是视频监控技术。近年来,有很多学者在行人属性识别领域进行研究,也取得了很大的进展,从最初的手工设计特征结合传统机器学习方法到现在的深度学习算法,行人属性识别技术水平也在不断提高。但是目前大多数的研究都是基于单张图片进行的,
学位
2023年2月,“流浪气球”事件在海外社交平台广泛传播,引发双方外交互动及舆论交锋。推特成为双方舆论交锋的主要场合,中美主流媒体均在此发布大量观点性推文。作为政治意味较为浓厚的海外社交媒体,推特具有“西强我弱”与“众说纷纭”两个基本特点。基于对该事件的分析,中国媒体应重视在海外社交媒体发声,澄清事实真相;内容为王图文并茂,打破西方媒体母语优势;正视美国社会问题,避免敌对心态。未来,应从内容扩展和平
期刊
[研究目的]在以俄乌冲突为代表的网络舆论战中,各方力量在舆论场上为战争造势,使得舆论场势力混杂、信息来源复杂、水军搅局、舆论群体极化、情感和情绪色彩浓厚,是一场具有鲜明特色的社交媒体舆论战争。通过情感因素的研究,有助于分析社交媒体时代舆论战的新特征和新趋势。[研究方法]基于情感实践和媒介学的研究成果,结合对俄乌舆论战进行案例分析,研究情感对于社交媒体时代舆论战的影响。[研究结论]研究发现,在社交媒
期刊
统筹发展和安全的基本内涵是实现高质量发展和高水平安全的良性互动,以高质量发展促进国家安全体系和安全能力现代化,以高水平安全防范化解发展中的风险挑战,确保经济社会发展的健康推进。统筹发展和安全作为理论逻辑、历史逻辑与现实逻辑的辩证统一,开拓了马克思主义政治经济学新境界,根植于中国共产党的百年历史经验,是党治国理政的一个重大原则,也是新时代党和国家事业发展的战略部署之一。在以中国式现代化推进中华民族伟
期刊
推荐系统往往面临着数据稀疏和冷启动两个问题。为了缓解数据稀疏性和冷启动问题所带来的不良影响,本论文使用知识图谱来提供辅助信息,帮助推荐系统在数据稀疏和冷启动的情况下也能得到良好的推荐效果。知识图谱中的信息以图网络结构的方式相互联系,使用起来比较困难,为了更好地使用知识图谱中的有用信息,本论文尝试寻找有效的手段去充分利用知识图谱,从而辅助推荐系统更好地运行。总的来说,本论文的工作主要包括以下三方面内
学位
近年来,基于声学信号的自动语音识别技术的识别效果已经有了很大提升,但是在一些复杂的实际应用场景中,其性能会有大幅下降,或根本无法使用,如在养老助残、高噪声、隐私保护、外太空等场景中。而本文所研究基于非声学信号的无声语音识别(Silent Speech Recognition,SSR)则没有相关限制,在众多领域都能有广泛的应用前景。本论文围绕基于面部表面肌电信号和唇部运动图像的无声语音识别方法及其融
学位