一种基于多Agent强化学习的多星协同任务规划算法

来源 :国防科技大学学报 | 被引量 : 0次 | 上传用户:xiaocai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在分析任务特点和卫星约束的基础上给出了多星协同任务规划问题的数学模型。引入约束惩罚算子和多星联合惩罚算子对卫星Agent原始的效用值增益函数进行改进,在此基础上提出了一种多卫星Agent强化学习算法以求解多星协同任务分配策略,设计了基于黑板结构的多星交互方式以降低学习交互过程中的通信代价。通过仿真实验及分析证明该方法能够有效解决多星协同任务规划问题。
其他文献
随着经济的迅速发展,人类活动对生态环境产生重大影响,环境的日益恶化,使得人们逐渐注重自然环境的保护,注重传统的回归,讲求“道法自然、天人合一”的理念。在现代包装中,传
随着上网用户数量剧增,互联网应用种类的不断增加,大量的数据流量吞噬了网络带宽,导致网络拥堵现象增多、数据传输速度下降。为此,网络缓存技术已经成为众多网络应用研究的热
平等原则是民法中的一项最基本的原则,男女平等是平等原则的一个重要组成部分。平等有形式平等与实质平等之分,现行《婚姻法》没有就男女在婚姻家庭中的权利予以区别性的对待
本研究包括樟子松外生菌根的形态学、组织学特征分析,外生菌根分子鉴定,外生菌根真菌对樟子松苗木生长的影响,樟子松组培苗菌根化等四部分内容,现分述摘要如下:(一)外生菌根形态学、
伴随着城市空间的扩张,城市与乡村之间生成了一个具有“半城半乡”、“亦城亦乡”二元特性的过渡区域——城市边缘区。城市化是边缘区产生的根本原因,而城市扩张则是其出现的
随着电力电子器件、微处理器,特别是高性能可关断器件和数字信号处理芯片的不断发展,现代交流调速系统得到了极大地进步。在传统三相交流电机控制的基础上,逐渐发展起了多相
当今社会越来越多的家长希望自己的孩子可以有一技之长,他们非常重视在儿童阶段的艺术培养,儿童声乐学习是家长们不错的选择,因为声乐学习不需要耗费过多的时间与精力,也不需
目的:观察3,3-亚氨基二丙腈(IDPN)诱导下多发性抽动症(TS)模型小鼠纹状体谷氨酸转运体(EAAT2)表达变化及健脾止动汤的干预作用。方法:40只雄性ICR小鼠随机分为空白对照组、模
介绍了110kV级双绕组有载调压电力变压器高低压绕组在四种不同结构形式下的雷电冲击特性。
本文研究了豆制品企业的废弃物豆渣的综合利用,将豆渣膳食纤维处理后添加到固态、粘稠态、液态三种不同形态的食品中。在应用到固态素肠的研究中,研究了素肠中膳食纤维的适宜添