基于stackelberg均衡的运动目标多无人机协同搜索方法研究

来源 :兰州交通大学 | 被引量 : 0次 | 上传用户:ccyyttaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着无人机(Unmanned Aerial Vehicle,UAV)技术的发展和成熟,近年来被越来越多地应用到目标搜索任务中,如失联客机搜救、军事目标探测等工作。对于人力搜索比较困难的任务,无人机具有更高的适应性,可以覆盖更广的领域。同时可以降低搜索成本,提高搜索效率。在民用搜索和军事搜索中将扮演越来越重要的角色。由于搜索任务中的移动目标往往具有一定的逃脱能力,因此UAV不能采用简单的覆盖搜索,需要充分考虑到目标的行动路径从而做出自身的路径决策。本文针对无人机在战场环境下对敌方移动目标的搜索任务,建立双方的博弈关系模型,并得到相对应的多UAV协同搜索路径规划策略。本文主要做了以下工作:首先,根据本文考虑的搜索场景,设定双方都具有远距离探测能力的关系模型,建立搜索环境模型、无人机模型、地图信息模型、通讯模型等基础模型,为后文的研究打下基础。其次,在综合考虑无人机、移动目标在搜索博弈过程中的路径选择因素(如:环境搜索收益、目标发现收益等)后,建立了各自的路径选择收益函数,作为双方选择每一步路径的效用函数。由于Nash均衡策略要求博弈双方同时做出决策的要求不适用于本文的博弈关系,而stackelberg均衡策略的领导者-跟随者模型则刚好适用,无人机和移动目标分别扮演领导者、跟随者。stackelberg均衡策略可以找到一个双方收益都达到相对最大值的行为组合,从而得到无人机的最优搜索路径。将路径选择收益函数与stackelberg均衡理论结合后,得出多UAV单步博弈搜索路径策略。考虑到单步博弈策略可能陷入局部最优的缺点,引入多步预测控制的理念,得到多UAV多步博弈搜索路径策略,实现了无人机的滚动路径规划。然后考虑到前文所用两种策略都是通过加权优化的方法,通过赋予其不同的权值来代表其重要性。但是这种方法由于权值固定,对于不断变化的战场环境无法动态的适应。因此,提出分层模糊优化的方法,将目标划分为一系列子优化问题,逐层求解。最后,确定搜索策略的性能判定方法,设定系统仿真参数后,通过设计不同的实验对本文所提策略进行比较分析。仿真验证与分析表明了所提方法的有效性。
其他文献
  小学阶段不仅是义务教育、基础教育的起始阶段,也是个体进入正规学校教育的起步期,对个体一生发展都起着重要的奠基作用。小学教师的专业化水平对教学效率、教学质量都起着
传统的制备醋酸甲酯工艺由于其高能耗,强腐蚀性正在逐渐被淘汰,取而代之的是以固体酸为催化剂的反应精馏工艺。但该工艺中醋酸的萃取效果有限,用反应精馏法制备高纯度醋酸甲酯工艺仍需改进。开发了一条反应精馏与吸附耦合合成醋酸甲酯新工艺,反应精馏塔内采用立式传质塔板,催化剂置于反应段的各级塔板上,吸附操作采用4A分子筛吸附脱水法,制备高纯度醋酸甲酯。通过液液平衡实验,反应精馏实验和吸附实验及Aspen Plu
锂离子电池(LIBs)因其具有可逆容量大、电压高、循环寿命长和能量密度较高等优点,广泛应用于智能手表、手机、笔记本电脑、数码相机等日常电子设备中,且随着电动汽车和大容量储
温度参数在环境应力描述中比较常用,其可作为物体分子运动平均动能的标志,温度间接测量原理依赖待测对象随温度变化的某些特性。区别于传统PN结测温半导体传感技术,新兴的基于混沌机制的测温问题,已经引起国内外专家学者的关注,本工作重点是研究混沌电路的温度特性,期望能将其应用于人体温度监测。为此,在认真调研文献的基础上,基于忆阻器构建新混沌电路。首先,仿真实验揭示其非线性机制是存在忆阻器。接着,通过改变混沌
近年来,面对日趋复杂的世界经济以及全球化的扩张等因素的影响,寿险公司要想能够扎根于市场,构建有效的财务危机预警系统是非常重要的。当代大多数寿险公司财务风险预警利用的主要方法还处于使用准确率较低的预警技术手段进行预警,集中体现在追求高收益的片面性、信用风险、弱风险防控意识等风险。因此,本文对人寿保险公司的财务风险预警模型进行研究。本文将PLS-Logit方法和Lasso方法引入到寿险公司财务风险预警
中国(云南)自由贸易试验区的成立,为云南沿边开放带来了重大发展机遇。本文通过分析自贸试验区建设对云南沿边地区开发开放的现实价值,系统总结云南沿边地区开放现状与存在的
伽玛射线暴(gamma-ray burst;以下简称伽玛暴)是宇宙中恒星尺度最剧烈的爆发现象,短时间内产生强烈的伽玛射线辐射。伽玛暴在银河系坐标平面上是各向同性分布,但是在径向方向是非均匀分布。伽玛暴的脉冲持续时间从几毫秒到几千秒,长暴的持续时间大于2秒,短暴的持续时间小于2秒。短暴的典型持续时间是0.3秒,长暴的典型持续时间是30秒。伽玛暴的脉冲轮廓具有不对称性,上升时标小于下降时标。伽玛暴的能
核吸积模型是行星形成理论的主流机制。行星临界核质量是核吸积模型形成气态巨行星过程中,启动气体失控式吸积所需达到的原行星核质量。核质量小于临界质量时大气可以视为满足流体静力学平衡,一旦超过临界质量大气进行动力学演化,将不存在平衡解。我们采用静态模型来计算行星结构,行星核质量最大的流体静力学平衡解,即对应临界质量。在行星大气结构的标准计算中,对流通常被视为非常高效,对流区是完全绝热的。但是实际情况并不
要学好外语,词汇是关键。窄式阅读作为一种有效的学习策略与词汇习得的媒介,通过让学生大量阅读同一主题的文章,扩充并加深学习者对主题背景信息了解,使学生在无意识中习得目标词汇,降低学习者的阅读难度,从而降低学生学习词汇的焦虑,提高其自信心。本研究基于克拉申的可理解性输入假说,情感过滤假说,图式理论开展了一项行动研究。其研究问题如下:(1)窄式阅读训练是否有助于高中生掌握英语目标词汇的接受性知识和产出性
香菇(Lentinus edodes)含有丰富的营养物质,如多糖、蛋白质和氨基酸等。香菇足柄一般占总重的20%-30%,但由于其纤维化程度较高、适口性较差,因此在商业化生产过程中通常采用丢弃的处理方式。酒精性肝病(ALD)是指长期过量饮酒导致的肝脏疾病。在我国,ALD发病率呈现逐渐上升的态势,在某些地区甚至已经成为导致肝损害的第二大病因。目前国内外对香菇的研究仅限于对其中的多糖进行提取及活性研究、