【摘 要】
:
针对分布式环境下多智能体系统的交互模型存在效率低、局部冲突消解困难、缺少实际应用场景等问题,基于Stac-kelberg博弈设计了多主多从的交互模型,并将其应用于指挥控制流程中指控方与参与方之间的交互博弈问题。首先通过对Stackelberg博弈模型的优化与多属性决策,设计出多主多从Stackelberg博弈的多智能体系统,并利用半正定的二次型性能指标的最优化正则性,引入一个正则Riccati方程来对Stackelberg博弈下的闭环解问题进行求解;然后基于图论相关知识建立基于边拉普拉斯矩阵的多智能体系统
【机 构】
:
空军工程大学研究生学院,空军工程大学防空反导学院
【基金项目】
:
国家自然科学基金青年科学基金(61703412),中国博士后科学基金(2016M602996),国家自然科学基金(61503407,61806219,61703426,61876189)。
论文部分内容阅读
针对分布式环境下多智能体系统的交互模型存在效率低、局部冲突消解困难、缺少实际应用场景等问题,基于Stac-kelberg博弈设计了多主多从的交互模型,并将其应用于指挥控制流程中指控方与参与方之间的交互博弈问题。首先通过对Stackelberg博弈模型的优化与多属性决策,设计出多主多从Stackelberg博弈的多智能体系统,并利用半正定的二次型性能指标的最优化正则性,引入一个正则Riccati方程来对Stackelberg博弈下的闭环解问题进行求解;然后基于图论相关知识建立基于边拉普拉斯矩阵的多智能体系统
其他文献
基于深度神经网络的SAR图像变化检测算法由于精确率高等优点,已被广泛应用在农业检测、城市规划以及森林预警等多个领域。设计了基于胶囊网络的SAR图像变化检测算法,针对其模型复杂度高、参数量大等问题,提出了基于权重剪枝的模型压缩方法。该方法对其胶囊网络参数进行逐层分析,针对不同类型的层采取不同的剪枝策略,对网络中冗余的参数进行剪枝,随后对剪枝后的网络进行微调,从而提高了剪枝后模型的检测性能。最后,通过对模型中保留下来的参数进行压缩存储,显著降低了模型所占用的存储空间。在4组真实SAR图像上的实验结果证明了所提
对话模型是自然语言处理的重要方向之一。现如今的对话模型主要分为基于检索的方式和基于生成的方式。然而,检索方式无法回应语料库中未出现的问句,而生成方式容易出现安全回复的问题。鉴于此,提出融合检索与生成的复合对话模型,通过将检索方式与生成方式相结合来弥补各自的缺点。首先通过检索模块得到K个检索上下文以及所对应的K个检索候选回应。在多回应生成模块中进一步结合检索上下文得到若干生成候选回应。最后的候选回应排序模块分为预筛选与后排序两个步骤。预筛选部分通过计算输入问题与候选回应的相似度得到最优检索回应与最优生成回应
随着工业化的飞速发展,制造业作为推动工业化的主力军必须加快发展步伐,因此,一种新的面向服务的制造模式——云制造被提出。云制造旨在在分布式制造资源和能力之间进行共享和协作并与需求构成一种按需的资源分配和使用方式,在选取最优性能服务的同时将这些服务组合成一个满足用户需求的复合服务需要不断进行探索。云制造服务组合是一种典型的NP-hard问题,是云制造最具有挑战性的课题之一。现阶段的云制造服务组合方法存在时间复杂度高、组合效果差、组合路径只能达到次优解等问题。如何利用微粒度的服务组合成复合服务以提升制造能力并满
在机器学习的分类问题研究中,对分类学习算法的正确评价是非常重要的。现实中,许多性能度量指标被从不同的角度提出,文中主要介绍了基于错误率的、基于混淆矩阵的和基于统计显著性检验的三大类性能度量指标,详细地讨论了分类学习算法各性能度量指标的提出背景、意义以及适用范围,分析了各种性能度量之间的差异,提出和分析了各方法中有待进一步研究的问题和方向。进一步,通过实验数据横向(每类度量中各方法之间的类内差异)和纵向(3类度量之间的类间差异)对照了各性能度量指标之间的差异,分析了各性能度量指标在分类算法选择上的一致性。
深度学习在各个领域得到了普遍的应用,但是用户在应用深度学习时仍然面临两方面的问题:(1)深度学习有着复杂的理论背景,非专业用户缺乏建模以及调优的背景知识,难以构建性能优化的模型;(2)数据预处理、模型训练、预测等过程往往涉及比较复杂的编程实现,给没有程序设计基础的非专业用户在入门时带来了一定的困难。针对以上两点易用性问题,文中提出了一种易用的深度学习模型可视化构建系统DragDL,其目的在于降低用户进行数据预处理、模型训练、监控、在线预测等工作的难度。该系统基于PaddlePaddle框架,支持以拖拽图形
近年来,社交网络上虚假信息传播愈演愈烈,在政治、经济、心理学等方面造成了严重的社会影响。有效检测社交网络中的虚假信息并对其实施控制,是改善社交网络生态系统质量的重要手段,能为人们营造一个安全、可信的网络环境。文中首先通过调研近年来国内外社交网络虚假信息领域的代表性研究,针对虚假信息中的假新闻和谣言,梳理并给出其定义、特征及传播模型,然后介绍了目前虚假信息检测及传播控制的各种手段及方法,最后总结并分析了目前的检测及控制方法中仍存在的问题,继而进一步探讨和提出了该领域未来的研究方向。
随着物联网的普及,对物联网终端设备可使用能量的要求也在提高。能量收集技术拥有广阔前景,其能通过产生可再生能量来解决设备能量短缺问题。考虑到未知环境中可再生能量的不确定性,物联网终端设备需要合理有效的能量分配策略来保证系统持续稳定工作。文中提出了一种基于DQN的深度强化学习能量分配策略,该策略通过DQN算法直接与未知环境交互来逼近目标最优能量分配策略,而不依赖于环境的先验知识。在此基础上,还基于强化学习的特点和系统的非时变系统特征,提出了一种预训练算法来优化该策略的初始化状态和学习速率。在不同的信道数据条件
无线传播模型由于其对无线电波路径损耗的精准预测及对通信速率与覆盖范围等指标的估算起重要支撑作用,被广泛应用于民用和军用的通信系统设计。近年来,随着人工智能技术的发展,无线传播模型的发展方向也由传统的经验模型向基于数据驱动的智能无线传播模型发展,该类方法可有效地扩展无线传播模型的适用范围并减小预测误差。然而,由于在不同环境下智能无线传播模型的适用特征可能并不相同,如何针对不同场景最优地为智能无线传播模型设计以及选择输入特征是一个重要的研究问题。立足以上需求,提出了一种自适应智能无线传播模型。首先,该模型借鉴
深度学习在图像识别和声音处理方面已经展现了它优越的性能和广阔的发展前景,对于在禁飞区设立的无人机侦测系统,使用深度学习的方法判断无人机的声音信号具有一定的意义。为了获得更优的侦测效果,首先列举了目前具有代表性的特征提取和分类方法,并分析其优缺点;然后提出了一种扩大可用样本数量的数据处理方式,同时在实验中使用不同组合的深度学习网络训练样本;最后通过混淆矩阵法,针对不同信噪比模型、滤波下限、拟合程度、
在构造煤厚度的预测中,经常出现因各种限制性因素而导致预测精度不高的问题,因此提出了利用自适应遗传算法优化密度聚类(DBSCAN)优化RBF神经网络参数的方法对构造煤厚度进行预测。首先,对采区三维地震属性数据进行预处理,采用主成分分析算法(PCA)对该数据降维并消除变量之间的线性相关性。然后,构建预测构造煤厚度的RBF神经网络模型,并利用DBSCAN获取最佳核心点数据,通过计算得到k-means聚类的初始聚类中心,以此优化k-means算法,进而得到RBF神经网络隐含层基函数最优的中心向量,提高该模型预测的