求解分布式约束优化问题的推理算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户：tudouaimangguo

【摘要】

：

分布式约束优化问题(DCOP)是多智能体系统(MAS)的基本框架,是对分布式问题解决、多智能体协作的重要建模方式,现已成功应用于任务调度、电力系统等领域。非对称分布式约束优

【作者】

：

邓衍晨

【出处】

：

重庆大学

【发表日期】

：

2004年期

【关键词】

：

分布式约束优化问题非对称约束优化问题推理算法最大和值传播伪树完备搜索算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

分布式约束优化问题(DCOP)是多智能体系统(MAS)的基本框架,是对分布式问题解决、多智能体协作的重要建模方式,现已成功应用于任务调度、电力系统等领域。非对称分布式约束优化问题(ADCOP)在DCOP的基础上增加了Agent的私有偏好,具有更强的建模的能力和更大的应用前景。以最大和算法(Max-sum)为代表的推理算法作为求解DCOP/ADCOP的重要手段,广泛地应用于各种实际场景中。然而,现有的非完备推理算法普遍存在着难以收敛、解的质量较差的问题。此外,由于ADCOP对隐私性的要求,传统用于求解DCOP的完备推理算法无法直接用于ADCOP,而现有的求解ADCOP的完备搜索算法普遍存在着求解问题规模较小、隐私性较差等问题。针对以上问题,本文拟从求解DCOP的非完备推理算法和求解ADCOP的完备算法开展研究。具体研究内容如下:(1)深入分析了值传播机制Max-sum类算法的影响。本文从理论上证明了虽然值传播可以极大地提高算法的性能,但是其同时阻碍了Max-sum类算法的信念传播。特别地,本文证明了当在换向有向无环图上连续执行值传播机制时,智能体将完全无法利用全局累加的信念,因此算法将等价于一个顺序的贪心局部搜索算法。由此,提出了在值传播机制下如何有效地平衡探索与利用这一重要的科学问题。(2)为了解决上述问题,本文提出了一系列基于非连续值传播的Max-sum类算法,包括基于单向值传播的Max-sum_AD算法(Max-sum_ADSSVP),基于混合信念/值传播的Max-sum算法(Max-sum_HBVP)和基于概率值传播的Max-sum_AD算法。这些算法通过打破在有向无环图上反复执行值传播这一桎梏,使得智能体在作出决策时可以同时兼顾个体利益和全体利益。本文还从理论上说明了上述算法不会等价于贪心的局部搜索算法,并分析了其时空复杂度。实验结果表明,上述算法显著优于传统的非完备推理算法,且对值传播机制开始启用的时机不敏感。(3)充分考虑了ADCOP的特点,针对ADCOP对隐私性的要求,创新性地提出了一种基于搜索-推理混合的完备算法PT-ISBB。该算法利用完备推理算法速度较快这一优势,预先求解一面的约束,并将推理结果存储;在搜索阶段,利用伪树中不同分支间相互独立这一事实,不断将问题划分为更小的子问题。在每一个节点上,都使用子树的推理结果作为取值的下界,以实现高效率的剪枝。本文同时在理论上证明了其完备性,并分析了其复杂度。实验结果表明,PT-ISBB在多个测试问题上均优于传统的搜索算法。

其他文献

基于变换域的双水印算法的研究

由于因特网和多媒体信息的快速发展,使得各种数字化的产品能够在网络上更加便捷、高效的传播。与此同时,数字媒体的安全问题也随之而生,数字产品的盗版侵权、恶意篡改等问题

学位

双水印Contourlet变换Hessenberg分解压缩感知

梯度式液液相分离器的设计与模拟优化

重力分离法经过几十年的不断完善,以其无可比拟的优点在国内外被广泛应用,而重力分离与聚结技术相结合后,很大程度地提高了除油效率,成为当今油水分离领域的研究热点。以计算

学位

油水分离斜板数值模拟稳流构件聚结构件

三类随机生态系统解的定性分析

传染病动力学旨在通过观察疾病发生发展现象,借用数学模型展现疾病发生发展及传播特点,预测疾病的发展趋势,防止疾病的进一步蔓延威胁到人类的生存.种群动力学通过发现种群内

学位

随机扰动It(?)公式Lyapunov函数传染病模型稳定性

轻资产商业模式下服装企业财务绩效分析研究

近年来,随着国民生活水平的提高,人们对于服装的需求和消费能力有显著增长。然而随着市场开放,外来资本和品牌大量涌入国内并迅速占领市场,竞争压力不断加剧,企业之间的竞争,更多的是商业模式。重心的转变与竞争加剧的交织,我国的服装类企业想要长期持续、稳定地发展下去,必须打破传统,开辟出更能发挥企业竞争优势的商业模式。海澜之家的成功例子就是运用了轻资产商业模式。因此,选取海澜之家作为案例,研究其在这种商业模

学位

煤矿瓦斯爆炸的致因分析及参数测试

瓦斯爆炸事故是煤矿井下发生的主要灾害之一,其破坏程度巨大,社会影响恶劣。为确定煤矿瓦斯爆炸事故的致因因素,在瓦斯爆炸反应机理的研究基础上,依据三类危险源理论对煤矿瓦

学位

瓦斯爆炸事故树瓦斯浓度冲击波冲量安全管理

基于和声搜索和折射原理的花朵授粉算法研究

花朵授粉算法是模拟开花植物进程的启发式算法,该算法将植物的异花授粉过程和自花授粉过程类比为全局搜索和局部搜索,由于该算法具有实现简单、鲁棒性强及寻优速度较快等优点

学位

花朵授粉算法折射原理和声搜索算法差分进化算法

周期性纳米光栅波导结构传感特性研究

光传感技术作为光学信息科学技术的一个重要研究方向,凭借着灵敏度高、检测迅速和可靠性高等优势,在工业生产、生命科学、环境监测等领域有着十分重要的应用。光波导传感器具

学位

传感器光栅平板波导表面等离子体波导共振模式

基于蚁群优化思想的分布式约束优化问题求解算法研究

分布式约束优化问题(DCOP)和非对称分布式约束优化问题(ADCOP)是解决分布式人工智能领域中多智能体系统(MAS)协同优化问题的重要方法,具有研究意义和实用价值。目前,DCOP求解

学位

多Agent系统分布式约束优化问题非对称分布式约束优化问题蚁群优化算法

基于成分优化的Al-Si-Cu-Mg合金的强韧化研究

进入21世纪以来,我国航空航天事业经历了高速发展历程,铸造铝合金由于其良好的机械性能而在航空航天领域得到了广泛的应用。近年来航空航天领域对材料的要求已由轻量化向强韧

学位

铸造Al-Si-Cu-Mg合金成分优化复合变质稀土Y

利用铝厂污泥合成刚玉/莫来石/堇青石复相材料

本研究以煅烧铝型材厂污泥、高岭土和滑石粉为主要原料,制备刚玉/莫来石/堇青石复相材料,属于固体废弃物的综合利用,在环保与经济上有重要意义。主要探讨不同配方,不同烧结工

学位

铝型材厂污泥堇青石莫来石固溶体刚玉复相材料

求解分布式约束优化问题的推理算法研究

与本文相关的学术论文