【摘 要】
:
本文探讨meta博弈以及meta平衡在MARL中的应用,通过对比meta平衡与Nash平衡在MARL中的特性和作用,提出一种基于meta平衡理论的两agentMARL算法metaQ,并通过试验验证metaQ算法性能优于NashQ算法.
【机 构】
:
南京大学,计算机软件新技术国家重点实验室,南京,210093
论文部分内容阅读
本文探讨meta博弈以及meta平衡在MARL中的应用,通过对比meta平衡与Nash平衡在MARL中的特性和作用,提出一种基于meta平衡理论的两agentMARL算法metaQ,并通过试验验证metaQ算法性能优于NashQ算法.
其他文献
本文还采用有限元与波模式展开相结合的方法研究了碳纤维增强复合材料(CFRP)板中层裂与Lamb波的相互作用.结果给出了CFRP复合板的铺层、层裂的长度、位置对入射Lamb波的模式转换的影响,为利用Lamb波技术对压电智能CFRP复合板进行健康诊断进行了有益的探索.
本文采用等效荷载法分析40m箱梁预制的温度应力对裂纹及产生进行分析,同时有针对性地采取施工技术措施,彻底解决了此难题.
本文通过30米预应力混凝土实箱梁承载力试验及梁体外表所产生的现象分析,为广大桥梁工作者提供实梁破坏的直观印象,使其了解梁体从开始工作到完全破坏要经过哪几个阶段、每个阶段工作载荷的大小、所表现出的力学性能、梁体外表产生什么样的现象、最终能承受多大的荷载等.
本文针对某大型龙门吊行车梁的破坏特征,对行车梁系统进行了分析验算,并根据有关试验研究结果论证了行车梁的破坏机理.
本文主要介绍在高强C60砼的配比设计及施工中,合理选用JM-100型(缓凝、泵送)砼高效增强剂、I级粉煤灰及粗细骨料的成功作法.
本文利用工业废料-煤矸石作骨料,采用均匀设计方法设计压型钢板-煤矸石砼组合楼板的试验方案,并进行试验测试;对弯矩-挠度曲线、弯矩-滑移曲线等进行了深入的分析;总结了压型钢板-煤矸石砼组合楼板的受力过程.
现场预制的混凝土梁体有时会在养生阶段出现竖向裂纹,此类裂纹会影响工程结构的正常使用性与耐久性,工程补救往往费工费时.本文结合某工程实例,分析了裂纹产生的原因,给出了工程预防建议.
为了避免TiAl合金中合金元素的偏析,控制氧含量,通过试制两个TiAl铸锭,对比探讨了不同中间合金加入方式,不同工艺路线对TiAl合金成分均匀性的影响,同时通过选择合理的工艺参数及控制氧含量生产出满足试制要求,满足后续加工对塑性要求的铸锭,提出了生产TiAl基合金的理想工艺方法.
TiNi相是脆硬的金属间化合物,在Ti-31合金焊缝金属中析出TiNi相,将明显地降低其冲击韧性.TiNi相的自然腐蚀电位要负于Ti-31合金及其焊缝金属,在电化学上TiNi相属阳极相,故在Ti-31合金焊接接头中TiNi相将成为牺牲阳极.
简单介绍一种疲劳短裂纹扩展跨越晶界的晶体学模型和利用EBSD技术判定活动滑移系的简便方法.作为实际应用的示例,利用EBSD技术应用晶体学模型研究了一种亚稳β钛合金——TIMETAL LCB中疲劳短裂纹穿晶扩展的晶体学特征.实现了穿晶裂纹活动滑移系的判定.结果表明:除在试样表面晶粒两侧的裂纹走向偏折因素外,裂纹面(活动滑移面)间角是更重要的控制短裂纹穿晶扩展的晶体学因素.