基于交互式动态影响图的通信模型研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户：yuwumalan

【摘要】

：

多Agent动态决策问题是人工智能领域研究的重点也是难点，在工业、交通和军事等领域有着广泛的应用前景。但是由于环境的不确定性、动态性和其他Agent行为的不确定性，使得求解多

【作者】

：

周玲

【机构】

：

厦门大学

【出处】

：

厦门大学

【发表日期】

：

2013年期

【关键词】

：

通信模型交互式动态多Agent动态决策人工智能

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

多Agent动态决策问题是人工智能领域研究的重点也是难点，在工业、交通和军事等领域有着广泛的应用前景。但是由于环境的不确定性、动态性和其他Agent行为的不确定性，使得求解多Agent决策问题面临巨大的状态空间和复杂的计算。交互式动态影响图(I-DID)模型凭借其高效的图形表达结构能更直观地描述决策问题，并且通过对其他Agent进行显式的建模来提高决策的质量，IDID成为解决多Agent决策问题的重要工具。　　通信是Agent之间一种最基本和最重要的交互活动。Agent之间可以通过通信实现信息的共享以减少对环境和其他Agent的不确定性。但是I-DID模型不具有建模通信的能力，降低了其描述问题的能力和限制了其应用领域。本文在I-DID模型的基础上，建立了单阶段通信模型和两阶段通信模型，主要工作有:　　(1)介绍了交互式动态影响图及其数学模型的基本知识。　　(2)建立了单阶段通信模型。在I-POMDP模型和I-DID模型的基础上，将通信动作加入Agent的动作集中，建立了单阶段通信模型的数学表达形式和图形表达形式，扩展了传统的观察函数。同时推导了其信度更新公式，并且分析了通信动作的选择与通信代价之间的关系。　　(3)建立了两阶段通信模型。将每一个时间片分为通信子阶段和动作子阶段，建立了两阶段通信模型的数学表达形式和图形表达形式，同时推导了两次信度更新过程的更新公式，并且分析了通信的代价对是否选择通信动作的影响。　　(4)将通信模型应用于实际的例子，并进行仿真求解。根据求解的结果，探讨了通信的代价与通信信息的价值之间的权衡问题，同时分析了通信在减少其他Agent模型个数和提高决策效率方面的作用，验证了模型的合理性和正确性。

其他文献

控制和时间离散下的VSC的抖振问题的研究

滑模变结构控制理论如今已成为现代控制理论中的重要分支体系之一。由于它具有其他控制所不具有的鲁棒性，即对系统自身参数的摄动以及外部的扰动等的适应性，所以，广泛的受到学者

学位

滑模变结构控制抖振控制离散时间离散仿真

低码率视频图像高效编码算法研究

随着3G网络和计算机技术的发展，无线通信技术的发展进入了空前活跃的历史时期，视频作为重要的信息载体，在无线通信中占据着越来越重要的作用。无线通信技术具有架设灵活方便、适

学位

图像压缩低比特率编码图像插值降采样小波变换振铃效应

续流问题在SR电机互感间接位置检测中的影响研究

SR电机具有结构坚固、加工工艺简单、运行可靠、维护量小、控制方式简单等优点，可用于高温、甚至强振动等恶劣环境中。功率变换器不会出现普通逆变电路中上、下桥臂直通的现象，这进一步提高了SR电机运动控制系统的可靠性。在SR电机运动控制系统中，精确的转子位置是SR电机闭环运行的必要条件，这也是区别于开环运行步进电机的主要方面。转子位置检测对于电机达到预定性能指标有十分重要的意义。传统SR电机运动控制系统中

学位

SR电机相间互感间接位置检测续流非线性模型

极值搜索控制及其在机器人气味跟踪中的应用研究

气味跟踪在自然界中普遍存在着。许多生物利用气味来躲避入侵者、进行交流、发现同类、搜索食物等。受到生物气味跟踪的启发，自二十世纪九十年代，一些学者开始使用机器人来完成

学位

移动机器人气味跟踪极值搜索时变信号场收敛

碳纳米管气敏传感器微电极的制备与检测

由于工业生产、环境监测等领域对气体传感器的要求越来越高,因此,对气体传感器的研究也愈显重要。碳纳米管凭借其独特的物理、化学性质被应用到气敏传感器中,为提升气敏传感

学位

光刻碳纳米管叉指微电极气敏传感器性能检测

带领导者的多智能体系统有限时间一致性

近几年来，多智能体系统分布式协同控制问题成为控制领域的研究热点问题。由于多智能体网络能够完成单一智能体无法完成的任务，所以得到了研究人员越来越多的关注。在分布式协同

学位

多智能体系统拓扑结构领导者有限时间一致性协议

滑轮组混合图示推理系统

图示是拓扑和几何关系的一种直接表示。符号推理一般应用替代表示,而图示推理常应用直接表示。因而,研究结合替代表示与直接表示的混合图示推理系统,是发展图示推理方法并拓

学位

图示推理图形感知约束问题求解滑轮组受力分析

多路输出LED均流技术研究

相比于传统光源，LED具有光效高、寿命长、体积小、污染少等优点，在现实生活中得到越来越广泛的应用。为达到所需的功率等级和亮度，LED通常采用串并联的多路输出结构，由于LED个体

学位

发光二极管多路输出无源均流CLC恒流网络PWM脉冲

基于CS架构和终端数据采集的通用通信软件包的设计与实现

学位

基于激光波数间断扫描干涉测量系统的研制及曲面轮廓三维测量

在复合材料检测和超高精度加工领域，曲面三维轮廓测量技术被越来越多的科研工作者所重视，占据的地位也越来越重要。在这种超高精度的测量技术领域通常使用的技术都是基于激光干

学位

激光波数扫描干涉测量仪曲面轮廓三维测量CCD相机波数变化

基于交互式动态影响图的通信模型研究

与本文相关的学术论文