交互式动态影响图的一种近似求解算法

来源 :华中科技大学学报(自然科学版) | 被引量 : 0次 | 上传用户：liongliong524

【摘要】

：

提出一种基于行为等价原理分段处理交互式动态影响图(I-DID)的近似算法:先将底层I-DID模型分解成包含若干时间片的子片段,求解首片段,获得各模型的策略树,并依行为等价原理合

【作者】

：

李波罗键庄进发尹华一

【机构】

：

厦门大学自动化系,厦门东南融通系统工程有限公司博士后科研工作站,解放军信息工程大学通信与信息系,

【出处】

：

华中科技大学学报(自然科学版)

【发表日期】

：

2011年10期

【关键词】

：

动态影响多agent系统 agent建模动态决策算法初始模型片段模型更新近似算法模型空间

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

提出一种基于行为等价原理分段处理交互式动态影响图(I-DID)的近似算法:先将底层I-DID模型分解成包含若干时间片的子片段,求解首片段,获得各模型的策略树,并依行为等价原理合并策略树,形成策略图,其结果作为下一片段的初始模型,再进行求解.重复这个过程,直到最后片段结束,获得完全策略图,用来指导agent是否进行模型更新.最后,针对多agent老虎问题进行试验和算法比较,试验结果从模型解的质量和模型空间大小2个方面验证了所提算法的有效性. This paper proposes an approximate algorithm based on the principle of behavioral equivalence to process I-DIDs interactively. First, the underlying I-DID model is decomposed into sub-segments containing several time slices. The first fragment is obtained, The strategy tree merges the strategy tree according to the principle of equivalence of actions to form a strategy diagram whose result is used as the initial model of the next segment and then solves the problem. Repeat this process until the end of the last segment obtains the full strategy graph to guide the agent Finally, the experiments and algorithms are compared to the multi-agent tiger problem, and the test results verify the validity of the proposed algorithm from two aspects of the quality of the model solution and the model space size.

其他文献

司法民主研究

随着我国司法改革的逐步推进和深入，很有必要对司法民主的相关问题重新进行疏理与展开。只有弄清司法民主的相关理论问题，才可以更好地发掘其理论和实践意义，适应时代的发展和社

学位

司法民主公开审判陪审制司法独立司法审查

把幸福送给村民的“女当家”——记青铜峡市大坝镇利民村党支部书记、村委会主任邹学梅

“利民村地理位置得天独厚,我要带领村民把家园建设成为宁夏一流的生态良好、环境优美、村民富裕、家庭和谐、文明进步的新村庄。”这是青铜峡市大坝镇利民村党支部书记、村

期刊

党支部书记利民村坝镇村党支部小康村青铜峡市家庭和谐妇女干部农村建设经济回报

巨额财产来源不明罪的诉讼问题研究

巨额财产来源不明罪自设立以来,就引起了刑事理论界的诸多争议和研究,是最具争议的一个罪名。该罪的特点之一是将实体内容与程序内容合二为一。关于该罪的相关实体问题,刑法

学位

巨额财产来源不明罪证明责任推定沉默权证明标准

商业登记制度研究

商业经营，种类繁多，其目的均在于营利。对于交易上的往来，均涉及到第三人的利益。尤其对于社会经济秩序的稳定，关系重大，所以现代各国的法律，都有企业登记或商业登记的规定。企业登

学位

商业登记制度民商法立法理论

“报料”在媒体新闻中的发展现状及其利与弊

随着新闻热线和有奖征集新闻活动的相继推出,催生出一批向媒体提供新闻线索以获取相应报酬的非新闻从业员——新闻报料人。“报料”不但扩大了信息的来源,增强新闻的时效性,

期刊

有奖征集新闻线索媒体新闻新闻报新闻活动新闻热线电子媒体新闻来源清远电视台《北京晚报》

Thickness Measurement of Insulation Coating by NIR Spectrometry Based on Boosting-KPLS

A novel thickness measurement method for surface insulation coating of silicon steel based on NIR spectrometry is explored.The NIR spectra of insulation coating

期刊

BoostinginsulationAOTFmaximalspectrometertunableabsolutekerneliteration

迪庆:把创先争优活动引向深入

迪庆州紧紧围绕“把迪庆建设成为全国藏区跨越发展和长治久安示范区”的目标,突出“反对分裂、维护稳定、促进发展”主题,切实采取有效措施,不断把创先争优活动引向深入。强

期刊

创先迪庆反对分裂思想教育基层党组织思想政治教育聚居区教育整合村民小组长流动红旗

完善我国集体协商制度的法律思考

对于劳动者与用人单位的关系有三种调整模式,宏观上以《劳动法》、《劳动合同法》等相关法律调控全部劳动关系;中观上以集体劳动合同调整集体劳动关系;微观上以劳动合同调整

学位

集体协商工会政府主导争议解决

收视价值的迷失:高端人群在远离卫视?

2008目睹中国电视之怪现状2008年是奥运年,原以为在这样一个举世瞩目的“中国年”里,电视媒体能够围绕奥运、体育题材创新节目,度过选秀的政策性猝死造成的电视冰 2008 witn

期刊

高端人群创新节目体育题材上星频道卫星频道选秀中央台八套电视剧频道频道上海东方卫视

个人所有制及其实现条件

所有制理论是科学社会主义的重要组成部分。关于未来社会所有制关系和经济关系的科学预测是马克思经济思想的重要内容。从《共产党宣言》明确提出“消灭私有制”的口号起,马

学位

个人所有制国有制社会公有制

交互式动态影响图的一种近似求解算法

与本文相关的学术论文