基于马氏决策理论的智能体决策问题研究

来源 :广东工业大学 | 被引量 : 12次 | 上传用户：cyw87325

【摘要】

：

马氏决策理论是智能体(agent)决策研究中有效的理论。马尔科夫决策过程(MDP)是马氏决策理论中最基础的一种模型,通常用来描述和解决大规模不确定性环境下智能体决策的问题。

【作者】

：

郭靖

【出处】

：

广东工业大学

【发表日期】

：

2012年01期

【关键词】

：

机器人足球智能体决策多智能体系统马尔科夫决策过程

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

马氏决策理论是智能体(agent)决策研究中有效的理论。马尔科夫决策过程(MDP)是马氏决策理论中最基础的一种模型,通常用来描述和解决大规模不确定性环境下智能体决策的问题。部分可观马尔科夫决策过程(POMDP)是MDP随着现实问题的扩展,当智能体决策过程中无法获得全局的信息的时候,POMDP就是能够为决策过程提供可靠的模型和求解方法。随着人工智能研究的发展,越来越多的研究者开始考虑将多个智能体作为一个整体,也就是多智能体系统(Multi-agent System, MAS),并开展对多智能体系统决策的研究,而分布式部分可观马尔科夫决策过程(DEC-POMDP)正是为解决MAS决策而提出的新模型。本文首先介绍马氏决策理论中重要的三个模型MDP、POMDP和DEC-POMDP以及相应的求解算法,然后结合机器人足球2D仿真比赛中球员决策的问题,通过分析利用相关的模型和算法来提高球员决策的性能。本文主要工作可以分为以下三个方面：首先,通过分析机器人足球2D仿真比赛中球员进攻决策存在的问题,发现球员在持球状态下决策的不足,然后利用MDP为球员持球状态下的进攻决策进行建模,同时提出值函数分解迭代的方法求解最佳进攻策略,通过实验数据证明利用本模型和相关求解算法能够让球队的进攻性能得到有效的提高。其次,为提高球队守门员的表现,本文分析了守门员决策必须考虑决策实时性和信息不完整性,提出用POMDP为守门员决策进行建模,以提高守门员在紧急情况下及时有效防止对方进攻的表现。在求解过程中,为保证算法的实时性,文中提出基于了临界状态的求解方法,并将此方法应用到基于POMDP模型的守门员决策中。一系列检测守门员效果的实验数据表明,通过POMDP模型建模并求解后的守门员决策性能得到了较好的提升。最后,我们展开了多智能体决策的研究。马氏决策过程中为解决多智能体系统决策,提出了DEC-POMDP模型,但是其相应的求解算法仍存在不足,尤其是目前大部分算法只能解决部分小规模问题,无法顺利地应用于机器人足球2D仿真比赛这种大规模多智能体系统的决策中。文中首先对多智能体系统决策的DEC-POMDP及相关算法进行分析,然后利用MADP工具箱对DEC-POMDP模型的一系列标准测试问题进行测试和分析,阐述了DEC-POMDP离线规划求解过程中算法的重要性,然后提出分组有限空间的离线规划方法,并在MADP工具箱里几个有关DEC-POMDP标准测试问题中验证文中提出方法的有效性,通过几组实验对照发现分组有限空间的离线规划方法能够在一定程度降低标准测试问题的求解时间。本文的工作是以机器人足球2D仿真比赛作为研究平台,利用马氏决策理论为球员(即智能体)决策进行建模和求解,通过设置的一系列实验数据统计,体现了本文工作的意义。基于文中的研究成果,GDUT_TiJi队在2011年RoboCup中国公开赛获得全国一等奖,并顺利地首次通过机器人足球世界杯预选赛,将于2012年6月前往墨西哥参加2012年RoboCup机器人足球世界杯决赛。

其他文献

基于流域社会生态系统的海南区域治理体系优化调整研究

"社会生态系统"(SES)理念注重社会生态经济系统的整体性,突出人地和谐、综合的思想,是当今世界生态系统分析的新思路,是解决区域可持续发展和区域治理等复杂问题的有效方法。

期刊

流域社会生态系统区域治理行政区划海南basin social ecosystemregional governanceadministrative di

用归脾丸可治疗神经衰弱等11种病症

归脾丸是一种常用的中成药。该药由党参、白术、黄芪、龙眼肉、酸枣仁、木香、当归、远志、甘草、茯苓、大枣、生姜组成,主要用于治疗食少便溏、神疲体倦、面色萎黄、健忘失

期刊

归脾丸病症神经衰弱治疗食少便溏面色萎黄临床实践健脾养心

治疗小儿骨折的八大误区

小儿缺乏自我保护意识而又活泼好动，因此较容易发生骨折。当小儿发生骨折后，家长们往往十分焦虑，迫切地希望能稳妥、安全地使患儿痊愈。然而，对如何治疗小儿骨折，目前在多数家长中还存在着一些错误的认识和做法，他们若按照这些错误的认识和做法来帮助孩子，不但无助于对患儿骨折的治疗，还可能影响治疗的效果，甚至给患儿留下终生的遗憾。那么，人们在治疗小儿骨折方面都存在哪些误区呢？　　　　一、认为小儿骨折与成人骨折是

期刊

小儿骨折治疗自我保护意识骨折后家长

结石病的克星——金钱草

上个世纪六十年代，受周恩来总理之托，我国著名的中医学家岳美中先生专程赶往印度尼西亚为苏加诺总统看病。年逾花甲的苏加诺总统备受泌尿系结石的折磨，经常感到下腹疼痛，小便不畅，经肾造影检查显示其左肾功能已衰竭。如果接受西医的治疗，苏加诺总统就要将左肾摘除，但岳先生坚决不同意做此手术，并建议他服用中药进行治疗。　　岳先生在为苏加诺总统诊治的过程中，始终重用金钱草来清热化湿。他用金钱草的剂量由每剂60克逐渐

期刊

金钱草结石病克星印度尼西亚泌尿系结石中医学家下腹疼痛造影检查

胸罩穿戴不当会使乳腺生病

胸罩是现代女性必备的生活用品之一，然而有些女性穿戴了不适合自己的胸罩，这样不但起不到保护乳房、使外表美观的作用，还容易引发许多病症。那么，女性穿戴胸罩不当会引起那些病症呢？　　1.可使乳头内陷：如果女性穿戴长度比自己胸围短的胸罩，乳房就会受到压迫，从而会影响乳房的血液循环，其乳头也会因为被挤压而变得扁平或内陷。乳头内陷会影响未育女性将来进行哺乳，还会诱发乳腺导管炎，严重者可形成乳腺瘘管、乳腺窦道等

期刊

胸罩乳头内陷乳腺生活用品血液循环女性乳房病症

电针次髎为主治疗脊髓损伤后二便障碍的有效性和安全性观察

1目的通过对3组共45例脊髓损伤患者采用电针次髎穴为主、电针其他穴位和膀胱、直肠功能训练治疗,记录疗前疗后《国际脊髓损伤数据集下尿路功能基本数据集》及《国际脊髓损伤

学位

脊髓损伤膀胱功能障碍肠道功能障碍电针

喷射成形工艺的原理及应用

介绍了当今一种先进的加工技术－喷射成形工艺的基本原理、技术关键与应用状况。

期刊

喷射成形半固态加工雾化沉积成形雾化喷咀

窗帘装饰性设计研究

近年来家居业“重装饰、轻装修”的潮流不可忽视。窗帘作为室内软装设计中的重要元素,具有丰富室内空间形态、改善室内空间功能、强化室内空间风格特征、柔化室内空间环境、

学位

窗帘装饰性窗帘设计

消费者旅游购物风险感知评价及差异研究——以厦门市为例

旅游购物是消费者普遍喜爱的活动,对目的地创收、形象、吸引力等产生深远影响,但频频发生的旅游购物风险问题已成为各旅游地发展旅游购物的重要阻碍。文章以厦门市为例,进行

期刊

旅游购物风险感知评价风险感知差异厦门市tourism shoppingrisk perception evaluationrisk perception

证券投资基金管理公司治理机制研究

证券投资基金作为一种利益共享、风险共担的集合投资方式,自产生以来发展迅速,已成为各国金融市场不可或缺的投资工具,对证券市场的发展发挥着越来越重要的作用。截至2011年1

学位

基金管理公司内部治理风险控制基金经理

基于马氏决策理论的智能体决策问题研究

与本文相关的学术论文