机器学习及其在多Agent对策学习中的应用研究

来源 :武汉大学 | 被引量 : 4次 | 上传用户:sjn19900523
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
多Agent系统的理论与技术,为分布式开放系统的分析、设计和实现提供了一条崭新的途径。然而随着相关领域高新技术的迅猛发展,多Agent系统的运行环境日益趋于大型、开放、动态和不确定,迫切需要采用各种智能技术来构建具有自学习能力的Agent,为多Agent系统引入学习机制使其更好地适应复杂环境,从而导致了多Agent系统学习这一新兴研究领域的产生和迅速发展。多Agent系统学习包括采用机器学习等方法从积累的信息或数据中学习用于支持决策的知识,以及为建立多Agent协作、协调和竞争等机制而进行的对策学习。因此,机器学习方法和对策学习方法的研究对多Agent系统学习领域的发展具有非常重要的意义。 在机器学习研究领域,海量数据、复杂数据、噪声或缺值数据和极少样本等都给机器学习方法的研究带来了极大的挑战。如何提高机器学习算法处理海量数据的效率,如何提高机器学习算法的性能以处理复杂数据,如何扩展现有的机器学习算法以处理噪声或缺值数据,如何完成极少样本情况下的机器学习任务成为了机器学习研究需要重点解决的问题,也使得组合学习、强化学习、统计机器学习和针对海量数据的机器学习方法成为了机器学习研究的热点。在对策学习的研究中,采用强化学习等机器学习方法的参与人最优策略学习是最主要的对策学习方法。如何确保学习算法的理性和收敛性是研究和设计对策学习方法的关键。为此,本文对主要的机器学习方法进行了研究,提出一组扩展机器学习方法,并在理论和试验上分析了这些机器学习方法的性能。同时,探讨了机器学习方法在对策学习中的应用,研究了针对随机对策和微分对策模型的对策学习方法,设计了相应的对策学习算法并对其理性和收敛性进行了分析。主要研究工作包括: (1)将概念层次引入到粗糙集理论和关联分析中,讨论了粗糙集理论和证据理论的关系,提出了层次粗糙集模型,研究并设计了基于概念层次的数据集划分方法,以及相应的关联分析算法。层次粗糙集模型拓展了经典粗糙集理论,给出了知识的深度和广度衡量方法,在飞行器落点精度鉴定问题中的应用表明层次粗糙集模型具有更强的数据分析能力和更广的适用范围。基于概念层次的数据集划分方法利用概念层次将数据集划分成相对独立的多个子数据集,通过在各个子数据集上的关联分析来获得与整个数据集上关联分析同样的结果,并以此来提高关联分析的效率,同时该方法还有利于设计并行关联分析算法,测试结果表明了基于概念层次的关联分析方法的有效性。
其他文献
在控制理论中,控制系统的设计都要以被控对象的数学模型为依据,然而对于任一被控对象的建模都不可能做到完全精确,必然存在不确定性。这些不确定性主要由以下两方面造成:一是
形式概念分析作为一种用于数据组织和数据分析的形式化工具,在理论研究和实际应用上都具有重要意义。本文对基于形式概念分析的知识发现方法进行了研究。主要包括:(1)在对基
<正>The grand exhibition "Temptation For Taste-Chinese Cooking and Food" was opened in the Mus&#233;e du Quai Branly of France on June 18th. It was organised by
随着当今经济坏境的不断发展,缺乏金融机构的外部支持、自身能力不强,中小企业对于融资问题的困难体现尤为明显。同时,由于缺少股东支持、缺乏合格抵押,使得中小企业在发展之
寒冷的冬季,影响着人体热能和营养素的代谢,所以,膳食配比中应注意增加产热营养素如糖类、脂类、蛋白质等的摄入量,来提高身体的御寒能力。增加人体必需氨基酸的摄入量:氨基
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正>County has played an important role in the history of China since it was first established as a basic administrative unit in the Qin Dynasty more than 2000
矢量在解析几何中有三种作用:1.矢量作为从几何到解析几何的导入的桥梁的作用。2.矢量方法作为解析几何的基本方法在解析几何讨论过程中的贯穿作用。3.矢量法较之纯几何法之优越,
目的研究个体化护理模式在减重代谢手术患者术后饮食运动管理中的应用。方法按照随机方法从医院2017年9月至2018年9月收治的减重代谢手术患者中抽取80例作为此次临床实践研究
非线性系统的控制一直以来都是控制领域的一个热点和难点.历来使用得最多,最主要的方法是李雅普诺夫(Lyapunov)直接法,即通过引入一个Lyapunov函数来分析、判断系统的稳定性.但