高性能数值微分博弈：一种机器智能方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户：s5871212

【摘要】

：

【作者】

：

朱强

【机构】

：

浙江大学

【出处】

：

浙江大学

【发表日期】

：

2020年期

【关键词】

：

高性能数值优化微分博弈机器智能优化求解博弈问题求解算法人工智能技术动态优化问题优化结果稳定性分析机理建模

【基金项目】

：

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

人工智能，是指由人制造的机器所表现出的智能。在工业革命时代，我们通过思考制造机器;而到了人工智能时代，我们制造会思考的机器。在人工智能革命前，所有人类生产技术和生产方式的革命均可称为人类学习和发现的过程，是人类大脑的专利。而放眼未来，人工智能终将继承人类的这一特质。人工智能对未来的改变，是对我们一点一滴形成知识体系过程本身的自动化，是用机器取代人类过程本身的自动化。人工智能技术从概念提出到今曰蓬勃发展已历经几个世纪，在此过程中弱机器意识问题的理论体系以及实际应用日趋完备，同时机器行为学也得到了迅猛发展。而在下一代人工智能技术发展中，科学家们试图把机器视为可以独立思考的个体，从而研究强机器意识问题。但目前我们对此问题仍没有足够深刻而统一的认识，且现阶段面临着诸多方向性和技术性的难题，所以我们当下的研究重点仍然放在无意识的人工智能领域技术和基本原理的突破上。
　　本文将从机器智能研究和机理建模的角度来研究无意识人工智能技术。机器智能是利用机理建模的方法描述一个系统内部运作的机制，同时配以控制论和优化理论作为决策辅助，从而实现机器的智能决策和最优操作。机器智能不再是一种简单的仿人智能，也不再依赖于人类所谓的“最优经验”和海量的数据样本，而是基于对机器系统内部特征的充分认识构建机理模型，之后利用数学物理方法进行科学决策的一种智能技术。机理建模技术在机器智能中充当着重要角色，是机器智能的决策基础，其可以在大范围内描述系统的非线性特征，具有较好的外推能力，适应性强。在使用上述技术思路研究无意识人工智能技术时，假设我们对机理模型已经有了充分认识，则机器智能科学决策中的相关控制理论和最优化理论就是本文最重要的研究内容。为处理当前万物互联背景下各种利益关系中多智能体系统的智能决策和最优操作问题，本文基于微分博弈理论和数值优化技术构建了一套高性能微分博弈数值优化算法，来对机理建模后的系统进行智能决策和最优操作分析，从而建立了一种机器智能方法来支撑人工智能研究。本文主要研究内容概括如下:
　　1.微分博弈基本理论的介绍及已有求解算法的构造及验证。首先，本文针对微分博弈理论的基本概念、分类及性质做了详实的介绍，同时还介绍了目前较为成熟的微分博弈求解算法，如解析法、数值间接法及启发式算法等。在此基础上，本文针对三类典型的微分博弈，即竞争对抗微分博弈、非合作微分博弈及合作微分博弈进行求解框架分析，赋予每种微分博弈实际的工业、军事应用背景，构建每种微分博弈的数学优化命题，并利用成熟的计算方法进行仿真求解。
　　2.微分博弈问题数值优化求解算法。针对传统微分博弈求解算法存在的缺陷，本文从数值直接求解算法入手，用以克服已有算法的不足，从而保证各种复杂场景、各种利益关系下的微分博弈问题成功求解。本文提出了两种数值直接求解算法:联立迭代分解正交配置法(SOCD，Simultaneous Orthogonal Collocation Decomposition)和联立直接间接混合法(SSD，Simultaneous Semi Direct)。前者的算法核心是:先将微分博弈中的极大极小化问题分解为两个轮流交替求解的普通动态优化子问题，之后针对每个子问题采用正交配置法将其离散化为非线性规划(NLP,NonLinear Programming)问题，最后求解该NLP问题，直到优化结果成功收敛为止。后者的算法核心是:先使用间接法得到某一位玩家A动态优化问题的一阶最优性必要条件，之后使用直接法求解另一位玩家B的动态优化问题，同时把玩家A的一阶最优性必要条件当作是玩家B动态优化问题中的约束来看待。这样就可以分别使用间接法和直接法来获得玩家A和B的微分博弈最优策略。本文对上述两种算法的细节进行了详细描述，同时配以工业、军事等领域仿真案例加以解释说明。此外，本文还提出了滚动时域优化算法(RHO，Receding Horizon Optimization)，用于求解不确定性微分博弈问题。
　　3.微分博弈问题高性能数值优化求解算法。在实际的微分博弈数值优化求解过程中，我们还面临着来自优化求解收敛性、实时性及准确性方面带来的诸多挑战。首先，对于增强微分博弈问题数值优化求解算法的收敛性，本文分别提出了基于回溯同伦法(HBM，Homotopy-based Backtracking Method)的初值化生成策略以及收敛深度控制算法(CDC，Convergence Depth Control)，用以保证优化求解的收敛性并提高收敛过程的计算效率。其次，为了解决微分博弈动态优化问题在线求解计算耗时长，优化收敛难的问题，本文提出了一种基于灵敏度信息的微分博弈优化求解实时性提升算法(SpI，Sensitivity-based Real-time Improvement)。该算法利用当前NLP问题优化结果的灵敏度信息实现在线预估未来优化周期内的微分博弈近似最优解，同时通过背景计算和离线矫正等手段进一步提升预估解的精度，从而保证既快又准地获得微分博弈动态优化问题的最优解。最后，为了提高微分博弈优化求解的精度并保证求解结果的最优性，本文提出了改进的hp自适应网格精细化策略(mhp-AMR，modified hp-Adaptive Mesh Refinement)，该策略分别通过自适应调整网格个数以及插值多项式的阶次来精准捕捉控制变量的跳交点位置以及保证用来近似控制变量和状态变量的曲线足够光滑，从而提高微分博弈优化求解的准确性并保证求解结果的最优性。
　　4.微分博弈问题数值优化求解算法结果稳定性分析。在实际应用场景中，除需要关注微分博弈问题如何求解、如何极大化目标函数以及如何提升优化算法的性能外，我们还需要关注微分博弈系统在优化求解过程中是否一直保持稳定。我们首先提出了一种针对微分博弈数值求解算法优化结果稳定性分析的理论分析工具——输入状态实际稳定性(ISpS，Input-to-State practical Stability)。之后，本文基于ISpS对不确定性微分博弈、合作微分博弈以及非合作微分博弈问题进行了优化结果稳定性分析并给出了相关证明。最后，本文通过工业仿真案例对微分博弈数值求解算法优化结果稳定性分析进行了有效性验证。

其他文献

浅议新形势下电力教育培训面临的挑战及前景

摘要：随着我国电力企业市场化改革的不断深入，电力教育培训工作也面临着全新的挑战与机遇，因此，电力企业必须对电力教育培训工作加以改革和创新，以满足时代发展的需求，本文主要对新形势下电力教育培训面临的挑战及前景进行了研究，旨在创新电力教育培训模式，促进企业长远发展。　　关键词：电力教育培训；挑战；前景　　随着市场化改革浪潮在世界电力行业的推进，我国也展开了电力企业改革，并以市场为导向，实行南北电网公

期刊

电视娱乐节目不从众、不从俗

摘要：随着网络传媒发展快速化、先进化、多样化，电视早已经由旧年代的奢侈传播方式变成了现在家家户户必备的娱乐方式，在这样庞大的收视群体中，电视娱乐节目显然已经成为百姓茶余饭后的“必备甜品”。那么如何能给观众带来富含营养的文化盛宴，怎么在新媒体与传统媒体的了激烈竞争下不断扩大传统媒体的地盘，让电视娱乐节目始终站在潮流的制高点，这是我下面这篇文章主要想解决的问题。　　关键词：电视娱乐节目；创新；不从众

期刊

电视媒体与微博融合传播研究

摘要：随着多媒体技术的发展，微博成为最为重要的信息传播平台，电视媒体作为传统媒体的重要力量，也开始利用微博这个平台，通过建立官方微博进行新闻发布、品牌营销等等，极大地提高了电视媒体与观众的互动和融合。传统媒体与微博融合成为了电视媒体寻求可持续发展的重要手段。本文分析了电视媒体与微博整合过程中存在的问题，提出我国电视媒体与微博融合的创新策略。　　关键词：电视媒体；微博；多媒体融合技术　　近年来，电

期刊

浅谈LED在室内照明中的应用

摘要：LED技术推动了照明行业的一场革命。毋庸置疑，随着LED技术日趋成熟及其产品价格不断降低，其在室内照明中的应用必将越来越多、越来越广。基于此，本文主要分析了LED在室内照明中的应用，以供参考。　　关键词：LED；室内照明；优势；应用　　LED照明始于20世纪60年代，随着科技的进步，新材料的不断出现，2000年后，LED的照明效率已超过荧光灯。白光LED因效率高、功耗小、寿命长、响应快、可

期刊

组织创新对组织持续发展的影响

摘要：本文从分析华能云南某大型煤电一体化项目的组织创新历程入手，细致的分析了该项目的几次重大组织创新变革，从该项目变革历程中分析组织创新对组织可持续发展的重要意义。　　关键词：组织创新；可持续发展；新常态　　一、组织创新的概念　　（一）组织及组织结构。组织就是指人们为实现一定的目标，互相协作结合而成的集体或团体，如党团组织、工会组织、企业、军事组织等等，本文中所要研究的就是组织中的一种——企业。

期刊

高职院校舞蹈教学中的问题及对策研究

摘要：在加强精神文明教育的实施途径中，我国各高职院校纷纷开设了艺术类院系，在这一院系教学中其中较为常见的就是舞蹈教学，这也是高职院校开展素质教育的重要体现。然而近些年高职院校的舞蹈教学成果并不是很显著，因此，如何提高舞蹈教学的质量，改善高职院校舞蹈教学的成果，是现代教育工作者面临的重要课题。本文主要针对高职院校本文就高职院校舞蹈教学的基础意义，阐述了高职舞蹈教学中存在的问题进行了探究，并提出了相

期刊

如何加强电价电费稽查管理

摘要：近些年，我国的经济得到了极大发展，人民生活水平得到了很大的提升。与此同时，社会各界对于电量的需求越来越多，人民大众对于电力的稳定性也提出了一个要求，电力营销事业迎来了一个繁荣的时期。电力营销稽查是电力营销环节、内控约束机制的重要组成部分，是提升电力企业市场竞争力的有效途径，本文就如何加强电价电费稽查问题进行了相关的讨论和分析，希望能够为技术工作者们提供一定的帮助和支持。　　关键词：电价电费

期刊

被派遣劳动者与用工单位没有劳动合同关系

摘要：2008年，劳动合同法实施后，许多企业劳动争议案件骤增，严重影响单位的生产经营，尤其是劳务派遣工，该群体总是有人认为与劳务派遣机构之间没有劳动合同关系，而是认为与用工单位之间存在劳动合同关系，他们曲解、误解劳动合同法规定，于是走上诉讼维权道路。　　关键词：劳动合同法；劳务派遣工；处理；分析　　一、案情介绍　　原告：（仲裁申请人、一审原告、二审上诉人、再审申请人）朱某等八人　　被告：（被申请

期刊

广播电台新闻编辑的创新思路

摘要：随着科学技术的快速发展，信息领域得到飞速发展。如今，人们也有了更多的途径来获得信息。传统的广播电台形式虽然是新闻媒体的重要组成部分，但是却已经不能满足现代社会发展的需求，所以面临挑战它必须做出一定的改变。广播电台要实现可持续发展，新闻内容就必须新颖有趣，并且具有时效性，此外还需要坚持正确的价值观，尽量满足社会发展的文化需求。本文主要从广播电台新闻编辑策划现状及创新方向、广播电台新闻编辑策划

期刊

SNG卫星直播车在电视新闻中的应用

摘要：我国科学技术快速发展，电视新闻作为一项重要的宣传媒体，广泛使用了SNG技术，促进了电视台和新闻传播的进步。电视新闻最大的优点就是向来自现场新闻的实效性，SNG技术就可以为此提供很好的条件，能够满足电视新闻实时传播的要求需求，为电视直播带来新的传播途径。本文笔者结合SNG技术的实际应用和主要的特点进行分析，仅供大家参考。　　关键词：SNG卫星；直播车；电视新闻　　SatelliteNewsG

期刊

高性能数值微分博弈：一种机器智能方法

与本文相关的学术论文