【摘 要】
:
实际工程中存在各种多输入系统,比如用于大型雷达和火炮的多驱动伺服系统、多自由度机械臂系统等,针对这些系统的H∞控制研究具有重要意义.同时,近似动态规划方法已被广泛用于求解各类最优控制问题,但并未涉及多输入系统的H∞控制.本文应用近似动态规划方法,设计多输入非线性系统的H∞控制器.应用基于强化学习的神经网络在线逼近非线性Hamilton–Jacobi–Isaacs(HJI)方程的解,引进一种新的自适应律更新神经网络权值,然后直接用于H∞控制器的设计,并证明了权值的收敛性和系统的闭环稳定性,保证了多输入系统受
【机 构】
:
太原理工大学电气与动力工程学院,山西太原030024;北京理工大学自动化学院,北京100081
论文部分内容阅读
实际工程中存在各种多输入系统,比如用于大型雷达和火炮的多驱动伺服系统、多自由度机械臂系统等,针对这些系统的H∞控制研究具有重要意义.同时,近似动态规划方法已被广泛用于求解各类最优控制问题,但并未涉及多输入系统的H∞控制.本文应用近似动态规划方法,设计多输入非线性系统的H∞控制器.应用基于强化学习的神经网络在线逼近非线性Hamilton–Jacobi–Isaacs(HJI)方程的解,引进一种新的自适应律更新神经网络权值,然后直接用于H∞控制器的设计,并证明了权值的收敛性和系统的闭环稳定性,保证了多输入系统受到外界未知干扰时的良好性能.最后应用仿真实例验证所提方法的正确性和有效性.
其他文献
介绍了我国新一代地球同步轨道光学遥感卫星控制系统的组成及技术特点,给出了关键部件的技术指标.描述了高轨遥感卫星在高精高稳快速机动、适应斜切遮光罩的全自主阳光规避、地速补偿以及高定位精度设计和实现的控制策略,给出的在轨实际数据遥测曲线验证了设计和实现的正确性,为我国后续更高分辨率地球同步轨道光学遥感卫星的发展奠定了坚实基础.
本文研究了离散时滞Lur\'e系统的绝对稳定性和鲁棒绝对稳定性问题,包含时变时滞和扇形有界约束的非线性.首先,构造了新颖的李雅普诺夫-克拉索夫斯基泛函(Lyapunov-Krasovskii functional,LKF),其中,为了增补时变时滞区间和其他系统状态变量之间的耦合信息,LKF中扩充了一些重要的向量.其次,结合改进的基于自由权重矩阵求和不等式技巧,推导了一些比已有结论保守性更低的绝对和鲁棒绝对稳定性判据.稳定性判据保守性的减小主要归功于改进的LKF和求和不等式技巧.最后,通过几个文献中常用
本文针对一类新型两阶段分布式装配柔性作业车间调度问题(DAFJSP),建立问题模型,以最小化最大完工时间为优化目标并提出一种超启发式交叉熵算法(HHCEA)进行求解.首先,设计基于工序序列、工厂分配和产品序列的三维向量编码规则和结合贪婪策略的解码规则,同时提出4种启发式方法以提高初始解的质量.然后,设计高低分层结构的HHCEA,高层为提高对搜索方向的引导性,采用交叉熵算法(CEA)学习和积累优质排列的信息,其中各排列由结合问题特点设计的11种启发式操作(即11种有效的邻域操作)构成;低层为增加在解空间中的
针对以雷达情报处理分析为主体的预警情报处理课程体系存在教学内容不满足联合预警情报保障人才能力需求、教学模式不利于人才能力提升、教学资源不符合人才能力生成环境的现实问题,基于产出导向教育(OBE)理念,从跨域联合作战预警情报保障人才岗位需求出发,反向设计与岗位需求相匹配的课程体系.教学实践表明,该课程体系能有效促进预警情报处理人才岗位能力生成.
本文针对一类严格反馈非线性系统,提出了基于确定学习的事件触发控制方案.首先,在本地控制测试端设计自适应神经网络控制,并在控制过程中实现系统未知动态的知识获取和存储.随后,基于常值权值,设计了新颖的事件触发控制器和事件触发条件.结合李雅普诺夫稳定性分析和非线性脉冲动态系统原理,验证了所提方案能够保证跟踪误差收敛到零的小邻域内以及所有闭环信号是最终一致有界的.此外,本文所提方案采用常值权值代替了估计权值,使得所提方案易于实现,暂态性能好和网络资源占用少.最后,通过对比仿真结果证明了所提方案的有效性.
对不确定噪声方差乘性噪声,同时带观测缺失、丢包和一步随机观测滞后三种网络诱导特征的混合不确定网络化系统,应用带虚拟噪声的扩维方法和去随机参数方法,将其转化为带不确定虚拟噪声方差的时变系统.基于极大极小鲁棒估计原理,对带虚拟噪声方差保守上界的最坏情形系统,设计了鲁棒时变和稳态Kalman估值器.对所有容许的不确定性,保证实际Kalman估计误差方差有最小上界.应用扩展的Lyapunov方程方法和矩阵分解方法证明了所设计估值器的鲁棒性.证明了实际和保守估值器的精度关系,以及时变和稳态估值器间的按实现收敛性.应
受扰布尔控制网络的状态转移,因受未知干扰影响而具有不确定性,这对状态观测器设计带来了困难.本文主要研究了受扰布尔控制网络全局可重构性问题,并在此基础上设计状态观测器.首先,将受扰布尔控制模型转化为多个子系统的切换未知布尔控制网络模型,在此基础上,提出了受扰布尔控制网络的4种不同状态集.其次,基于状态集估计方法,对受扰布尔控制网络状态估计问题进行分析.再次,提出有限时间可重构与全局可重构性概念;同时
本文针对一阶非线性多自主体系统,考察了切换拓扑下的事件触发一致性控制问题.当切换拓扑子图的并图包含有向生成树时,基于一阶保持器提出了一种分布式事件触发一致性算法,用以降低网络的通信负载.运用迭代法和不等式法,得到了多自主体系统达到有界一致性的充分条件.此外,证明了所提事件触发机制不存在Zeno现象,并得到了触发间隔的正下界.最后,给出仿真实例,验证了所提事件触发一致性算法和理论分析结果的有效性.
针对现有的藻类水华分析存在忽略水体底物中的氮磷反馈机制对藻类生长过程影响以及缺乏对整体水域的全面分析的问题,本研究以富营养化状态和叶绿素a浓度作为藻类水华的表征指标,以遥感图像及水体中的总氮和总磷为主要研究对象,提出一种基于遥感图像3D–CNN及氮磷循环的水华形成过程分析新方法.首先通过3D–CNN对遥感图像进行特征提取,并采用细菌觅食算法优化网络结构,预测水体富营养化等级,在此基础上,根据"氮–
演化博弈论(EGT)基于有限理性假设且更加贴近现实,近年来已在众多领域得到了初步应用.基于此,本文关注一类较为常见的三方多策略式演化博弈系统,尝试通过理论分析总结其长期演化稳定均衡(ESE)特性,并进行仿真验证研究.首先,研究了一般情形下的三方两策略对称与非对称演化博弈系统;然后,将其扩展到更复杂的三方三策略非对称演化博弈类型,并对其长期ESE特性进行了理论分析与动态仿真验证;进一步,对通用三方n-策略(n>1)非对称演化博弈的建模思路进行了阐述与总结,给出其收敛迭代的计算方法.研究过程中详细定义了各类演