基于强化学习的倒立摆控制问题研究

来源 :信息通信 | 被引量 : 0次 | 上传用户:ynhz009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
倒立摆控制系统是一种不稳定,高阶,多变量,强耦合的非线性系统。传统的控制方法,如PID控制,控制效果一般。在本文中,我们将强化学习用于倒立摆系统的控制,采用基于模型和不基于模型的两类方法进行仿真实验。并且与最优控制方法线性二次调节器(LQR)方法进行了对比。实验结果表明,在非线性复杂系统的控制上,强化学习算法在控制稳定性和准确性上都有明显的优势。
其他文献
介绍一种基于小波变换的静态图像水印算法,算法将一个二值图像内嵌到原始图像经过小波多分辨率分解后的低频子带上,实验结果表明:该算法较好地保持了图像的质量,并且对常用的
耦合常数为Grassmann值的Jaynes-Cammings模型具有超对称代数结构,因此该系统的Hamiltomian量可用超对称算符的线性组合表示。在算符N的本征值子空间,用生成元算符构造出系统的
转换生成语法与系统功能语法是当今语言学界最有影响力的两大学派.从研究视角、语言观、研究方法以及研究特色等来对其进行比较分析,并论述其在外语教学中的应用.
基于嵌入式Linux系统上广泛使用的GUI应用程序开发包Qtopia,利用Qtopia所提供的插件技术,给出在嵌入式Linux系统中中文输入法的整体设计框架,并以拼音输入法为例介绍其实现过
现阶段,科学技术的研究与发展较为快速,模糊神经网络项目的研究价值逐渐被人们挖掘出来。从现阶段神经网络类型学科的拓展研究及发展状况来看,该领域研究成果的实践应用范围
Java 对 SQL 数据库访问的一个常规方式是利用JDBC规范来实现.现就另一途径的连接使用进行尝试,即利用在后台SQL 数据库的触发器来辅助实现前台界面与后台数据库两者之间的动
在大多数情况下,语音信号的传送都会受到噪声信号的干扰,某些特殊的场合语音信号将被噪声完全湮没。将被干扰的语音信号进行小波分解,估算出噪声信号的方差,后根据方差计算出
针对坦克在行进过程中炮口抖动的问题,提出了一种嵌入式炮口抖动测量系统。该系统通过利用光电位置传感器PSD(Position Sensor Detector)线性位移的变化来测量角度,从而进一步
在简要介绍上海LAP-3000边界层风廓线雷达探测原理和产品生成的基础上,利用近两年来搜集的资料,分析风廓线雷达资料短时强降水、龙卷风等局地强对流天气预报中的应用.结果表
文章就目前应用比较广泛的遗传算法进行了的分析和研究,提出了两种对遗传算法的改进措施,这两种改进措施分别是基于平均适应度的改进措施和基于局部小生境的改进措施。