基于增强学习的无人直升机姿态控制器设计

来源 :弹箭与制导学报 | 被引量 : 0次 | 上传用户：qingtianleng

【摘要】

：

自适应启发评价（AHC）增强学习结构分别逼近马尔可夫决策过程的值函数和策略函数．策略梯度增强学习能够将随机不确定的马尔可夫决策过程转换为确定性的马尔可夫决策过程。通过将A

【作者】

：

蔡文澜王俊生税海涛马宏绪黄茜薇

【机构】

：

国防科学技术大学机电工程与自动化学院,空军航空大学航空控制工程系

【出处】

：

弹箭与制导学报

【发表日期】

：

2008年2期

【关键词】

：

无人直升机增强学习自适应启发评价策略梯度 PEGASUS unmanned helicopter reinforcement learning ada

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自适应启发评价（AHC）增强学习结构分别逼近马尔可夫决策过程的值函数和策略函数．策略梯度增强学习能够将随机不确定的马尔可夫决策过程转换为确定性的马尔可夫决策过程。通过将AHC增强学习和策略梯度增强学习相结合，对PID控制器参数进行在线自适应整定，实现对无人直升机姿态控制性能的在线优化。仿真结果表明．与固定PID参数控制器相比，该算法能在线调整控制器参数．并很好地控制了无人直升机的悬停姿态。

其他文献

多线程技术在破片参数测量系统中的应用

破片参数测量系统中，摄像机的定位造成了上位机CPU的空闲，降低了测量系统的实时性和测量效率。采用多线程技术能有效解决此问题。文中详细介绍了C＋＋Builder中多线程技术的要点以

期刊

破片参数多线程线程同步fragment parameters multithread thread synchronization

基于小波熵的弹丸激波信号特征提取方法研究

在实验中获取的弹丸激波实测信号。由于受到激波在空气中传播时各种因素的影响，使得获取的信号有很多不确定性，其持续时间难以利用传统的信号处理方法来获取。文中从小波变换的

期刊

弹丸激波信号小波能谱小波熵特征提取projectile shockwave signal wavelet energy spectrum wavel

弹药侵彻混凝土过载性能的数值模拟

通过建立弹靶系统，分析侵彻模型及弹体内部炸药所受冲击载荷的动态响应，旨在揭示弹药在侵彻混凝土冲击环境下的过载特性，进而运用ANSYS／LS—DYNA模拟软件，采用相应的弹药以及靶板

期刊

侵彻过载特性LS—DYNA仿真penetration characteristic over loading LS-DYNA simulation

云爆装置初始作用过程数值模拟

为了研究云爆装置结构对云雾形状的影响，应用流固耦合算法对其初始的作用过程进行了模拟计算；得到了壳体的变形速度分布规律、壳体最初破裂位置、时间及破裂形状等。模拟结果与

期刊

云爆装置计算模型数值模拟FAE deviee computation model numerical simulation

基于四元数的动基座对准算法

四元数法是研究空间几何问题的一种简单方法，文中介绍了四元数的基本概念及性质，在说明了动基座对准基本原理的基础上．讨论了四元数法在动基座对准技术中的应用。该技术具有线性

期刊

四元数欧拉角动基座对准quatwernion Eulcr angles moving-base alignment

基于ARM7的光纤陀螺经纬仪寻北系统设计与实现

针对机械式陀螺经纬仪系统工艺要求高、结构复杂、精度受多方制约的特点,设计了一个陀螺经纬仪寻北系统,采用四位置寻北方案,选用光纤陀螺为测量元件,用高速32位ARM7微控制器作为主控芯片,寻北过程操作完全通过红外控制实现。实验数据表明,系统能很好的实现寻北功能,稳定性好,精度能够达到要求,同时系统结构简单、易于实现,接口灵活、扩展性好。

期刊

ARM7微控制器光纤陀螺经纬仪寻北系统ARM7 microcontrollerfiber optic gyroscope theodolitenor

一种再入机动弹头最优制导律研究

利用最优控制理论及非线性控制理论中的精确线性化方法．将再入机动弹头方向控制方案设计问题转化为线性系统综合问题．无需作任何简化假设，推导方式更为简单．为再入弹头的机动方式

期刊

再入机动弹头最优制导黎卡提方程reentry maneuvering warhead optimal guidance Riccati equatio

变质量陀螺方程在旋转导弹中的应用

文中给出变质量陀螺运动普遍方程的详细推导，通过对导弹的尾喷流阻尼的估算，验证了在某些条件下。尤其是无控的起始飞行阶段该阻尼的作用不应被忽略；同时推导出了半衰时间和基于

期刊

导弹稳定性变质量陀螺方程喷流阻尼力矩missile stability variable-mass gyroscopic equation jet d

对映体干扰作战效能仿真评估

以对映体干扰作战效能为研究目标，根据对映体干扰的基本原理，通过对对映体干扰作战过程的建模分析，得到了镜面反射和漫散射两种地形特征下的评估模型．提出修正的粗糙面漫散射模型

期刊

对映体干扰镜面反射发光面漫散射terrain bounce jamming specular reflection glistening surfa

基于增强学习的无人直升机姿态控制器设计

其他学术论文