融合Q学习与PID控制器的AUV跟踪控制

来源 :水下无人系统学报 | 被引量 : 0次 | 上传用户:liongliong592
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为进一步提升自主水下航行器(AUV)跟踪控制性能,文中设计了一种融合Q学习与比例-积分-微分(PID)控制器的AUV跟踪控制算法.首先,根据AUV的跟踪误差构建基于PID控制器的跟踪控制算法.为提升跟踪的静态与动态性能,将PID控制器参数的自适应调整描述为一种Q学习问题.然后采用动作更新的形式对不同状态下的Q值进行迭代优化,直到每个状态-动作所对应Q值保持不变.相比于传统的PID控制器,该算法不仅可以保持PID简单实用的特点,还可根据环境信息的变化进行参数自适应调整.仿真与试验结果均验证了所提算法的有效性.
其他文献
文章论述了燃气-蒸汽联合循环发电机组空气过滤器的分类、材质、结构、优缺点等,介绍了鞍钢M701SDA燃气-蒸汽联合循环发电机组空气过滤器的结构、工作原理.对新投运的过滤器存在问题进行描述,并提出解决方法.
现有SDA工艺无法满足超低排放要求,为提高脱硫效率,在原有SDA工艺基础上,开发更加高效的新型SDA脱硫处理工艺.进一步研究在脱硫塔塔体增设多点多介质混合物喷管对脱硫效率的影响,包含喷管位置(高度、管长)和钙硫比等参数的研究.通过数值模拟研究得出:在Y=1.4D布管时,多介质混合物在塔内分布最为均匀,贴壁最少,脱硫效率最高;在Y=1.4D布管时,管长在0.7D~D之间,脱硫效率从91.2%上升到95.2%;钙硫比在1.5~3时,脱硫效率增长幅度较大,从89.7%增长至97.2%.通过工业实验验证了喷射多介
为研究双发回转体水下齐射过程流体动力演化特性,基于均质多相流理论、标准RNGk-ε模型、Singhal空化模型以及重叠网格技术,建立三维双发回转体水下齐射模型,开展不同发射速度下双发回转体非定常空泡与运动姿态演变过程数值仿真,分析了典型工况下双发回转体齐射过程流场结构演变、运动特性以及齐射速度对其运动特性的影响.结果表明:航行前期空泡发展至最大,随着航行器向自由液面运动,空泡从其末端由下至上逐渐脱落,并发生了溃灭现象;由于齐射过程中流动干扰区域的存在,双发回转体肩部空泡形态演变过程由不对称演变为对称状,从
自主水下航行器(AUV)在实际工程应用中,由于数字回路的存在,需要将状态变量等量化并传输到控制器中,使系统稳定性受到了极大的影响.针对AUV轨迹跟踪控制问题,考虑状态和控制输入量化的影响,提出一种基于非线性干扰观测器(NDO)的量化反馈滑模控制(SMC)方法.首先,采用NDO对外界未知干扰进行估计补偿,以抑制传统SMC中的抖振现象.然后,提出了一种SMC方案,将状态变量和输入的量化误差上界加入到SMC的开关项中,以克服量化对系统稳定性的影响,第一步证明无论在任何初始值开始,轨迹都将被驱使到一个较小的带状区
在水下目标自适应检测中,目标的高速运动会引起距离徙动(RCM)现象,从而导致检测性能下降.同时,由于水下环境的复杂性,还面临着辅助数据严重不足的问题.为解决以上问题,文中提出一种新的自适应检测算法,首先基于模型阶数选择方法,将声呐回波信号表示为多个时域序列形式,随后利用对称线阵协方差矩阵的斜对称结构对RCM目标的多元假设检验模型进行改进,进一步提出基于斜对称广义信息准则自适应匹配滤波(PG-AMF)检测算法.仿真结果显示,PG-AMF算法降低了对辅助数据的依赖,能够较为准确地估计出RCM目标回波的分布情况
以典型鱼雷结构为基础,首先通过干模态试验与仿真分析,修正全雷有限元模型,然后利用LMS Virtual.Lab边界元流固耦合分析方法,进行全雷湿模态仿真.分析结果表明,与在空气中相比,鱼雷结构在水中各阶固有频率均有所降低,前3阶频率降低量在35%左右.通过全雷干、湿模态仿真分析,获得解决复杂流固耦合问题的新途径,为后续进行鱼雷结构优化、减振降噪设计等提供参考.
随着新型水下电动混流泵发射动力技术的不断发展,对高速电机驱动提出了新的要求.但传统全阶磁链观测器设计会引发系统极点产生正实部,造成无速度传感器控制系统不能在低转速区域保持稳定,促使装置启动失败.针对此,文中提出一种新的异步电机全阶磁链观测器设计方法,设计了一种基于全阶磁链观测器的误差反馈矩阵,可同时保证观测器极点实部和估计转速传递函数的零点实部都小于零,从而保证了观测器以及估计转速的稳定.实验验证了该方法的有效性.
在自主水下航行器(AUV)执行应召搜索任务过程中,目标的散布区域是引导平台对AUV航路规划的重要依据.通过信息搜集的目标初始位置误差散布及其运动参数误差散布导致目标运动过程中任意时刻的位置分布函数表现出非正态分布和非均匀分布的特点,然而,现有方法对这一问题的描述往往过于简单甚至不尽合理,由此在研究类似搜索路径规划和搜索概率计算等问题时造成与实际不相符的现象.为解决AUV应召搜索时目标散布区域的估计问题,在建立目标初始位置散布区域估计模型的基础上,根据目标速度和航向等运动参数误差散布规律,建立了目标运动过程
针对永磁同步电机(PMSM)因样本数据稀少、可用性低、特征弱化和结构复杂等因素引发的退磁识别问题,提出一种融合稀疏自编码与最小二乘生成式对抗网络的退磁故障诊断方法.该方法首先采集PMSM的电磁转矩和磁动势分布数据构成有限样本集合,其次采用最小二乘生成式对抗网络对样本在保持特征分布一致的条件下进行标签化扩张,最后运用稀疏自编码网络和Soft max分类器对样本进行训练和分类,实现退磁故障的诊断与识别.在模型训练和故障识别过程中,一方面合理设计深度网络隐层节点、训练算法以及层数等影响学习效率的参数;另一方面训
为了解决大跨速鱼雷速度的大范围变化对精确控制的影响,设计了线性自抗扰控制器.首先,为了便于设计,对鱼雷横滚控制数学模型进行了重新推导;然后将自抗扰控制应用到鱼雷横滚控制中,实现了对总扰动的估计和实时补偿.仿真结果表明,该控制器可适应鱼雷28~70kn速度的大范围变化,不仅能很好地估计并补偿总扰动,而且对鱼雷参数的不确定性具有较强的鲁棒性,可满足大跨速鱼雷横滚通道控制要求,性能指标明显优于比例-积分-微分控制.