一种基于Dyna-Q学习的旋翼无人机视觉伺服智能控制方法

来源 :控制与决策 | 被引量 : 0次 | 上传用户:nnljn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于图像的视觉伺服机器人控制方法通过机器人的视觉获取图像信息,然后形成基于图像信息的闭环反馈来控制机器人的合理运动,近些年开始广泛应用于工业、军事等领域.但是由于经典视觉伺服的伺服增益的选取在大多数条件下是人工赋值而存在鲁棒性差、收敛速度慢等问题,本文提出了一种基于Dyna-Q的旋翼无人机视觉伺服智能控制方法来调节伺服增益以提高其自适应性.该方法首先使用基于费尔曼链码的图像特征提取算法提取目标特征点,然后使用基于图像的视觉伺服形成特征误差的闭环控制,其次本文针对旋翼无人机强耦合欠驱动的动力学特性提出了一种解耦的视觉伺服控制模型,最后建立使用Dyna-Q学习调节伺服增益的强化学习模型,通过训练可以使得旋翼无人机自主选择伺服增益. Dyna-Q学习在经典的Q学习的基础上通过建立环境模型来存储经验,环境模型产生的虚拟样本可以作为学习样本来进行值函数的迭代.实验结果表明,本文提出的方法相比于传统控制方法PID控制以及经典的基于图像视觉伺服方法收敛速度快、稳定性高.
其他文献
四川·西昌长二丙:征战38年归来仍是少年2020年3月24日,长征二号丙运载火箭成功将遥感三十号卫星06组送入预定轨道,发射取得圆满成功。此次发射是长二丙第55次出征。在长
为给内啮合式生物质环模冷压成型机设计提供理论依据,对内啮合式环模成型机关键部件——凸模进行数学建模。采用力学模型及有限元法相结合的方法,对凸模与凹模啮合状态进行受
为分析GPS卫星P1-C1码间偏差对星基增强改正数计算的影响,利用中国广域分布监测站的GPS C1-P2双频实测数据计算GPS卫星钟差和星历改正数,并将其用于定位实验。实验结果表明,GPS卫星P1-C1码间偏差修正前后的卫星钟差改正数计算结果差异较为明显。定位结果表明,在SBAS改正数计算和用户定位时均对卫星P1-C1码间偏差进行修正,可使GPS C1码单频SBAS用户95%三维定位误差降低约19
提出了一种有效识别窄搭接焊缝缺陷的涡流检测方法。首先用经验模态分解提取焊缝涡流信号的特征参数;然后基于主成分分析对特征参数进行降维,去掉其中的冗余信息,得到焊缝的
近年来,伴随着我国经济的飞速发展,人民生活水平逐步提高,我国的休闲农业也得到了迅猛发展。然而同国外及台湾地区相比我国的休闲农业产业还处于初步发展阶段,面临着产业升级
近年来,随着社会对技术型人才需求的加大,高职教育受到了社会各界的广泛关注,尤其是会计专业,受到的关注度更高,由此一来,高职会计专业教师所面临的要求就越来越高,作为一名
利用空间几何原理推导三频消电离层参数和最小噪声直线空间表达式,采用5个静态观测站和1组实测跑车北斗三频观测数据,对比分析北斗三频消电离层模型与双频消电离层模型PPP精度和收敛速度。结果表明,静态条件下,三频PPP的位置误差为3.75 cm,标准差为2.06 cm,收敛时间为109.6 min,较双频PPP性能分别提升22.3%、19.8%、22.1%;动态条件下,三频PPP的位置误差为15.21
为研究坦克的行驶振动特性和越野机动性,通过虚拟样机技术和多体动力学建模方法,对坦克动力学系统进行了拓扑结构分析,建立了坦克多体系统动力学模型,基于谐波叠加法建立了随
针对目前TRIZ和六西格玛设计(DFSS)融合研究多停留在用TRIZ解决DFSS过程中存在的冲突,以及工程问题求解过程中关键问题无法识别的问题,急需将TRIZ与DFSS深入融合以解决工程实际
企业文化与员工福利的关系是什么?这个偏学术的问题,来自一个资深企业文化从业者的困惑。  事实上,很多企业文化工作者,承担一个重要职责,就是处理企业文化和员工的桥梁关系。一部分企业文化工作长期被误解为“花钱部”“唱歌跳舞部”,使得企业文化以活动和福利表现的巨大价值被轻视。  企业文化管理是一种管理方式,这种管理方式以人为核心,经营人、塑造人、成就人。企业对员工的关注,非常重要。  企业文化管理为什么