基于改进强化学习的机械臂无标定视觉伺服控制

来源 :重庆大学 | 被引量 : 0次 | 上传用户:J082214
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机械臂无标定视觉伺服控制不需要对摄像机的内外参数进行精确标定,其利用摄像机获取的图像信息,控制机械臂在笛卡尔空间中的运动,增强了机械臂对控制环境的抗干扰能力,提高了控制系统的鲁棒性。无标定视觉伺服在图像空间设计控制律,利用在线估计的图像雅克比矩阵反映图像特征变化与机械臂关节角度变化的非线性关系。但是由于没有建立精确的视觉映射模型,无标定视觉伺服对机械臂在笛卡尔空间的最优运动轨迹的跟踪并不理想。针对此问题,本文引入了改进强化学习算法,强化学习具备免模型、自学习的优点,能够让机械臂通过自主学习的方式逼近最优运动轨迹。对于标准强化学习算法存在的收敛速度慢,学习效率低的问题,本文基于先验知识优化了强化学习的动作选择策略,缩短其动作探索时间,进而提高强化学习的学习效率。本文的主要研究工作如下:(1)提出了基于改进强化学习的机械臂无标定视觉伺服控制方法。首先基于先验知识改进强化学习,将机械臂与环境交互获得的经验信息作为先验知识,利用先验知识构造一个动作选择函数,将其与?-贪心算法结合,构成强化学习的动作选择策略。利用该策略指导强化学习的动作选择,减少探索最优学习动作的次数,降低学习的任务量。然后基于Kalman滤波算法在线估计图像雅克比矩阵和机械臂末端在笛卡尔空间的位姿,改进强化学习算法根据该位姿评估并调整控制策略,进而优化机械臂在笛卡尔空间的运动轨迹。(2)在MATLAB仿真平台下,利用机器人工具箱和视觉工具箱搭建了仿真环境,并进行了基于改进强化学习的机械臂无标定视觉伺服仿真实验。通过与基于标准强化学习算法的仿真实验对比,验证了在仿真环境中,利用本文所提方法控制的机械臂,在笛卡尔空间具有更优的运动轨迹。(3)基于Denso机器人公司生产的六自由度工业机械臂、RC7M控制器、CCD工业摄像机和PC计算机,搭建了机械臂无标定视觉伺服实验平台,并利用本文所提方法进行了机械臂无标定视觉伺服空间定位实验。通过对比实验,验证了本文所提方法在实物平台中同样具有更好的控制效果。
其他文献
预调酒的爆发让不少食品、白酒大佬动了心,然而近期,这些企业的热情似乎减了不少。目前,预调酒市场上锐澳与冰锐占据着80%的江山,黑牛食品预调酒新品达奇(TAKI)突围之路阻力不
云南作为多民族、多宗教交汇和谐并存发展的边疆省份是中国乃至世界上唯一有汉传、藏传和南传佛教三大派汇聚并存发展的地区,其中南传佛教更为全国独有。宗教作为民族文化的
新华社评出2007年度国内十大新闻;新华社评出2007国际十大新闻;中国法院网等評出“2007年中国十大案件”;中国法院网评出“2007年十大法制新闻”;法学家评出2007年度宪法事例
在20世纪中,中国共产党召开了15次代表大会,各次大会的历史影响与作用各不相同,关键在于纲领和旗帜,在于马克思主义理论的中国化能否与时俱进.
近期,国家海洋局印发《关于开展“湾长制”试点工作的指导意见》(以下简称“指导意见”)。《指导意见》提出,“湾长制”试点要以主体功能区规划为基础,以逐级压实地方党委政府
1998年3月6日,九届人大一次会议所通过的《国务院机构改革方案》,拉开了新一轮政府机构改革的序幕。一年多过去了,国务院机构改革进展如何?有什么经验和特点?对进一步推进政府机构改
文章以500 kV主变为研究对象,总结了变压器故障及套管故障的典型类型及原因,总结了故障排除的方法和步骤,并给出结合历史检修、试验结果、故障录波等综合材料进行诊断的方法
中国首次大规模法律清理即将开始;《老年人权益保障法》修订草案开始起草;最高人民法院首提“四严”刑事政策 ;物权法适用等今年将出司法解释;中国检察机关近五年追回赃款、赃物
信息悬念作为悬念这一叙事技巧上的创新,使观众的信息量大于剧中人,因此观众就会更加关心人物的命运而非事件的结果。信息悬念的设置不能只单纯地停留在某个片断中,而应尽量地在
目的:运动对脑卒中后抑郁(Post-stroke depression,PSD)有神经保护作用,但其具体机制尚不清楚。本研究旨在探索运动训练治疗卒中后抑郁的分子机制。方法:本研究结合经典大脑中