模块化仿蛇机器人建模与自主运动控制研究

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:hoko0428001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模块化仿蛇机器人多关节、超冗余自由度的特性使其能够根据环境变化灵活改变相应运动形式,具有极强的地形适应能力。将此类机器人应用于灾害搜救、军事侦察、管道巡检等领域,将极大提高机器人在以上复杂、受限、非结构环境中的工作效率。目前国内外对仿蛇机器人的研究主要停留在对生物蛇身体结构以及少数几种蛇类运动步态的模仿,机构设计的局限与运动控制方法研究的不完善使其环境适应能力与运动效率难以提高。因此,本文重点研究针对模块化仿蛇机器人的建模与运动控制方法,以期改善仿蛇机器人的运动性能与智能化程度。本文的主要研究内容包括:
  1、基于旋量理论的仿蛇机器人运动学与动力学建模。在对生物蛇运动机理分析的基础上,研究模块化仿生并联关节机构设计。基于旋量理论分析仿生并联关节运动性能,确定机构约束条件与自由度。运用辅助旋量与李代数,研究并联关节速度与加速度求解方法。运用等效机构法结合完整约束,研究蜿蜒步态下仿蛇机器人各关节运动状态与整体位姿之间的关系,建立相应运动学模型。通过建立仿蛇机器人的力与力矩平衡方程,研究其关节驱动力矩与运动状态之间的关系,建立对应动力学模型,为路径跟踪控制提供理论支撑;
  2、基于近似动态规划的仿蛇机器人最优路径跟踪控制。基于微分几何理论结合虚拟完整约束,研究仿蛇机器人动力学模型化简方法。运用约减后的动力学模型结合视线制导策略,构建考虑模型不确定因素的仿蛇机器人最优路径跟踪目标函数。基于动态近似规划,研究以上路径跟踪目标函数对应的哈密顿-雅可比-贝尔曼方程在线求解方法。在此基础上结合经验回放技术,研究评价神经网络权值更新策略,构建仿蛇机器人最优路径跟踪控制在线学习框架;
  3、基于深度强化学习的仿蛇机器人步态自主涌现。运用泰勒展开同策略梯度方程,研究结合异策略强化学习梯度估计的策略融合方法,提高同策略强化学习方法的样本利用率,同时降低策略梯度估计方差,稳定步态学习过程。基于参数空间探索技术,研究针对仿蛇机器人步态控制策略的高效探索机制,提高机器人步态探索效率并保证输出动作的一致性。在此基础上结合异步并行技术,研究分布式解耦的行动-评价深度强化学习框架,最大化数据吞吐量,获得不基于模型的仿蛇机器人步态自主涌现控制策略;
  4、基于元学习的仿蛇机器人运动步态快速生成。运用异方差数据增强技术,研究针对仿蛇机器人动态模型的抗过拟合训练方法,打破机器人历史状态数据集的关联性同时提高训练后模型的鲁棒性。基于元学习理论,构建多任务近似元强化学习训练框架,降低高阶策略梯度估计方差。随后运用该框架从仿蛇机器人动态集成模型中采样“假想”的运动轨迹,降低算法对真实机器人状态数据的依赖,提高其样本利用率。运用并行计算技术,研究针对仿蛇机器人步态搜索框架的分布式训练方法,提高步态控制策略的搜索效率。
其他文献
未压缩的原始视频信号包含巨大的数据量,视频压缩技术的进步使得在有限的带宽中传送高质量视频成为可能。尽管现代视频编码技术已经具有极高的压缩效率,但随着互联网的兴起及超高清显示拍摄设备的普及,视频的数量和质量呈爆炸式增长,当前视频编解码标准的压缩效率仍然难以满足人们对高数量高质量视频的需求。另一方面,近些年在硬件强大的计算能力和互联网大量可获得的数据的支持下,深度学习展现出巨大潜力并在众多领域取得了重
学位
随着智能机器人在日常生活中的普及和自动驾驶技术的发展,同时定位与建图(Simultaneous Localization and Mapping , SLAM)受到广泛的关注。机器人在未知环境下如何进行自主定位与地图构建,是SLAM需要解决的问题。目前,SLAM是室内移动机器人以及室外无人驾驶汽车研究的重要课题之一。  SLAM根据传感器的类型分为激光雷达SLAM和视觉SLAM,激光雷达价格昂贵,
立体匹配技术是当前计算机视觉领域内的研究热点和前沿问题,相较于基于结构光、飞行时间原理的主动式深度获取方式,这类被动式深度获取方式具有分辨率高、功耗低、成本低的优势,在航天、测绘、自动驾驶等领域得到广泛的应用。在立体匹配技术中,通常采用立体匹配算法获取场景的视差,并将视差用于场景深度的计算。在立体匹配算法中,基于图像滤波的匹配算法具有计算复杂度低、运行效率高的特点,其成为当今学界和业界研究的重点,
人体动作识别是目前计算机视觉以及人工智能领域的一个热点课题,在下一代智慧家居,无人商店,智能视频监控,互动娱乐等领域具有广泛的应用前景。早期的人体动作识别研究主要基于RGB视频,容易受到视角变化、光照变化、复杂背景等因素的影响,人体动作识别的精度一直不能令人满意。随着深度传感器技术的不断进步,特别是廉价器件的出现,三维数据如深度图、骨骼数据变得更容易获取。与RGB数据相比,三维数据能够提供场景的三
学位
随着互联网的飞速发展,人们越来越喜欢在社交媒体上发表自己对热点事件的看法和意见,面向社交媒体评论的情感分析逐渐成为当下的研究热点。传统的情感分析方法大多基于有监督的学习,需要大量的有情感标注的数据。然而,情感标签的标注需要大量的人力和时间,在实际中可行性较差。  针对情感标注数据不足的问题,本文提出了基于动态阈值算法和多分类器模型的半监督情感分析方法。该方法以迭代的方式自动标注数据,并通过动态阈值
学位
近些年来,随着智能手机、平板电脑这些智能终端的普及,导致数据流量的飞速指数式增长和数据架构类型的极度复杂化,开创了信息社会发展的新纪元,大数据的概念开始出现在人们的日常生活当中。无线传感器网络(WSNs)作为采集大量的数据的重要来源,如何让传感器节点传输数据量更大的数据,提高网络的吞吐量渐渐成为研究的热点。由于单一的传感器节点体积较小,功能有限,可能会引起数据传输拥堵问题,影响通信质量。所以传感器
在分布式伪卫星组网定位系统中,伪卫星上各独立时钟,因其工作起始相位不同以及周围的环境变化而产生微小的频偏和频移,使组网内各伪卫星时钟难以同步或精度不高,导致定位精度降低。本课题针对分布式伪卫星系统各个独立时钟不同步或同步精度不高的的问题展开研究,通过设计合理的时钟分配方案,采用载波相位观测方程,建立钟差模型,解算和优化组网内各个伪卫星间的钟差,采用各种补偿方法,从而可以实现系统分布式时钟的高精度同
机会阵雷达(Opportunistic Array Radar,OAR)是一种高性能的新型雷达系统,该雷达系统基于数字阵列技术可同时实现多种功能与多种模式的一体化。与传统雷达的阵列分布不同,机会阵雷达阵列单元可以根据需要放置在任意位置。多波束形成技术是实现机会阵雷达的一个重要步骤,本文围绕机会阵雷达数字多波束形成技术展开研究,主要工作如下:  1.本文在研究机会阵雷达原理及其波束形成技术的基础上,
电子战是当今军事活动中不可或缺的一个环节,本质上是通过处理战场上不同频段的各类电磁信号,在充分保障自己安全的前提下赢得军事对抗中的主动权。近年来,人工智能是非常火热的话题,机器学习又是实现人工智能的一个重要途径,未来的电子战必定会广泛使用机器学习算法。本文从信号分选、雷达行为分析和雷达抗干扰三个场景出发,并通过一些机器学习算法对每种场景进行分析。  首先,雷达信号分选是最常见的电子战应用。信号分选
学位
近年来光量子信息通信技术迅速发展,为了读取光子信息就需要研发针对光通信波段的高性能单光子探测器。低温超导探测器凭借极低温下对热噪声的有效抑制,以及超导能隙远低于光子辐射能量而具有极高响应度的优势,逐渐在众多单光子探测器中脱颖而出。本论文以超导微波动态电感单光子探测器(Microwave Kinetic Inductance Detector,MKID)为研究对象,以优化MKID主要性能指标为研究目