【摘 要】
:
机器人操作是机器人实时交互、改变外界环境以完成指定任务的核心手段,在工业智能制造、服务产业和日常生活中均起着重要作用。其中机器人的灵巧操作可以代替人类执行复杂任务,一直是学术界研究关注的重点。然而,机器人的灵巧性也意味着其往往具有高维的动作空间,并且会面对动态、复杂的任务环境。欠驱动机器人自身行为的不确定性、模型的不精确性、环境感知能力不足和噪声影响对操作过程的干扰,机器人行为缺乏可解释性等限制给
论文部分内容阅读
机器人操作是机器人实时交互、改变外界环境以完成指定任务的核心手段,在工业智能制造、服务产业和日常生活中均起着重要作用。其中机器人的灵巧操作可以代替人类执行复杂任务,一直是学术界研究关注的重点。然而,机器人的灵巧性也意味着其往往具有高维的动作空间,并且会面对动态、复杂的任务环境。欠驱动机器人自身行为的不确定性、模型的不精确性、环境感知能力不足和噪声影响对操作过程的干扰,机器人行为缺乏可解释性等限制给操作任务带来了挑战。如何面对这些挑战,设计优化机器人本体和控制策略来实现机器人的灵巧操作是亟待解决的问题。本文以非结构化场景中的欠驱动机器人操作为场景,从本体参数优化和安全控制、主动感知和控制策略迁移、子任务划分和任务规划三个层面展开研究,综合运用解析建模、强化学习、模仿学习等方法,来提高机器人性能、安全性和行为可解释性。主要工作内容如下:(1)研究了欠驱动柔性机器人简化模型下本体参数优化和安全控制的问题。针对柔性机器人具有高冗余运动自由度,缺少解析优化和控制方法的问题,首先提出近似模型结合数值迭代方法,用于驱动器参数估计和性能优化。近似模型能够优化设计参数,提高驱动器的性能指标;其次,针对柔性连续体机器人只能被动柔顺适应环境,无法进一步保证安全性,提出利用固有振动特性建立冲击模型,实现碰撞检测、主动安全反应。实验结果表明,提出的设计优化方法可以高效地评估柔性机器人性能参数,安全响应方法能够在本体层面实现可靠地主动安全控制。(2)研究了环境主动感知、动力学建模和强化学习控制策略迁移的问题。针对非结构化环境中缺少对环境物体感知能力的问题,提出主动策略感知用于操作过程中对物体表面的软硬度探索;其次针对策略迁移到新环境时产生的域偏移而导致失效问题,提出同步估计环境动力学参数和优化控制策略方法,结合先验模型和数值优化理论实现基于模型的强化学习策略引导搜索和自适应迁移学习方法。实验结果表明,提出的主动感知策略可以提高机器人对外部环境的感知理解能力,同步模型参数估计和策略搜索方法可以有效修正环境参数误差和提取先验模型信息,从而确保更快速适应新环境和实现策略迁移。(3)研究了利用先验动作基元信息进行子任务识别和分割,实现机器人任务规划的问题。针对强化学习端到端结构缺少可解释性以及对状态空间的约束,难以保证策略可靠性的问题,提出具有明确物理含义的两层策略网络结构及其稳定化训练方法。针对传统机器人任务规划方法无法表达复杂的灵巧操作过程,数据驱动方法则缺少对机器人行为的可解释性等问题,提出利用目标导向的动作基元结合模仿学习方法,将多阶段的复杂任务拆分成对齐的基元子任务,并提取子任务执行目标。实验结果表明,提出的策略结构和训练方法具有更高的鲁棒性,任务规划方法可以更深入地提取的专家示教信息,在动态变化的环境中能够实现行为可解释的复杂任务规划、提高操作者的主观信赖度和提高环境危险态势感知能力。
其他文献
二维类石墨烯材料如氧化石墨烯(GO)和过渡金属碳化物(Ti3C2Tx)因其独特的层状结构和优异的物化性能,在含铀放射性废水修复领域中具有广阔的应用前景。这种应用伴随着它们在水环境中的存在,以及对生物群落和人类的潜在生态风险。目前,如何有效去除水中吸附剂材料和微量放射性核素已经成为亟待解决的热点问题,吸引了越来越多的关注。聚集和光降解是进入自然环境的类石墨烯材料的胶体稳定性的两个主要方面,控制着它们
人力资源是社会主义市场经济体系的重要组成部分,企业的发展离不开人才的助力,而人力资源服务公司的存在意义则是为企业解决“用人”烦恼。云南的人力资源服务行业发展相对滞后,因此还有广阔的市场空间。云南YC人力资源服务公司作为云南成立最早的人力资源公司之一,在云南的网络招聘市场中占据有利地位,但由于产品单一、无法满足客户多样化的需求、同质化严重、营销效率低等原因,导致营业额及利润无法长效提升。本文的分析是
在“双减”背景下,如何减轻学生的课业压力、提高课堂教学质量成了各校教师亟待解决的问题。有关学者给出了很多“增效减负”的方法,合作探究教学是其中较为突出的一种。本文以初中生物课程为切入点,探析合作探究的运用模式。
<正>阅读小关卡小朋友们,请你们根据文中关于三扇门的描述,来为阿宁匹配记忆。第一扇门:开出一朵朵淡紫色小花的门第二扇门:有蓝色油漆的门第三扇门:原木色的门我从医院出来不久,就被一只熊拦住了。他看起来就像只真熊,但我知道那肯定是哪家公司或者商场在搞活动。"你知道时间博物馆吗?"他瓮声瓮气地问我。
TiO2作为在环境、化学品合成等方面具有重要实际应用的半导体而被广泛研究,同时也被用于复杂光催化反应体系基础研究。TiO2表面形貌调控、金属负载以及缺陷调控可以有效提高光催化反应效率,但由于催化材料的复杂性,目前关于反应机制的详细研究相对较少。基于表面结构均一的模型催化材料的表面化学研究是一个行之有效的策略。本博士论文主要基于单晶模型催化材料,包括天然锐钛矿TiO2(001)表面以及Au/TiO2
在钻井作业中,由于地质构造复杂、技术措施不当等,卡钻是钻井过程中常见的井下事故,采用震击器解卡是主要解卡方式。在直井中会遇到卡钻问题,在水平井中的卡钻问题更为复杂,水平段的钻柱躺在井壁内,当钻柱运动时,会产生较大的摩擦阻力,为此,本文针对直井和水平井两种工况,分别对安装了液压式钻柱震击器的钻柱进行解卡效果的研究分析。研究直井和水平井纵向振动产生的震击与解卡效果,对钻井解卡有着重要的实际意义。本文主
为了理解二维拓扑场论的几何基础,Dubrovin B.在1996年引入了 Frobenius流形的概念。后续的研究表明,它在Gromov-Witten不变量理论、奇点理论、可积系统理论等不同数学分支中都起到重要作用。与此同时,研究如何构造Frobenius流形也是重要课题之一。在本论文中,我们主要研究如下两个问题:(Ⅰ).在拓展仿射Weyl群(?)(k,k+r)(R)的轨道空间上是否存在Frobe
公私伙伴关系(Public Private Partnership,简称PPP)是包含合作制度、组织构建、设施建设、服务运营等要素的总称,其基本含义是指政府与私人部门就某项公共产品的供给、运营共同出资,通过合作发起设立一个混合型企业,开展相应的设施建设和服务。PPP项目具有强化政府与社会资本之间的关系、各取所长、分担风险管理以及缓解政府财政压力等多种功能,同时也可满足私人组织实现其战略目标方面的特