基于强化学习的超冗余机器人末端位置控制

来源 :机电一体化 | 被引量 : 0次 | 上传用户:ya4516623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
超冗余连续体机器人因其细长结构,在受限空间具有重大应用价值.连续体长时间使用后由于摩擦、耗损等问题导致控制精度下降,影响性能.针对连续体机器人末端位置精确控制问题,对比有模型和无模型的控制方法,并搭建仿真和实体环境进行验证.实验结果表明,无模型方法适用性高,能实现较为复杂的运动规划,但是与环境交互次数过大,无法开展实体训练.基于模型的控制算法,采用集成方式表达环境状态转移模型,在少量交互下实现末端位置误差稳定收敛,具有较好的控制效果.
其他文献
新能源并网逆变器在弱电网下易诱发宽频带振荡.为分析振荡失稳的发生机理,首先基于复矢量传递函数方法建立了计及锁相环影响的三相LCL型并网逆变器阻抗模型,然后分析了频率耦合的机理.在此基础上推导出并网逆变器系统与电网阻抗交互作用的等价输出阻抗模型,应用阻抗稳定性判据分析了锁相环对并网逆变器稳定性的影响.为抑制锁相环对并网逆变器系统稳定性带来的不利影响,提出了扰动电压前馈补偿的改进控制策略.最后通过Matlab/Simulink搭建模型进行仿真,验证了基于所建立阻抗模型判别稳定性的准确性和改进控制策略的有效性.
Strict air pollution control measures were conducted during the Youth Olympic Games(YOG) period at Nanjing city and surrounding areas in August 2014.This event provides a unique chance to evaluate the effect of government control measures on regional atmo
为提高和保障电网安全稳定控制系统控制策略(简称稳控策略)的实现效率和可靠性,研制了一种基于UML活动图的稳控策略的自动编程实现方法和基础平台.首先,抽象稳控策略的最小元素和动态行为元素,提出稳控策略动态行为描述方法,建立基于UML活动图的稳控策略模型和抽象语法树.然后,规范稳控策略模型的存储标准及格式,制定模型到代码的映射规则,基于抽象语法树使用深度优先搜索算法将模型自动转化为嵌入式系统可执行代码.最后,构建稳控策略模型至主体代码自动生成和辅助代码自动补全的软件技术框架并研发实现.结合4个大型稳控系统的新
深度学习是感知智能电网暂态安全状态的有效方法,针对多层重构学习过程低维特征及结构参数难以全局寻优的问题,提出了一种改进深度置信网络(Deep Belief Network,DBN)方法.首先,该方法利用SMOTE过采样算法,增加样本多样性,促使DBN深层架构的挖掘.其次,直接面向噪声样本,DBN通过网络中各神经元吉布斯抽样的二值状态,增强重构特征的抗噪能力.最后,建立了基于遗传算法(Genetic Algorithm,GA)的GA-DBN模型,有效解决DBN结构参数调试繁琐的问题,确保DBN高精度地从底层
针对当前广泛应用于重载列车的CCBⅡ制动机系统关键技术国产化程度较低、传统网络协议组网复杂的问题,本文引入CANopen网络协议,对CCBⅡ制动机系统的网络控制技术进行研究.在对CCBⅡ制动机组成结构及工作原理进行剖析的基础上,提出了基于CANopen协议的制动机网络控制系统总体架构,完成了控制网络中基本功能控制节点的软硬件设计.其中硬件部分完成了通用型功能控制节点的硬件设计;软件部分则针对主、从节点分别完成了基于CANopen的通信调度与控制功能模块的设计.最终对CCBⅡ制动机系统进行“五步闸”功能测试
安全稳定控制装置作为保障电网安全稳定运行的第二、三道防线核心二次设备,关键部件国产化程度不高,亟需国产化改造.为解决安全稳定控制装置自主化面临的主控芯片选型困难、处理器实时性稳定性不高等问题,从芯片自主化标准的研究出发,提出了一种基于龙芯处理器的安全稳定控制装置系统框架,主要包括整体平台架构设计、核心功能模件设计、实时数据交互、兼容性设计,以及基于该平台的稳控应用设计等.从硬件和软件两方面对自主可控稳控系统装置平台设计原理进行了阐述.基于该平台方案设计的安全稳定控制装置已在多座变电站挂网试运行,运行情况良
Biochar,carbonaceous material produced from biomass pyrolysis,has been demonstrated to have electron transfer property (associated with redox active groups and multi con-densed aromatic moiety),and to be also involved in biogeochemical redox reactions.In
Ultraviolet (UV) assisted zero-valent iron (ZVI)-activated sodium persulfate (PDS) oxidation(UV-ZVI-PDS) was used to treat waste activated sludge (WAS) in this study.The dewaterabil-ity performance and mechanism of WAS dewatering were analyzed.The results
Concurrent ground-level ozone (O3) pollution and anthropogenic nitrogen (N) deposition can markedly influence dynamics and productivity in forests.Most studies evaluating the functional traits responses of rapid-turnover organs to O3 have specifically exa
为提高智能变电站继电保护测试效率,解决数字式继电保护试验装置无法对整个测试过程中出现的故障自动进行诊断的问题,提出基于长短期记忆(Long Short-Term Memory,LSTM)网络的继电保护测试故障诊断方法.梳理了故障断面特征信息和故障类别,建立了多故障诊断模型,构建了故障诊断流程.以典型220 kV继电保护测试为例,通过将LSTM与循环神经网络、BP网络和深度神经网络进行对比,得到输入实际故障信息和部分不可靠信息时LSTM模型的三项评价标准(平均绝对误差、准确率和综合评价指标)值均最优.通过实