基于CVRL的移动机器人导航控制

来源 :机器人 | 被引量 : 0次 | 上传用户:ivan107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对移动机器人的导航问题 ,本文提出一种具有连续向量输出的再励学习算法(Reinforcement Learning with Continuous Vector output:CVRL) .CVRL具有层次结构 ,低层是单元动作网络层 ,通过组合动作产生连续向量输出 ;高层是建立在组合单元动作空间上的 Q学习单元 ,实现组合动作的选择 .文中给出了 CVRL导航控制器的具体实现 ,并通过仿真实验验证了其有效性 In order to solve the problem of mobile robot navigation, a Reinforcement Learning with Continuous Vector output (CVRL) is proposed in this paper.CVRL has a hierarchical structure, and the lower layer is a unit action network layer, and a continuous vector output ; The higher level is a Q learning unit which is built on the action space of the combinatorial unit to realize the choice of combinatorial actions.The concrete realization of the CVRL navigation controller is given in this paper and its effectiveness is verified through simulation experiments
其他文献
本文介绍了12根冷弯薄壁槽钢组合工字形截面偏心受压柱试验。试验验证了《冷弯薄壁型钢结构技术规范》(GBJ18—87)中压弯构件弯扭稳定性相关公式的适用性。文中通过计算证明:
根据复声强测量基本原理 ,利用 TT1 7S型计算机建立的复声强测试系统 ,对 S493Q型柴油机表面辐射噪声源进行了识别。结合测点的声压频谱图 ,针对该机的实际情况 ,对各表面产
利用JavaBean技术 ,提出并建立了一种新的EmbeddedInternet模型·该模型以Web和JavaBean技术为主要方法 ,解决了远程用户同时控制多台接入到Internet上设备的问题 ,在服务器
基于前向模糊神经网络 ANFIS提出了一种新型的动态模糊神经网络 ( DFNN) ,将模糊逻辑、神经网络和 PID控制器三者的优点有机地融合在一起 .通过在 ANFIS的归一化层和输出层之
分析了TM1600/MA61开关测试仪测量断路器断口的动作时间中容易遇到的问题,并给出了解决办法.
用数值计算方法详细地模拟了VLSI电路中金属互连线的延迟及串扰 .模拟结果表明 :互连线宽W同互连线节距P之比W/P =0 5~ 0 6是获得最小时间延迟并满足串扰限制的最佳尺寸 ,模
通过对3支500 kV变压器套管介损偏大原因的分析,得出了套管末屏对地电容量很大时介损实际测量值的修正计算式.
研制的以8031单片机为核心的测试仪可控制高频高压源的自动升、降压,检测反馈电压及电流,自动测量ZnO避雷器的U1mA及0.75U1mA下的漏电流,测量范围为0~30 kV,过压及过流时自动
基因治疗血管重建术后再狭窄是心血管领域中的重要课题,针对血管内膜增生的分子机制,血管内膜损伤修复、细胞内信号转导的阻滞、细胞周期的调控及细胞外基质的抑制等几个方面
研究了LTCC(低温共烧玻璃 -陶瓷 )N2 气氛下基片排胶效果与铜布线质量。用综合热分析仪分析了LTCC基片N2 烧结 ,发现有机物的排放集中在 1 5 0~ 5 0 0℃区段 ;烧结试样微观断