基于深度强化学习和人工势场法的移动机器人导航

来源 :云南大学学报(自然科学版) | 被引量 : 0次 | 上传用户:hanfenng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对移动机器人在公共服务领域导航任务中的深度强化学习算法所面临的状态信息交互困难、回馈机制不充分和动作探索冗余等问题,提出势场增强注意力深度强化学习PARL算法.首先,利用人工势场法和注意力机制设计势场注意力网络;然后,利用人工势能场理论构建一种全新的势场奖励函数;最后,提出反向近似模型,并结合势场奖励函数的空间划分方式改进动作空间.实验结果表示,使用PARL算法驱动的机器人,自主学习效率得到提高,平均导航成功率和安全率分别为100%和98.2%,与SARL、CADRL、ORCA算法相比,平均导航时间缩短0.14~1.11 s,且导航动作的鲁棒性更强.
其他文献
中国现当代文学作为高校中文本科专业的专业基础课,蕴含着丰富的思政元素,在塑造当代大学生的家国情怀、人文素养、理想信念等方面发挥着重大作用.因此,深入挖掘中国现当代文学课程思政元素,探索课堂教学改革的路径和方法,打造新时代思政金课,显得尤为重要.
知识图谱(Knowledge Graph,KG)中的关联实体发现任务旨在为用户输入的查询实体推荐一组最相关的实体集合.许多实体在KG中没有显式地链接,但隐式地关联在用户生成的数据中.因此,引入用户数据可得到更加丰富的实体关联信息,利用用户与实体的交互信息(记为用户?实体数据)可提高KG关联实体发现的准确性.基于用户?实体数据中挖掘到的频繁项,首先,构建实体关联规则(Entity Association Rule,EAR)对实体间的关联信息建模,并利用置信度评估实体间的关联强度;然后,基于分支限界法算法获得
期刊
针对梯度结构相似性指标(Gradient Structure Similarity,GSSIM)无法对近阈值失真图像做出很好的判断,导致其判断结果与人类视觉系统(Human Visual System,HVS)不完全一致的问题,为提高GSSIM的准确性及其与HVS的一致性,提出了一种基于梯度遮蔽和视觉显著性的图像质量评价指标(Visual SaliencyGradient Structure Si
采用分子对接的方法将实验室获得的44个黄酮类化合物与α-葡萄糖苷酶蛋白进行对接分析,应用Discovery Studio 2.5软件中的Dock Ligand(Libdcok)对接方法,得到LibDock Score以及相应的活性位点,以LibDock Score大于130为筛选标准,得到了排名前10的对接结果,进一步筛选出4种可以有效抑制α-葡萄糖苷酶活性的黄酮类药物.将对接结果以二维图和三维图形式进行展示,推测出ARG1591、ARG1410和GLU1397可能为α-葡萄糖苷酶的活性位点残基,证实了上
用模型无关的方法,选取最新的哈勃参数数据和Union 2.1超新星数据共同限制了距离对偶关系,发现3种参数化因子的最佳拟合值都不为0,但是在1σ置信区间内还是支持距离对偶关系的.然后边缘化了观测限制时超新星数据中哈勃常数取值的影响,限制结果表明,在1σ置信区间内,距离对偶关系与观测数据是吻合的.
基于深度神经网络并利用大规模高质量“〈文本,音频〉”语料库训练的端到端语音合成系统已能够合成出高质量的语音,因受限于语料库规模,低资源非通用语言端到端语音合成系统性能仍有待提升.近年来,自然语言处理领域实现了利用海量无标记文本数据以弱监督方式训练语言模型,BERT等预训练的语言模型被证明显著改进了许多自然语言处理任务.论文基于预训练语言模型探索提升印尼语端到端语音合成系统性能的方法,首先利用上下文信息拼接和词向量拼接方法将BERT预训练词向量信息嵌入语音合成系统,然后在此基础上进一步研究编码器结构对语音合
DNA sequencing is vital for many aspects of biological research and diagnostics.Despite the development of second and third generation sequencing technologies,Sanger sequencing has long been the only choice when required to precisely track each sequenced
研究了第一类Chebyshev加权正交多项式的Riesz算子,利用K-泛函对加权Sobolev空间中函数进行逼近研究,证明了Bochner-Riesz算子在LWp[?1,1]空间中的有界性,得到了K-泛函控制估计,进一步得到对加权Besov空间的刻画.
为克服短时傅里叶变换(Short-Time Fourier Transform,STFT)在应对非平稳血流信号分析的局限性,提出基于集合经验模态分解(Ensemble Empirical Mode Decomposition,EEMD),并根据归一化波动指数(Normalized Fluctuation Index,NFI)选择有效血流成分的新方法EEMD_N.首先,对血流多普勒信号进行EEMD分解,得到本征模态函数(Intrinsic Mode Function,IMF)组,计算IMF的NFI;其次,使