基于强化学习的行人环境机器人导航研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:liongliong558
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人技术在近些年来得到了不断的发展,在日常生活中的许多场景下已经存在机器人来替代人进行工作。导航和避障能力是智能化的移动机器人最重要的基本能力之一,在近年已经有研究出现,并开始在行人丰富的复杂环境探索。传统的机器人导航主要是用了SLAM技术以及控制规划方法。SLAM技术通过构建环境的地图,为机器人提供全局信息,在地图基础上调用规划方法生成机器人移动路径。这种方法对传感器精度以及构建地图的精度要求较高,对于不同的场景可能需要手动调整参数。随着强化学习的技术发展,已经有研究在机器人领域使用RL进行策略学习。在行人环境下的导航任务中,存在相关研究通过学习人群的特征,以及人群与机器人之间的特者来指导机器人学习导航避障策略,但目前已有的部分工作是基于二维平面的仿真系统进行构建。针对以上问题,本文基于pybullet构建的行人仿真系统,并研究了基于强化学习的行人环境避障方法,具体工作如下:首先,通过pybullet构建仿真系统,参考gym.env类,构建强化学习的仿真环境,提供智能体交互的场景,为强化学习方法提供数据和奖励函数的收集。该仿真系统主要由四部分组成,在environment模块中实现了环境的主体部分,提供了step,reset接口。在agent模块中构建了行人智能体以及机器人智能体,行人移动策略使用ORCA模型,可以引入社交因素,机器人智能体使用了turtlebot模型,实现了经典的动态窗口避障方法。在sensors模块中提供了深度、RGB摄像头,全局地图传感器以及双向路径规划方法。在task某块提供奖励函数的计算。在此基础上实现了两种仿真世界环境,静态环境中之存在结构化墙壁和障碍物,在动态环境下加入了移动的行人模型,同时结合了静态的障碍使得仿真环境更接近现实。最后在该仿真系统的基础上,研究了经典的动态窗口避障方法和强化学习导航方法。强化学习方法与动态窗口方法在静态的环境下效果接近,在动态的环境中动态窗口表现较差,强化学习方法成功率更高同时到达目标点的速度更快,在移动的过程中考虑到了行人的社交因素,与人的平均距离较远。同时研究了不同观测以及奖励函数对实验结果带来的影响。
其他文献
在信息爆炸的时代,各种成像技术迅速发展。红外传感器具有可以在可见度极差的情况下工作和抗干扰能力强等优点,在现代高科技领域发挥着越来越重要的作用,具有十分广阔的发展和应用前景。另一方面,红外图像也存在空间分辨率低和边缘模糊等缺点。因此,红外图像的分析与处理就成为红外图像及其应用中的研究热点。本课题主要研究内容是红外与可见光图像融合研究以及红外图像超分辨率研究。(1)红外与可见光图像融合。红外与可见光
学位
精神障碍是抑郁症的主要特征,严重的精神障碍和高自杀倾向已经成为社会和个人的沉重负担。虽然一些抗抑郁药目前在临床治疗中能有效缓解抑郁症状,但仍存在起效延迟、部分患者敏感性低、副作用明显等一系列局限性。因而,寻找更有效的抗抑郁药物,对于抑郁症的治疗和预防来说是十分必要的。萝卜硫素(Sulforaphane,SFN)是抑郁症的潜在治疗药物,因此我们通过慢性不可预测轻度应激(Chronic Unpredi
学位
跨模态检索是指以一种模态数据作为查询条件来检索另一种模态的相关数据。现阶段的跨模态检索模型在数据的特征提取、不同模态数据间的交互以及相似度计算等方面仍存在提升的空间。因此本文尝试将多模态预训练模型应用于跨模态检索任务中,进一步提升跨模态检索的效果。本文的主要研究工作可以概括为以下三点:(1)基于公共空间特征学习的跨模态检索方法。该方法首先利用目标检测模型提取图像感兴趣的区域特征,然后利用语言模型提
学位
非洲猪瘟是一种由非洲猪瘟病毒(African Swine Fever Virus,ASFV)引起的烈性传染病。猪被强毒株感染后在7-10天内会引起猪的死亡。随着人们对病毒研究的逐渐深入,病毒结构的解析,病毒的侵染方式也得以了解。人们发现被ASFV感染并存活的猪对于该种病毒具有免疫力,这种现象使人们确信疫苗将会是预防非洲猪瘟病毒的有效方式。在前人的研究中,对于非洲猪瘟病毒疫苗的设计从减活疫苗到亚单位
学位
高校是国家创新体系的重要组成部分,随着创新型国家建设的不断深入,科学评估高校科研绩效并积极探索其影响因素,对加快建设创新型国家具有重要意义。文章基于“投入-产出”理论构建了高校绩效评价指标体系,采用AHP和GA-BP神经网络分析法对江苏省4种不同类型高校科研绩效及其影响因素进行分析。结果显示:样本高校综合科研绩效整体呈上升趋势,其中产业发展产出绩效增幅较为显著;各类型高校间科研绩效呈明显阶梯状特征
期刊
2019年新冠肺炎(COVⅠD-19)席卷全球,肺部被新冠肺炎病毒感染后有可能会导致肺纤维化(pulmonary fibrosis,PF)。肺纤维化是一种十分严重的肺部病症,引起病变的主要原因是人体的修复机能对损伤的肺泡组织进行过度或者异常修复,临床表现为干咳、气短。目前肺纤维化疾病主要分为以下三大类:继发性肺纤维化(secondary pulmonary fibrosis)、特发性肺纤维化或原发
学位
我国地理标志主要是在商标法体系下进行保护。当含有地理标志的标识被注册或作为商标使用时,地理标志使用权和商标专用权容易产生冲突。主要表现为商标在授权、确权过程中与地理标志的冲突,以及商标在使用过程中与地理标志的冲突。其争议焦点集中在两方面,一是地理标志能否适用商标的近似性判断标准,以及地理标志的混淆可能性;二是使用地名的行为是否属于描述性使用,以及地理标志产品如果符合产地、品质条件但未获得授权的行为
学位
医学图像分割技术是临床医疗的一种主要辅助方法,但对于医学图像来说,标注数据的获取通常是昂贵的。与自然图像相比,医学图像在分割任务中需要专业医生对其进行筛选和标注,尤其是含有多个器官组织的图像。为了减轻标记人员的工作量,近年来人们提出了许多半监督的学习方法,在减少标记样本数量的同时获得高性能的机器学习模型。另一方面,半监督学习利用少量标注数据和大量未标注数据的学习方式更加符合临床的实际需求,所以在医
学位
申克孢子丝菌复合体(Sporothrix schenckii complex)广泛分布于世界各地,目前发现该复合体包含七种基因型,分别是狭义申克孢子丝菌(S.schenckii sensu stricto)、球形孢子丝菌(S.globosa)、巴西孢子丝菌(S.brasiliensis)、墨西哥孢子丝菌(S.mexicana)、白孢子丝菌(S.pallida)、卢艾里孢子丝菌(S.luriei)、
学位
在华夏五千年文明的孕育下,纸张是中华民族精神文明的重要载体,更是炎黄子孙智慧的结晶。纸质档案以纸张作为载体的一种档案,最先产生在中国,东汉时就已经应用在文件撰写方面,直到如今我们仍然使用纸质档案,其优点较多,便于管理和利用。保护纸质档案是防止文明缺失的一种重要手段,委以吾辈重任。“生物退化”指由于生物的活动导致非生命物质的性质发生不利于人类需求的变化,即非生命物质的内在价值受到削弱。然而纸质档案受
学位