基于深度强化学习的主动人脸感知技术研究

被引量 : 0次 | 上传用户:KingofPriser
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
服务机器人是机器人行业重要的一个研究方向。近几年,面向教育、医疗、家居等行业的服务机器人在市场上涌现,但是当前服务机器人行业普遍没有得到用户的良好反应,其主要原因在于技术积淀不足,很多技术问题尚未解决。例如服务机器人为了和人进行友好的交互,一般需要服务机器人的感知器能够主动对准人脸,实现面对面交流的效果。然而现有的方法只能在人脸已经进入机器人视野后,机器人才能意识到已经有人出现,不能通过人的其他身体部位进行判断。另外,服务机器人的陌生人报警和面向不同用户进行个性化交流的功能,都需要机器人进行人脸识别,这就要求机器人能够主动感知人脸所在位置。这样不仅能够在感官上提升人和机器人的交互体验,更是正确识别不同人身份信息的重要条件。在现有的技术方案中,通常需要人配合机器人,自主移动到机器人的视野中,然而在大部分情况下,人只是走进了机器人的视野,机器人却没有或者很难感知到完整的人脸信息。如何让机器人主动的进行人脸感知,并通过调整自身姿态来获取更多有用的信息,这个问题就是本课题着重解决的问题。针对上文所提出的问题,我们希望通过训练得到一个决策网络,该网络能够根据当前机器人所获得的信息推断目标位置并执行相关动作。这一过程被定义为主动人脸感知问题。主动人脸感知问题可以建模为马尔可夫决策过程,从而采用深度强化学习算法训练智能体完成主动人脸感知任务。本文基于深度强化学习算法,实现了主动人脸感知,完成的工作可以分为以下几个方面:1、介绍了主动人脸感知问题的研究现状,通过分析国内外的研究成果,结合服务机器人的实际情况,归纳出本文所解决的问题:在人脸未进入机器人视野的情况下,如何主动寻找人脸。通过对强化学习、深度学习和深度强化学习的理论研究,本文提出了一种采用深度强化学习算法进行主动人脸感知的方法。2、详细介绍了深度强化学习的基础算法深度学习和强化学习,在总结他们的算法原理和优缺点的基础上,概况了深度强化学习在解决主动人脸感知问题中的优势。3、将主动人脸感知问题建模为马尔可夫过程。从理论上论证,本课题提出的深度强化学习方法能够训练策略网络来解决人脸感知问题。4、由于在实际场景中验证算法会花费大量的人力物力,本工作先构建了一个仿真的实验场景。在仿真场景中对算法进行验证,确保算法可行性的基础上,再将算法移植到实际场景中进行验证。5、本文把深度强化学习算法应用在实际的场景中。采用一个主动相机来模拟服务机器人,训练机器人在只看到人脚的时候,能够主动地寻找到人脸。通过实验验证,本文提出的方法有效地解决了主动人脸感知问题,通过仿真和离线两种训练方式,有效的推动了主动人脸感知技术在实际场景中的应用。
其他文献
关隘是人们利用自然地形修建的人工建筑,并有相关机构设置,在中国历史进程中,其作用举足轻重。其首要作用便是军事防卫屏障,另外在对外交流、商贸活动和其他政治、经济活动都
针对多项LOGIT选择模型存在解释变量难以度量的问题,本文构建了网络消费者品牌选择的模糊LOGIT模型。采用三角模糊数来描述定性变量,并利用其均值、方差及模糊隶属度将模糊LO
<正>学界关于康熙十四律的评价褒贬不一、称谓也各不相同。杨荫浏先生在《中国古代音乐史稿》中称其为"十四律制"①,对其是否定的。胡企平先生在《中国传统管律文化通论》中
行人再识别(Person re-identification)技术是判断在不同监控摄像头下出现的行人图像是否属于同一行人的技术。面对海量增长的监控视频,利用计算机对监控视频中的行人进行再
微博是近年来出现的一种网络新媒体,它传播迅速、使用方便。随着互联网使用者数量的增长,特别是近年来手机互联网用户的增加,越来越多的人开始使用微博服务,微博舆情挖掘研究也变
在经济全球化形势日益严峻的今天,团队已经成为我们工作中必不可少的组织形式之一。如何才能使得团队效能以最佳的方式体现,是当今学者不断探讨的问题之一。而在团队效能的前
<正>1988年出现在北京国际摄影周上的"视觉冲击力"成为了中国当时最时髦的词组之一。时至今天,已在设计界、绘画领域、影视圈里出现,甚至在更多的领域里传播。这是一个怎样的
音乐剧选择演员常见的标准就是综合考察演员在歌唱、舞蹈、戏剧表演三方面所具有的基本功,及其综合表现力是否达到专业化水平。所以,音乐剧对其演员的基本要求就是能歌善舞、
为了解小麦叶绿素荧光参数间的相互关系,在大田条件下应用PAM-2100型叶绿素荧光仪对18个冬小麦品种(系)叶绿素荧光动力学参数进行了不同生育时期的观测,分析了冬小麦叶绿素荧
目前济南烟草公司配货都是由烟草零售商先统计销售情况,根据需求进行电话订购,由烟草公司工作人员人工进行记录后安排配货。这种配货模式显然既费时又费力,在几十个亿销售额