基于增强自编码器的室内物体目标检测与姿态估计

来源 :杭州师范大学 | 被引量 : 0次 | 上传用户:eric_yf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
理解室内场景下物体的类别、位置及姿态是机器人抓取、虚拟现实和增强现实中的人机交互任务的关键先决条件。目前很多算法都是基于场景并不复杂、物体之间遮挡很少甚至没有遮挡、只能处理场景中的单个目标等,不过真实的姿态估计场景中,多为物体摆放杂乱无章、物体间存在被遮挡或自遮挡等复杂场景,所以复杂场景对于姿态估计算法的鲁棒性和泛化性仍然是具有挑战性的研究问题。本文围绕此问题从以下几个方面进行研究:1.对于室内物体间存在许多遮挡问题,本文改进堆栈式去噪自编码器,提出一种基于增强自编码器的室内遮挡目标图像重建方法。算法首先对输入的图像增加随机噪声(如高斯噪声、随机Mask遮挡等);然后将增加过噪声的图像输入给增强自编码器,经过编码、解码后,输出一个与原始图像相同维度的向量;最后将向量转换成与原始输入图像尺寸相同的图像,且此图像是不含遮挡的图像。从重建LINEMOD数据集的图像前后效果对比,表明增强自编码器在遮挡目标重建上是可行的方法,可以很容易与其他网络融合。2.对于很多算法无法处理复杂场景下多目标检测问题,首先改进原始LINEMOD单目标数据集为多目标数据集,然后使用本文改进后的Faster R-CNN网络进行复杂场景多目标实验。对Faster R-CNN改进的内容包括使用网络层数更深的ResNet101作为提取网络来提高网络特征提取能力,参考Mask R-CNN的ROI Align下采样方法来提高下采样精度,降低原始锚点框的尺寸以更适用于小目标物体。修改过的Faster R-CNN对于多目标LINEMOD数据集目标检测有非常好的性能。不过因为数据集中普遍存在大量相互遮挡问题,这对进一步研究会有一定影响。3.对于姿态估计问题,本文使用PnP算法根据物体关键点求出物体6D旋转和6D平移的方法。当从图像中预测物体关键点时,不得不考虑由于目标存在遮挡而无法精确预测出物体关键点的问题,提出首先使用上面的增强自动编码器重建Faster R-CNN输出的目标物体感兴趣区域,然后通过在增强自编码器后面添加全连接层的方法,回归出物体关键点。经过试验证明,即使存在目标被遮挡的问题,算法也能很精确回归出物体关键点。最后利用PnP算法求出物体的6D旋转和6D平移,从而求出物体姿态。相比于其他姿态估计的算法,本采用的方法更加精确,即使图像中目标被遮挡,仍具有很好的性能。4.虽然上面的方法可以精确估计物体姿态,不过算法是非端到端的,所以本文参考强化学习的奖励-惩罚策略,探索研究基于强化学习的端到端室内物体姿态估计方法。算法根据Faster R-CNN输出的每一类物体都有一个概率,且不同概率会影响增强自编码器输出的姿态结果,所以可以通过姿态估计结果与目标检测输出的概率求出概率期望,来进行反向传播,实现端到端的姿态估计算法。
其他文献
余姚地处美丽的长三角经济区,东与宁波市相邻,南与奉化、嵊州接壤,西连绍兴市,北毗慈溪市,交通便利,四通八达,海陆空交通网密布。浙东抗日根据地就位于余姚的梁弄镇,这里是浙
【正】 学校体育是一项育人工作,师专体育系培养什么样的人,怎样培养,这是体育专业教育的根本问题。本文从江苏省盐城市郊区学校体育的调查中,探讨师专体育系教育改革如何面
【正】 本文从高校体育教研室领导、教师的智力结构的分析入手,提出了实现优化教研室群体结构的途径与改革设想。本文认为,教研室群体智力结构应包括年龄、性别、专业、知识
在当前物联网、车联网与人工智能等行业蓬勃发展的大背景下,5G作为新一轮科技革命的核心通用技术,成为了支撑经济社会向数字化、网络化以及智能化方向发展的关键。面对更大的带宽以及超高的速率需求,毫米波以其丰沛且待开发的频谱资源,在5G通信中扮演了不可或缺的角色。为了补偿毫米波在自由空间路径中传输的强损耗,研究者提出将大规模MIMO集成于毫米波通信系统,通过波束赋形技术获取高增益以保证所需的通信质量。相较
学校体育是造就全面发展人的重要组成部份,作者从海口一中的实际出发,总结出成功的发展校园体育的经验。
平禹煤电公司六矿牢固树立科学发展观,立足高起点,定位新目标,以推进"五优"矿井建设为总抓手,以打造本质安全型矿井为目标,以"以人为本、质量为基、科学规划、科技兴矿、文明新
为了更好地解决防突打钻过程中引起的煤尘及瓦斯超限问题,改善工人作业环境,对平煤股份十三矿施工顺层钻孔时的情况进行了分析,利用“负压”抽放的方式进行排渣,即钻杆中利用负压
土壤重金属污染对生态环境安全和人们的身体健康造成的威胁日益严峻,土壤重金属污染的防护和治理工作已经刻不容缓。城郊土壤污染来源复杂,波及到的常住人口范围较大,是当前
赵固二矿顶底板条件复杂,地应力大、巷道空间小,存在底鼓现象。为了实现大型综采设备整体、高效运输,提出在顶底板条件复杂、地应力大条件下,采用无极绳辅助牵引制动车运输方
通过研究鄱阳湖水环境承载力、水污染主导因子及其主要来源,为科学规划鄱阳湖生态经济区的产业布局和发展规模,建设"环鄱阳湖生态经济区"提供理论依据。研究结果:鄱阳湖水资