基于深度学习和多相机融合的实时目标检测和定位

来源 :山东大学 | 被引量 : 0次 | 上传用户:aulanb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在过去的几年里,基于单目图像的二维目标检测已经取得了飞速的发展。图像二维检测的结果可以帮助获取图像中的语义信息,便于感知真实世界。然而,仅仅拥有图像的语义信息并不能与真实环境进行交互,这需要感知真实的三维空间信息。准确的感知周边环境可以帮助我们在三维空间躲避障碍物,安全导航。三维的感知能力主要包括三维的检测和定位。对于自动驾驶领域来说,三维感知是非常关键的部分。本文提出的算法主要就是应用于自动驾驶方面。基于二维检测框架SSD,我们提出了全新的三维深度学习检测框架SS3D。SS3D是基于单目图像作为网络输入,然后预测得到带有朝向的三维包围盒,进而实现三维空间的检测和定位。三维检测器的实现是基于二维包围盒的检测结果,姿态的估计以及三维维度的预测,然后利用几何限制和投影关系计算得到三维带朝向的包围盒结果。除此之外,我们还进一步研究了 SSD的候选框空间分布,然后提出了一种能够更优匹配训练数据的分布方法,便于更好地训练。为了加强SS3D对于困难数据的检测性能,我们提出了一种困难数据合成方法,增加更多遮挡的训练数据,进而提升检测能力。候选框分布和困难样本的合成方法都很简单有效,在KITTI数据集上也做了一系列的对比实验和比较,进一步阐述了 SS3D的性能。
其他文献
摘要:本文研究了不同的热处理工艺条件对Ti-Ni形状记忆合金的相变点和微观组织影响,制备了满足相变点使用需求的合金,并且利用溶胶-凝胶法对Ti-Ni形状记忆合金进行表面改性,得
海兽葡萄纹铜镜该铜镜圆形,厚重,质地泛白,以高浮雕葡萄纹为主题纹饰,间饰海兽、鸟雀、蜂蝶、花草等图案,华丽而繁缛。其构图方式分作内外两圈,由于葡萄及长瓣花之枝蔓由内圈
期刊
“V得/不C”是现代汉语中常见的表达“能性”意义的结构之一。孟琮等《动词用法词典》将其列为动词的一个重要功能项。目前为止专门研究“V得/不C”结构的文章不是很多,大多
无锡冷冻胚胎案二审判决似乎赢得了一致好评,学界对于该案之关注多集中于冷冻胚胎性质之探讨,但却忽略了本案隐含的有关原则、规则之问题。法官处理此类法律规则之外问题时需要
本文从语用学的角度对中国相声中的刻意曲解进行了研究。文章从东北师范大学超星图书馆、网络和各种关于相声的书籍中收集了大量的语料,对刻意曲解进行了定性研究。整个研究
在交替传译活动中,由于时间的紧迫和译员短期记忆的局限,记笔记成为完成交传任务和促进交传表现的一个重要手段。交传笔记是通过纸张的有效利用,以非特定语言的符号记下,在视
运用现代信息技术开展的电子招投标活动,是创新和发展招投标运作机制的有益探索,不仅有利于解决传统招投标模式下存在的成本偏高和效率低下等问题,而且对于增强招投标活动透
随着国民经济的增长和群众生活水平的提高,中国机动车数量以前所未有的速度增长。汽车驾驶类指南图书大量涌现在图书市场,这些驾驶指南大多语言风格较为严肃,内容也比较专业难懂
最近,移动增强现实(AR)正成为最迫切的研究内容。AR利用计算机图形学并通过将现实世界与计算机生成的虚拟图像相结合以构建能响应用户输入的现实世界。随着移动应用的进步,用户设备如手机,笔记本电脑,平板电脑变得非常流行和方便。但由于AR应用的密集计算和高电池能耗特征,我们无法充分实现其优势。移动云计算概念虽然可以克服计算和电池能耗问题,但是会引入延迟,因为信息需要以网络拓扑形式从强大服务器发送到远端用
亲属称谓是汉语词汇系统中一个重要的子系统。其产生与变化受到家庭观念、宗法制度、儒家思想等因素的影响。本文从文化角度分析亲属称谓,从类型学的角度,比较相近文化圈内亲