基于深度神经网络的三维目标检测与识别技术研究

来源 :国防科技大学 | 被引量 : 4次 | 上传用户:gougou316
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉作为一门研究利用传感器和计算机使机器“看”世界的科学学科,已经成为人工智能时代的重要研究领域。相比于二维图像,三维数据具有能提供三维空间几何信息、不受光照纹理变化影响等优势。随着三维数据获取技术的进步、计算能力的增强、深度学习技术的发展以及应用需求的增加,三维视觉技术的研究和应用受到了越来越多的关注。三维目标检测与识别是三维场景理解的关键技术,是机器理解世界并与世界交互的基础,在自动驾驶、智能机器人、AR&VR、遥感制图、生物医疗、战场感知等领域具有极其广阔的应用前景,近年来成为三维视觉领域的研究热点。本文围绕三维目标检测与识别任务深入展开理论与技术研究,并取得了如下研究成果。在三维目标检测方面,从单源数据和多源数据两个角度分别进行了三维目标检测算法的研究。针对纯点云数据的三维目标检测,首先提出了一种基于方柱体点云特征学习的鸟瞰特征图学习方法,利用基于PointNet++的点云网络通过端到端的方式学习鸟瞰特征图,然后提出了一种基于多尺度特征提取网络的鸟瞰图三维目标检测算法。整个算法具有良好的计算效率和三维检测性能,对小目标的检测表现良好。针对点云与图像融合的三维目标检测,首先提出了一种基于投影插值的点云特征与图像局部特征融合方法,并在此基础上构建了一个融合对应的点云特征与图像局部特征的三维目标检测网络F-FusionNet。同时,利用目标的二维包围框与三维包围箱之间的对应关系,提出了一种2D-3D包围框/箱对应损失函数,有助于提高对三维包围箱的估计精度。在三维目标识别方面,从多视图表示和体素表示两个角度分别进行三维目标识别算法的研究。针对三维数据的多视图表示,提出了一种联合卷积神经网络与双向LSTM的三维模型特征学习算法,并设计了一种CNN和LSTM联合网络的训练方法。该算法挖掘了三维目标多视角之间关联信息,提高了三维模型特征表示的辨别力。针对体素卷积神经网络计算量和内存消耗大的问题,提出了一种体素卷积神经网络二值化的方法。该方法通过在网络训练中二值化卷积层和全连接层的输入与网络权重参数,将体素卷积神经网络前向计算中的乘法运算转换为二值比特运算,从而极大地降低网络的计算量和内存消耗。
其他文献
目前,选择性催化还原(SCR)烟气脱硝工艺在火电厂广泛应用。催化剂作为脱硝系统的核心,在经历长周期的运行后,最终将无法满足脱硝性能要求,面临报废处置问题。如随意处置,废弃SC
高效的时间管理法能够帮助行政管理人员妥善规划,合理分配时间,在设定时间内完成任务,达成目标,提高工作的效率,发挥更高的管理效能。本文从行政人员的工作出发,探索高效时间
目的:探讨婴幼儿孤立性先天性主动脉缩窄的临床表现及其诊断治疗。方法:回顾性分析2011年1月1日至2015年12月31日期间收治的孤立性先天性婴幼儿(≤3岁)主动脉缩窄患者,总结其临床
过去数十年,因科研、生产的需要,对工作在深紫外波段(<200 nm)激光器的研究成为一个热门领域。现在工作在紫外、深紫外波段的激光器主要是KrF(248 nm)、ArF(193 nm)和F2(157 nm)准分
肌理语言是国内外设计师关注的话题,茶文化凝聚了我国传统文化的精髓,茶染作为茶文化的一部分,它不仅是一种传统的染色方法,更是一种充满智慧的生活方式,蕴含着深厚的文化和
本文采用1985年全国体质调研的统一要求和方法,对我院18—24岁男女学生的检测资料,按照国家调研组规定的统计方法,制定出我院学生身体素质单项和综合评价标准,为我院每个学生
随着信息技术的飞速发展,我国信息化水平不断提高。2012年,教育部发布《教育信息十年发展规划(2011-2020)》,其中明确提出:以建设优质教育资源和信息化学习环境为基础,以学习型
通过热脱附吸附金丝小枣、骏枣、灰枣3种红枣挥发性成分,利用GC-MS分析鉴定其香气。以香比强值为指标采用主成分分析三种红枣共有挥发物,聚类分析三种红枣共有挥发物成分的差
糖尿病是一种慢性终身性疾病,需长期治疗。糖尿病教育在帮助患者更好地配合医护人员进行治疗,掌握自我管理技巧和预防并发症等方面都有非常重要的意义。不同的糖尿病患者,病情不
冻害是制约北方石榴产业发展的重要因素之一。近年来,石榴抗寒性的研究取得了较大的进展。本文从石榴冻害原因、冻害形成机制、抗寒性鉴定、品种评价、抗寒生理和分子机制以