基于全景图的三维物体分类算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:liond1803
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维物体分类算法作为三维理解中的核心算法,在实际生产生活也得到广泛应用,例如人机交互技术和自动驾驶技术。本文以三维物体分类任务为目标,重点研究了基于全景图的三维物体分类算法,分别探究了全景图的局部信息、全景图与点云数据的多模态融合以及全景图的旋转不变性,并提出了改进的深度学习算法。具体工作如下:1.探究全景图的局部信息。本文在原有点云空间分布全景图的算法基础上,引入了结合了三维物体大小信息的点云空间梯度分布图的生成算法,然后将单通道的空间分布全景图、竖直方向梯度图和水平方向梯度图按照次序拼接成一张三通道的全景图。对于每个三维物体,本文基于空间直角坐标系中X轴、Y轴、Z轴,投影得到三张三通道的全景图。同时,本文以VGG16二维图像分类网络作为骨干网络,提出了多分支的深度学习网络,充分学习每张全景图的高阶特征。最后,将三维物体对应的多通道全景图送入多分支深度学习网络中,得到三维物体的分类结果。2.探究全景图与点云的多模态融合。本文在原有基于全景图的三维物体分类算法基础上,引入了基于点云的三维物体分类算法PointNet,进行三维物体全景图模态和点云模态的算法决策融合。对于每个三维物体,本文首先按照第一个工作所述的多通道全景图生成算法,获取到基于X轴、Y轴、Z轴投影得到的三通道全景图;然后对点云数据进行上采样,确保送入到深度学习网络中的点云数目是统一的;最后本文将三维物体对应的多通道全景图和规范化的点云送入到多模态深度学习网络中,得到三维物体的分类结果。3.探究全景图的旋转不变性。本文在原有多通道全景图生成算法的基础上,引入了基于高斯曲率值的三维物体校准模块。该模块主要作用是对输入的三维物体进行校准,确保无论三维物体如何旋转平移,校准后都是同一个朝向角度。这样就能够使得该三维物体最终投影得到的全景图具有旋转不变性。
其他文献
主动再生冷却技术是一种用于超燃冲压发动机的热防护技术。其中碳氢燃料在超临界状态下,流经冲压发动机外壁面内的微小通道,对发动机进行冷却,同时完成碳氢燃料的预热,燃烧效率得到提升。超临界状态下碳氢燃料的热物性随着温度发生剧烈的改变,研究微小通道内超临界碳氢燃料的对流换热特性与机理,对于主动再生冷却技术的应用与发展具有重要意义。本文通过数值模拟方法,以超临界碳氢燃料航空煤油(RP-3)在不同流道截面冷却
学位
随着能源需求问题的日益突出和工业技术的飞速发展,传统纯流体由于导热系数较低而无法满足先进热科学领域的工业需求。纳米流体作为一种新型的换热工质,有望解决此类问题。在纳米技术日益进步的过程中,人们不应忽视磁场对纳米磁流体的影响,例如生物工程中利用磁源来改变磁流体的流动方向。本文研究了Cu O-H2O纳米流体的自然对流,以阐明磁场对纳米流体流动和传热的影响。由于其微观本质和介观特点,格子Boltzman
学位
目的:观察中药穴位敷贴专项护理应用于支气管哮喘(BA)患儿的效果及对免疫功能的影响。方法:选取94例BA患儿,按随机数字表法分成2组各47例,对照组为常规干预,观察组为中药穴位敷贴专项护理。分析2组患儿临床疗效,并比较干预前后圣乔治呼吸问卷(SGRQ)评分及免疫功能。结果:观察组总有效率为95.74%(45/47),对照组总有效率为74.47%(35/47),观察组总有效率显著高于对照组(χ~2=
期刊
聚合物-液晶复合材料由于其良好的稳定性与调控性,以及在显示、光电子及生物医药等领域的应用前景,引起了研究者们强烈的兴趣。作为其中的一类,液晶-聚合物模板体系,由于特有的“清洗-再填充”特性,赋予其极大的灵活性,扩大了聚合物-液晶复合材料的应用范围。各种基于该体系的新型光学器件层出不穷,打破了传统单一的电场调控方式,实现了器件光学性能调谐的多样化。而基于光引发聚合体系的全息聚合物-分散液晶体系更是在
学位
半导体激光二极管已经包括了从太赫兹到紫外的广阔波段,在工业、交通、通信、信息处理、医疗卫生以及文化教育等多种领域都有着非常重要的应用。本文所研究的就是对用Ⅲ族氮化物半导体材料设计的深紫外激光二极管(Deep Ultraviolet Laser Diode,DUV-LD)的性能进行优化。由于Ⅲ族氮化物材料的激光二极管具有可以直接包含蓝光、绿光、紫光和紫外光的比较大的禁带宽度,并且它的发光特性远远优于
学位
传统对企业经营状况分析主要以企业的财务报表为基础,而财务报表一般只有上市公司才会公布,因此在缺乏财务报表情况下难以利用传统方法判断企业的经营状况。目前对此方面的研究较少,因此本文基于数据挖掘方法对企业经营状况分类,同时挖掘出影响企业经营的重要因素,研究具有一定的应用价值。首先分析企业经营相关的发展现状并且记录下可能影响企业经营的潜在因素,其次利用Python爬虫爬取数据构建企业数据集,再次经过数据
学位
本文介绍了在传统溶剂催化液化的基础上增加等离子体技术液化剩菜剩饭的一种新型转换工艺,具有液化时间短,效率高,装置简单,能耗低等优点。实验主要研究了等离子体电解液化剩菜剩饭的反应途径和催化机理。实验前,我们首先对等离子体电解特性做了研究,放电模式从最初的丝状辉光放电转换为火花放电,电压电流曲线也出现两个明显趋于稳定的变化,这主要是由于剩菜剩饭中含有大量水分。在等离子体电解液化实验过程中,我们探究了一
学位
改革开放成功地激发了企业活力,中国市场经济逐渐繁荣,但是许多企业在追逐利润的过程中未履行相应的社会责任,导致企业与其他个体之间的冲突加剧。随着环境污染、财务造假、员工压榨、产品安全等社会问题不断被曝出,企业社会责任(以下全文简称为“CSR”)逐渐走进人们的视野。而管理层作为公司战略制定与执行的决策者之一,其权力特征不仅决定了企业行为是否贯彻管理层意志,同时也会对管理层自身的行为产生影响,这些最终都
学位
随着工业科技水平的提高,显示技术的急速发展逐渐模糊了图像与真实世界之间的界限。通过分析二维图像背后隐藏的三维信息,生物大脑可以根据图像中的特征信息来自组织构建三维立体模型。为了更好的凸显二维图像中的高维信息而引入视错觉复现系统,其对提升三维成像效果具有不可忽略的影响。本文针对视错觉复现系统在三维成像系统中的应用涉及到的关键技术,首先介绍视错觉生物机理,重点分析了视神经细胞感受野,特别针对其具有方向
学位
人体动作识别是计算机视觉领域中一项重要且具有挑战性的任务,基于骨骼的人体动作识别由于人体骨骼数据的鲁棒性和易获取性在该领域引起了广泛的关注。近年来,随着深度学习的发展,利用图卷积网络将人体骨骼建模成时空图来探索人体关节的内在联系,取得了显著的效果。然而,现有方法忽略了关节之间的远程依赖关系,固定的时间卷积核会导致时间建模缺乏灵活性,而且现有模型往往过度参数化,加大了计算成本。针对这些问题,本文基于
学位