三维形状识别的多视图表示研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:dvluxiang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着三维传感器技术的普及与发展,三维数据的获取越来越容易,公开可用的三维形状数据集也在逐渐增加。在三维形状数据上的应用,诸如自动驾驶和机器人技术等都急需三维理解。三维形状的识别任务(分类和检索)是三维理解的两个主要任务,而获取三维形状的紧凑的、高判别性的特征是提升分类和检索性能的关键。在现有方法中,基于多视图的特征学习方法展现了突出的识别性能,而聚合多视图特征对三维形状识别起着非常重要的作用。本文充分利用多视图数据中的信息提升多视图学习性能,聚焦于寻找多视图特征间的高阶相关性存在的潜在公共子空间,在该子空间中对齐多视图特征,获得紧凑的、高判别性的多视图表示,进一步提升三维形状的识别性能。本文的主要研究内容和创新点如下:1.针对多视图数据特征存在的两种显著的性质(基于同一视图类型的特征相似性和不同三维形状类别间的判别性),本文引入联合字典学习的方式,对每一类视图学习一组联合优化的字典,其中包括基于视图特征之间相似性的共享公共字典和基于不同的三维形状类别的特定类别字典,显式地对这两种性质进行建模。将联合字典学习的问题表述为根据Fisher判别准则作为判别促进项对两类字典进行联合优化,并通过对系数的l1范数的约束,确保系数足够的稀疏。最后,引入分裂的布莱格曼迭代算法解决字典系数的优化问题。在刚性三维形状数据集上的实验结果表明了模型的有效性。2.针对三维形状的多视图表示在公共子空间中具有高阶关系的假设,本文引入多任务学习机制,提取多视图特征间的高阶相关性。我们将三维形状识别视为一个多任务的线性分类问题,用于解决不同的视图表示与不同的三维形状之间的相关性问题。通过假设所有任务共享相同的类别标签空间,构造所有任务的模型参数的张量结构。采用基于张量奇异值分解的张量核范数约束和布莱格曼差异约束来完成模型参数间高阶相关性的探索。前者的循环代数不仅可以捕获不同切片间的关系(特定于视图),而且还可以捕获每个切片的不同列之间的关系(特定于三维形状)。这意味着可以同时挖掘不同任务之间以及指定任务本身内部的高阶相关性。而后者可以确保用于映射的矩阵之间的差异可控。线性分类任务的定义保证了最终的多视图表示在每个维度上的具体意义,通过刚性三维形状数据集上的检索实验结果表明了模型对于检索性能的明显提升。3.针对多视图特征的所有干净部分数据都位于非线性流形上的假设,由于它们的局部邻居是线性相关的,可以利用流形正则化来保留嵌入在高维空间中的局部几何结构。本文提出基于超图拉普拉斯正则化约束下的多线性多视图低秩字典学习模型,确保不同视图之间的全局共识的同时,还可以确保特定视图中特征空间的干净部分数据的局部几何结构。在三维形状的训练集上学习多个基于视图的低秩字典,所有的字典构成一个张量,使用基于张量奇异值分解的张量核范数确保字典之间的高阶相关性,确保不同视图间的全局共识,同时为每个视图中干净部分的数据矩阵构造超图,使用超图拉普拉斯正则化来发现局部的几何结构。通过刚性三维形状数据集上的分类实验结果表明了模型对于分类性能的明显提升。4.针对三维非刚性体数据集的样本数量少、类别标签不足的情况,提出一种无监督的学习模型:基于超图拉普拉斯正则化约束下的核化三维形状多视图自表示模型,共同学习映射高维空间中的自表示系数和统一张量空间中的多视图相关性。在特定于视图的特征空间中,为每个视图引入了核诱导映射,以确保自表示系数的可分离性。在统一的张量空间中,对旋转的自表示系数张量采用基于t-SVD的核规范约束,以保持不同视图之间的全局一致性。同时,为每个视图的自表示子空间构造一个超图,使用超图拉普拉斯正则化来发现其局部几何结构。与现有工作相比,提出的模型利用了自表示系数张量的低秩以及嵌入在流形空间中的特定视图特征的局部几何约束。通过多个非刚性三维形状数据集上的检索和聚类实验结果表明,在无监督条件下,它可以达到监督学习方法的识别性能。
其他文献
铝及其合金在航天航空、高铁、舰船、汽车制造及现代建筑等领域有着重要应用,其腐蚀与防护问题也成为研究者们所关注的一个焦点。本论文面向重大需求,通过分析铝及铝合金在海洋环境中的腐蚀与防护研究现状及关键技术问题,开展了 Al及其合金表面ZnAl-LDH膜层的制备、腐蚀防护性能及保护机理的系统研究。主要研究内容及进展如下:(1)通过长时间跟踪Al表面嵌有硝酸根的ZnAl-LDH膜层的阻抗谱、XRD谱图以及
学位
发光金属有机框架(Metal Organic Framework,MOF)材料因其在分子/离子检测、温度传感、白光LED、生物医学等领域的潜在应用,近年来引起了广泛关注。本论文首先简述了金属有机框架的特点、合成方法及其应用领域,其次系统地介绍了发光金属有机框架的特点、发光机理、光功能化策略及研究动态以及它在白光LED和应力发光方面的研究现状。针对传统白光LED用荧光材料存在的高发光效率和短荧光寿命
学位
细胞凋亡受阻是导致癌症发生、发展及抗药性的重要原因。细胞凋亡通路主要分为线粒体通路和死亡受体通路。线粒体不仅是细胞的能量工厂,也是细胞凋亡的调控中心。无论凋亡刺激通过何种通路,一旦作用于线粒体引发其外膜通透化(mitochondrial outer membrane permeabilization,MOMP),导致膜间隙中细胞色素c(cytochrome c,Cyt-c)等凋亡因子外泄,细胞凋亡
学位
高温合金是航空发动机和燃气轮机的关键材料,其研发对我国国防和工业的发展至关重要。其中,新型Co-Al-W基高温合金由于具有较高的熔点,有望发展成为下一代高温合金的候选材料之一。然而,该类合金存在γ’相热稳定性较差、γ/γ’两相成分区域较窄和合金密度较高等缺陷,限制了其在航空发动机领域中的应用。因此,研发兼具优异的γ’相热稳定性和低密度的新型Co基高温合金是该研究领域亟待解决的关键科学问题之一。由于
学位
荧光成像技术因其高灵敏度和高特异性而被广泛应用于化学和生物学研究中。然而,光学衍射极限的存在制约了传统荧光成像技术的空间分辨能力,特别是轴向分辨能力只能达到约500 nm。这一特点极大地限制了研究者们对组织纤维、细胞器等精细生物结构的研究。表面等离子体耦合发射显微技术(Surface Plasmon-Coupled Emission Microscopy,SPCEM)是一种新型的表面增强荧光显微技
学位
使用有机小分子(如甲醇和甲酸等)或氢气作为燃料电池的阳极燃料可以为清洁的电动汽车提供动力。通过原位电化学谱学技术和密度泛函理论能够探索燃料电池的电催化反应机理,并为新型纳米催化剂的开发提供理论指导。合金纳米材料作为燃料电池电化学反应先进的纳米催化剂,极大地提高了电催化活性和稳定性,并引起了广泛的关注。目前,随着纳米技术和表征方法的发展,研究人员可以有目的地合成具有特定物理性质和优异化学性能的合金纳
学位
由于拥有类分子的性质和结构明确易于表征等优点,纳米团簇是在分子水平上研究纳米材料结构和构效关系的理想模型体系,利用团簇体系去研究纳米科学中亟待解决的基础科学问题一直是团簇科学研究者的目标。近年来纳米团簇转化化学的研究备受关注,有目的性地对结构明确的纳米团簇进行后修饰或转化,有助于创造有导向性应用价值的功能材料。在本论文中,重点研究了炔基保护的币金属纳米团簇的转化化学和相关性质研究,围绕溶剂、表面配
学位
电化学还原CO2(CO2RR)为高附加值化学品和燃料逐渐受到人们的关注,因其可作为一种维持碳平衡和能源有效利用的关键技术。太阳能(US$0.04-0.06 kWh-1)和风能(US$0.06-0.08 kWh-1)的电力成本不断降低,逐渐接近化石燃料水平,为电还原CO2带来了机遇。然而设计高效CO2还原电催化剂还存在一些挑战:(1)提高水溶液反应条件下CO2还原选择性,抑制析氢副反应;(2)提高反
学位
三维重建是指从单幅或多幅二维图像中重建出物体的三维模型并对三维模型进行纹理映射的过程。三维重建可获取从任意视角观测并具有色彩纹理的三维模型,是计算机视觉领域的一个重要研究方向。传统的三维重建方法通常需要输入大量图像,并进行相机参数估计、密集点云重建、表面重建和纹理映射等多个步骤。近年来,深度学习背景下的图像三维重建受到了广泛关注,并表现出了优越的性能和发展前景。本文对深度学习背景下的图像三维重建的
期刊
自动图像描述旨在生成自然语言来描述图像的内容,是计算机视觉和自然语言处理交叉研究的关键问题,也是人工智能和人机交互技术的重要组成部分,在客观化报告生成、多媒体信息处理、场景巡查与监控和智能人机交互等领域具有广阔的应用前景。在自动图像描述任务中,机器需要理解图像的视觉语义,挖掘图像中主要的语义概念(物体及其关系),并将其转化为含有主要物体及其关系的文本描述。尽管近年来有不少关于自动图像描述的工作不断
学位