基于视角无关特征的三维物体识别方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:cczxokli
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,三维物体识别技术发展迅速,在汽车自动驾驶、机器人抓取、电子商务、外观专利检索等领域中得到了广泛应用。相较于基于体素信息、点云信息的三维物体识别技术,基于多视角图像的三维物体识别技术依靠高分辨率的二维图像以及较成熟的图像处理技术,取得了较好的识别性能,受到广泛的关注,已成为三维物体识别技术的研究热点。虽然基于多视角图像的三维物体识别技术取得了较大进展,但是仍然面临着一些问题。一方面,现有的基于多视角图像的无监督三维物体识别网络框架一般依靠生成模型的重构能力来实现无监督特征学习,而此类方法普遍存在网络复杂度过高,训练困难的问题。另一方面,有监督的方法通常只考虑三维物体的类别标签,忽略了视角这一重要信息,导致网络学习到的特征对视角的鲁棒性较差。本论文针对上述两个问题,分别从减少复杂度和提高准确度这两方面,基于对比学习和多标签学习,研究了视角无关特征解离方法,通过特征解离来获取对视角更为鲁棒的三维物体本征信息,从而提高三维物体识别的准确度。本文主要研究内容概括如下:(1)研究了三维物体识别相关理论与技术。对三维物体识别技术用到的深度学习网络框架进行了研究,分别研究了Alex Net,VGG,Res Net这三种网络。研究了对比学习相关知识。研究了二元相关性多标签学习方法的基本原理。这些三维物体识别基本理论与技术为研究三维物体视角无关特征的提取方法打下了较好的基础。(2)提出了基于对比学习的视角无关特征解离方法。本论文将自监督对比学习用于多视角图像表示学习,创新性地将多视角图像特征分为视角特征与视角无关特征两部分,通过使用本方法设计的自监督对比损失进行网络训练,使网络能够将三维物体的特征解离为视角特征和视角无关特征。实验表明,本方法能够以一个简单的框架进行三维物体视角无关特征的提取,提取到的视角无关特征有助于提升三维物体识别的准确度。(3)提出了基于多标签学习的视角无关特征解离方法。针对现有有监督三维物体识别网络缺乏视角标签的问题,提出了基于多标签学习的视角无关特征解离方法。首先运用特征交换融合的方式,将视角编码器得到的特征和身份编码器得到的特征进行交叉融合,使用视角标签与类别标签同时对网络进行训练,约束视角编码器和身份编码器分别编码视角特征与视角无关特征。实验表明,通过本方法得到的视角无关特征增加了的三维物体识别准确度。
其他文献
2021年以来,数字化转型在战略层面受到国家和社会的广泛关注,利用数字化技术推动产业转型升级已经成为社会共识。近年间,整车行业随着产业结构调整和汽车行业价值链转移,大量企业通过数字化转型搭建企业资源管理系统、制造执行系统和供应链系统等数字化系统,以期扩宽盈利渠道、降低生产成本、转变商业模式、提升企业核心竞争力。L公司作为国内头部的新能源车企,自创立以来就在高度竞争的市场中探索企业盈利模式和未来发展
学位
经过长年发展,我国手机市场逐渐趋于饱和,许多国产手机公司在白热化竞争中消亡退出,生存下来的手机厂商需要寻求新的利润增长点。全球经济一体化的大背景下,国家提出的“一带一路”合作倡议,为我国手机厂商指明了前进方向:海外新兴市场。相关国家拥有巨大人口潜力和消费需求,是大多数产业的蓝海市场。传音控股作为我国企业开拓海外新兴市场的代表,经过十余年的发展,已经在非洲建立了成熟的盈利模式。论文以传音控股为案例公
学位
随着我国消费结构的转型升级和“新零售”概念的出现,传统零售行业发生了颠覆性的改革。然而,实践证明很多零售企业仅依靠自身力量难以为继。近年来,我国宏观经济进入新常态,战略投资者凭借自身在市场、技术、管理等多方的优势,越来越受到上市公司的青睐,他们为企业赋能,极大促进了它们的发展和转型。“战略投资者”概念的发展,给传统零售企业的独立发展困境带来了新的希望,越来越多的企业开始围绕战略投资伙伴展开合作布局
学位
图像隐写是信息安全领域的关键技术之一,能将秘密信息隐匿在公开图像当中,实现对版权、商业金融、国家安全等领域中的关键信息保护。近年来随着深度学习的发展,隐写算法在嵌入容量、信息提取等方面取得了较大的突破和提升,同时神经风格迁移技术也备受青睐。但风格迁移技术的广泛流行也加速了图像资源被未经许可的篡改、合成和传播,给隐写技术在图像版权保护应用中带来了巨大挑战,究其原因是隐写算法在风格迁移场景下的鲁棒性较
学位
2020年9月22日,中国人民银行与七部委共同发布了《关于规范发展供应链金融支持供应链产业链稳定循环和优化升级的意见》,该意见明确了发展供应链金融的重要性,供应链金融的贯彻推行将有效减轻我国中小型公司的融资压力。然而现阶段我国在供应链金融发展方面表现出信息不对称、难以保证贸易背景真实性、业务管理风险大等痛点问题,而区块链技术具有不可篡改性、可追溯性、去中心化的优点,因此充分利用区块链技术赋能供应链
学位
高光谱图像中包含了大量的光谱信息与空间信息,这一特点使得高光谱图像相比于普通图像更具有应用价值,凭借此优势目前已在农作物长势监测、地质勘测及调查、生物医学、环境监测等诸多领域取得了成功应用。而高光谱分类是遥感技术领域中的一个热点课题,若仅利用光谱特征进行分类会严重影响分类性能,在进行特征提取时得到的特征虽然可以很好的表示图像的空间结构,但在实际应用中往往需要调节参数,并且很难确定最优参数,因此小尺
学位
近年来,汽车发动机制造行业的竞争日趋激烈,各种生产要素的成本不断上涨,发动机制造企业转型升级的压力越来越大,亟需进一步构建与战略调整相适应的成本管理体系,以保持企业的核心竞争力。以价值链分析为基础的战略成本管理模式扩大了传统成本管理的范围,从战略层面优化成本管理,对实现企业成本控制起到了关键作用。LJ公司面临激烈的行业竞争实施了低成本竞争战略,但实施的范围和效果有限,如何保障LJ公司战略成功管理的
学位
光纤随机激光器是一种基于光纤中光信号增益和随机分布反馈效应的新型光纤激光器,具有结构简单、无需谐振腔、输出激光时间/空间相干性弱等优点,有望在光传感与通信、无散斑成像、生物医学检测、激光加工、非线性光学研究等领域获得重要应用。近年来,工作在人眼安全的2μm波段的光纤激光器受到了广泛关注。该波段包含了1940 nm附近的水吸收峰,对组织的穿透深度浅,从而使得2μm波段光纤激光器成为包括非侵入手术等医
学位
面对数据流量的急剧增长,基于空分复用技术的弱耦合多芯光纤是解决标准单模光纤通信系统容量危机的优选传输介质。论文从光波导理论出发,结合弱耦合多芯光纤的设计准则和光学特性,从理论建模、设计优化和实验验证多方面对弱耦合多芯光纤的扩容潜力和传输应用开展研究。论文主要创新性研究成果包括:(1)面向与标准单模光纤的兼容性和系统升级的便利性,在保证传输性能的条件下,探寻了包层尺寸为125μm的弱耦合多芯光纤最多
学位
牙龈疾病(牙龈炎和牙周炎)是由牙菌斑(细菌生物膜)引发的最普遍的牙科疾病之一。由于牙龈炎症表现为牙龈发红(颜色)增加、体积增加(水肿)和表面特征丧失(牙龈表面表现为平滑光亮)。这些病变部位是特定部位的(即受试者口腔中可能有健康和疾病部位,距牙齿边缘厚度约为3mm的牙龈区域)且可以通过牙医的目视检查来识别。此外,牙龈的这些炎症变化也可以通过口腔内摄影来识别,这已成为定期牙科检查的临床实践。本研究的目
学位