基于全景图像目标检测的室内定位系统

来源 :天津大学 | 被引量 : 0次 | 上传用户:aaaldj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着工业4.0概念的提出,信息化技术被广泛应用到工业生产中,制造业正在向智能化转型。在智能化生产中,位置是一种不可或缺的信息,高精度室内定位技术的市场需求日益增长。基于计算机视觉的定位技术具有精度高、稳定性好、无需额外设备的优点,是提供室内定位服务的理想方案。本论文提出一种基于全景相机的室内库房定位系统,用于为AGV小车提供高精度室内定位服务,主要贡献包括:(1)设计了一种定制标签作为定位锚点,使用全景相机采集不同位置和角度的库房环境图像,并对图像中的定制标签进行标注,构建用于目标检测的全景图像数据集。根据全景图像定制标签检测任务的特点,设计一种轻量级全景图像目标检测网络结构,并融入可变形卷积、通道注意力、多尺度特征融合等机制。实验结果表明,在全景图像数据集上,该网络的检测准确率达到97.06%,性能优于目前常用的目标检测网络。针对全景图像数据集中存在的图像畸变严重、光照分布不均、类别不平衡、标签尺寸差异大等问题,采用多种数据增强方法,包括坐标变换、Retinex Net网络、多尺度训练等,深度挖掘训练集信息。实验结果表明本论文采用的数据增强方法对模型准确率有1.39%的提升,具备有效性。(2)为进一步减少模型参数量和计算量,采用模型压缩算法对全景图像目标检测网络进行处理,使用通道剪枝方法去除网络中的冗余通道,并针对剪枝后模型精度难以恢复的问题,提出一种针对目标检测网络的知识蒸馏策略,大幅恢复剪枝后模型的精度。在不损失模型精度的前提下,将计算量和参数量压缩为原始网络的40.63%和31.33%;在损失6.93%精度的前提下,计算量和参数量被压缩为原始网络的9.76%和14.89%。(3)在华为Atlas200 DK开发板上构建一套完整的端到端实时室内定位系统,使用NPU对模型推理进行加速,采用并行化策略对后处理过程进行优化,并在实际场景中验证了系统可行性。本论文在真实库房环境中对定位系统进行测试,系统实际的定位精度可以达到分米级,定位速度达到26 FPS以上,能够提供实时、高精度的定位服务。
其他文献
行人重识别是计算机视觉领域内判断图像或者视频中是否存在特定行人的技术,即给定一个行人目标,检索跨设备下的该行人图像。行人重识别作为一种复杂的目标检索任务,需要大量的训练数据集。由于生成对抗网络(GAN)可以利用输入信息生成新的图像,研究者们利用GAN进行数据集扩充或者生成特定的图像以解决行人重识别问题。但是与数据库中的原图相比,生成图像质量较低,如果直接用来训练特征学习模型,对于分类准确性的提高是
学位
随着信息化时代的发展,各领域对大视场高分辨率图像的需求日益提高。单幅图像在大视场和高分辨率之间的矛盾,可由图像拼接技术通过将有重叠信息的多幅图像拼接为一幅图像而有效解决。然而拼接结果图像相较于原始图像,在信息总量上有明显的增长,从而导致存储图像所需的存储资源或传输图像所需的带宽资源也急剧增大,不利于对图像的实时处理。因此,如何实现图像的实时拼接与压缩具有非常重要的研究意义。为满足上述需求,本文设计
学位
水下图像作为我们认识、探索、开发海洋的主要媒介,在海洋工程、资源开发、军事部署等海洋领域扮演着不可或缺的角色。然而,特殊的水下成像环境会导致拍摄的水下图像出现颜色失真、对比度低、细节模糊等退化现象,因此,水下图像增强技术具有重要的科学意义与应用价值。针对水下特殊成像环境与现有水下图像增强方法的不足之处,本文设计了基于深度学习的水下图像增强算法,主要研究工作包括:(1)为解决水下图像样本数量及多样性
学位
风电机组在工作过程中,齿轮箱机舱会出现局部温度过高的现象,本研究使用SolidWorks软件对风电齿轮箱机舱内的空间进行三维建模,基于Fluent软件工具对机舱内无重力热管和有重力热管的温度场流场进行模拟分析,比对内部的流动规律及温度区域分布。结果表明:采用重力热管后,风电齿轮箱机舱内的局部温度过高现象得到较大改善。
期刊
社团发现任务在网络分析中占有重要地位,大多数方法是依据网络中的拓扑结构将各个节点划分到不同社团。虽然已经有很多种方法来解决这个问题,但这些方法假设给定的网络是完全的,即网络中不存在边的缺失。近期一些针对边缺失网络的社团发现方法有被提出,大体分为两个类别。一种是考虑利用链接预测或网络补全方法将缺失边正确地预测出来,然后在补全网络上进行社团发现。第二种是基于网络生成的思想,即考虑将与缺失边有关的影响因
学位
【研究目的】黑龙江争光金矿床位于兴安地块东缘嫩江—黑河北东向断裂带西北侧的奥陶纪多宝山岛弧带上。本文通过对主成矿期的矿石样品研究,探讨了成矿流体的来源。【研究方法】选择9件主成矿期的黄铁矿和方铅矿进行了系统研究,测定了He、Ar和S同位素组成。【研究结果】其含金石英脉中黄铁矿和方铅矿的流体包裹体~3He/~4He=1.95×10-6~5.03×10-6,40Ar/36Ar=349.1~453.9。
期刊
近年来,三维模型广泛应用于众多领域,数据量急剧增长,产生了大量的三维模型数据集。但是,其中仅有少数面向学术研究的数据集具备完善的标签信息,而在开放环境下,受限于高昂的人工标注成本,大部分三维模型数据集通常缺少标签信息,一般表现为两种场景:1)无标签场景,即数据集中没有带标签样本;2)小样本场景,即每个类别中仅有极少量带标签样本。传统三维模型检索和分类方法依赖特定闭合数据集的大量带标签样本,导致缺乏
学位
随着硬件设备的发展,人们对于图像质量的追求越来越高。图像质量提升成为人们关注的焦点,各种细分领域的图像增强技术也应运而生。比特深度增强技术通过重构图像最低有效位,细化色彩精度,提供更加生动细腻的视觉体验。然而,由于这是一个新兴方向,不同算法重构的高比特图像中会存在不同程度的颜色偏移、伪轮廓或纹理过模糊等瑕疵,影响主观视觉感受。对于这类特殊失真,现有通用型质量评价算法并不适用,亟需有一种有效准确的专
学位
为探究界面层对SiCf/SiC复合材料性能的影响,选用国产第3代SiC纤维,通过先驱体浸渍裂解工艺制备了热解碳(PyC)、热解碳/碳化硅(PyC/SiC)、氮化硼(BN)、氮化硼/碳化硅(BN/SiC)4种界面层的三维机织角联锁SiCf/SiC复合材料。在此基础上,结合声发射技术对复合材料进行常温断裂韧性测试,并利用扫描电镜对其细观损伤模式进行评价。结果表明:界面层对三维机织角联锁SiCf/SiC
期刊
三维模型的多视图信息能够全面地表征物体的视觉特性和潜在的空间结构信息。随着三维模型数据的飞速增长,如何对三维模型实现智能的分类与检索,是当前学术界和工业界的研究热点。目前,传统的三维模型分类方法需要大量的有标记的数据。然而,只有部分用于学术研究的三维模型数据集有详细的人工标注。因此,如何在有人工标记的训练对象很少的情况下实现对三维模型的有效分类,是一个亟待解决的问题。此外,不同的构建方式会使三维模
学位