面向增强现实的物体检测与跟踪技术研究

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:TemplarLee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
增强现实是以三维注册、虚实融合与人机交互为基础,实现虚拟物体和真实场景相互融合的技术。增强现实任务的核心问题是对现实场景中的物体进行准确、快速地识别和跟踪,以便将虚拟物体准确地放置在相应的位置上。本文针对增强现实中的三维注册技术进行研究,主要采用基于深度学习的方法对目标检测和位姿估计算法进行了研究与改进,提出了一个鲁棒性强且能满足实时需求的物体识别系统,本文主要贡献如下:(1)针对传统目标检测模型在目标遮挡和复杂背景条件下检测精度较低的问题,本文提出了一种引入结合自注意力机制的目标检测算法。本文改进了Retina Net目标检测模型的主干特征提取网络结构,通过引入自注意力机制模块增强网络模型对图像特征的提取和学习能力,有效地提升了模型的检测准确率和鲁棒性;使用差分进化算法对数据集中的Anchor尺寸进行优化,确保模型在提升精度的同时保证较高的检测效率。本文在PASCAL VOC数据集上进行了对比实验,实验结果表明,本文改进的目标检测网络模型在图像中存在目标遮挡和复杂背景的情况下有更好的鲁棒性。(2)为了实现对三维物体的位姿估计,设计了一种端对端的6D位姿估计算法。本文在原有的目标检测模型结构进行改进,首先通过卷积神经网络输出物体二维图像上的2D关键点信息,建立三维物体3D顶点和2D关键点的对应关系后,再使用Perspective-n-Point(Pnp)算法求解目标在三维空间中的平移分量和旋转分量,以完成对三维物体的位姿估计。本文使用Line Mod数据集与已有的位姿估计算法进行了对比实验,实验结果表明,改进后的位姿估计模型在2D重投影误差和物体在三维空间中的ADD度量误差两个指标上均可以达到主流算法的平均水平,验证了本文提出的位姿估计算法的正确性。(3)搭建了一个基于深度学习的物体识别与跟踪的增强现实系统,实现了对于二维图像和三维物体的识别与跟踪。实验结果表明本文提出的面向增强现实目标检测系统有较高的检测准确率和实际应用价值。
其他文献
互联网技术的蓬勃发展使得信息数据量呈指数爆炸型增长,如何准确地从海量文本中获取到有效信息以及如何将非结构化数据转换成结构化数据成为研究热点和难点,命名实体识别是其中的一项基础研究。命名实体识别旨在从自然语言文本中识别并提取出特定命名实体,以便进行后续自然语言理解和生成任务。传统的命名实体识别任务基于中文分词进行,分词错误会延续整个任务过程,错误传播会导致识别性能下降,模型难以充分提取长语句序列中潜
近年来,随着钱币市场不断升温,越来越多的人开始关注收藏币。采用传统人工方式对收藏币进行分拣和识别,人工和设备成本较高,并且长时间不断重复容易造成身体和视觉上的疲劳,影响身心健康。本文开发了一套收藏币包装盒拍照机器人控制系统,可实现对收藏币包装盒夹取、升降、定位、翻转和图像采集等一系列全自动拍照工艺流程。构建了“PC+工业相机+嵌入式控制器”的控制系统总体架构。PC端作为上位机负责的人机交互、数据通
大数据分析、处理技术是计算机领域热点研究问题之一。然而,大数据往往伴随具体业务信息和商业机密,科研人员很难获得有效的大数据。因此,如何根据有限的真实数据生成仿真大数据的技术成为学术界需要研究和解决的问题。具体体现在:构建大数据分析的机器学习模型时需要大量的训练数据,大数据处理系统需要大量的测试用例集等等。针对上述技术需求,本文讨论两种大数据集生成算法和应用技术,包括:离散和级联大数据生成算法和北京
众所周知,风是一种非常常见的自然现象,风速风向也是非常重要的气象参数。风速风向的测量对于航海、航空、科学研究、风力发电以及工农业生产都具有重要意义。传统的机械式测风仪器难以满足众多领域对于风速风向的高精度测量要求,微电子技术的飞速发展和软件算法的改进使得时间测量精度和计算机的处理能力得到大幅提高,出现了超声波测风仪等高精度的测风设备,与传统的测风设备相比无机械磨损、精度高、能适应更加复杂的工作环境
辊弯成形是一种将金属板料连续地通过轧机,横向弯曲成所需要横截面形状的塑性加工技术,具有成形精度高、能大批量连续生产等优点。微成形工艺是生产至少两个方向处于亚毫米范围零件的塑性制造工艺。微型构件市场需求的显著增加,极大地推动了微成形技术的发展。为了实现对具有微小截面特征的细长金属零件的高效率连续生产,研究者们提出了微辊弯成形工艺。目前对传统辊弯成形的研究已经比较深入,但对刚起步的微辊弯成形中材料的复
水资源的回收再利用能够有效解决水资源短缺的问题,水资源再利用包括很多复杂工序,其中利用沉淀效应去除水中杂质是必不可少的一环。但这也会造成沉淀池中淤泥的堆积,为保证水资源再利用的持续进行需对沉淀池中的淤泥进行定期清理,因此需要有一种设备能够实时监测沉淀池中淤泥的高度。针对上述问题,本课题设计了一种投入式超声波泥位测量系统以实现沉淀池泥水界面的检测工作。为适应工业生产现场的复杂环境,该系统应具有较高的
云计算的高虚拟化、高扩展性和廉价性等优势,使得个人和企业愿意把本地数据的存储和计算外包给云端服务器。然而,数据的隐私性和完整性问题严重影响着云存储技术的应用推广。出于安全性考虑,数据在外包到云服务器之前通常需要进行加密。然而,加密却破坏了数据文件之间的关联性,给用户的文件搜索管理带来巨大挑战。可搜索加密技术的出现使得用户能够对密文实现关键词的搜索。现有可搜索加密方案通常假设云服务器是诚实且好奇的,
推荐系统作为电子商务平台的重要组成部分之一,能够有效地捕获用户的兴趣特征,实现个性化推荐任务。作为推荐系统的重要分支,序列型推荐系统能够进一步捕获用户兴趣特征的动态变化,实现实时推荐任务。尽管经典的序列型推荐方法能够较好的为用户提供推荐服务,但是本文认为这些方法依旧存在一些缺陷。一方面,这些方法在对用户兴趣建模时往往难以捕获用户行为序列项目间的复杂转换关系以及用户对于不同项目的不同关注程度;另一方
新词指的是在词典中不曾存在,但现在被人们广泛使用的词语。随着互联网的飞速发展,大量新词也随之涌现。这些新词的出现给诸多自然语言处理任务带来了挑战,因此新词发现是存在一定价值与意义的。传统新词发现方法通过总结新词模板与统计特征提取新词,但其只能针对于特定的领域进行新词发现,或是只能提取长度较短的新词语。针对以上问题,本文提出了一种将深度学习和新词发现相结合的方法,在BiLSTM+CRF模型上融合了多
区块链是密码学、分布式最终共识机制、P2P传输等不同技术的交叉融合,以其去中心化的特征,创造了一个不可篡改的链状可信环境,受到了当前金融、法律、物联网等不同行业的广泛关注。区块链技术已经成为当下研究的热点话题,而如何在项目实际应用中提升区块链的安全性和效率则是目前亟需解决的难题。针对以上问题,本文将区块链底层架构中不同层级作为研究对象,对其中共识机制和智能合约中关键点进行全面分析;并结合冗余机制和