面向增强现实的三维物体跟踪鲁棒算法研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:lzliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
估计图像中物体的三维位姿(位置和朝向)是计算机视觉领域的基本问题,在增强现实领域起着非常核心的作用。在增强现实环境中,系统需要实时跟踪现实世界中特定物体的位姿,才能保证渲染的虚拟物体与现实物体保持几何一致性。基于视觉的三维物体跟踪方法是实现连续跟踪物体位姿的关键技术,由于其具有非侵入式、准确和廉价的优点得到快速发展。随着智能移动设备的普及和其计算能力的提升,基于单目彩色相机的三维物体跟踪方法成为研究热点,其目标是估计连续彩色视频帧中物体相对于相机的位姿。近年来,虽然诸多单目三维物体跟踪方法的跟踪性能在不断提升,但是实现稳定准确的三维物体跟踪仍然是具有挑战性的任务,存在许多亟待解决的问题。这些问题来自物体本身,包括缺乏明显纹理特征的表面和对称相似的结构,也来自周围环境,包括杂乱的背景环境、局部遮挡、相似颜色和动态光照,这些问题都容易导致跟踪偏移和跟踪失败。
  针对上述问题,本文对基于单目彩色相机的三维物体跟踪方法进行深入研究。首先,研究物体轮廓边特征和区域颜色特征在三维物体跟踪过程中的自适应融合问题;其次,研究使用边缘点置信度提高基于边的跟踪方法对复杂背景和局部遮挡的鲁棒性;最后研究使用物体轮廓约束提高基于区域的跟踪方法对局部遮挡和相似颜色的鲁棒性。
  本文的主要贡献如下:
  1.提出一种基于自适应特征融合的三维物体跟踪方法。现有基于区域的跟踪方法仅使用物体轮廓附近的区域颜色特征进行位姿估计,忽略了物体轮廓特征,而基于边缘的跟踪方法仅使用物体轮廓特征,忽略了区域颜色特征。本文提出一种自适应融合区域颜色特征和物体轮廓特征的三维物体跟踪方法,实现两种特征的优势互补,提高算法在复杂环境和运动模糊条件下的跟踪性能。首先提出使用模型投影轮廓附近的搜索线提取区域颜色特征和物体轮廓特征;然后定义基于物体轮廓特征和区域颜色特征自适应加权融合的能量函数,并计算其相对于位姿参数的偏导数;最后通过LM优化算法求解最优化物体位姿。为更好地处理物体或相机的快速运动,采用由粗到细的策略在多尺度视频图像中进行迭代位姿优化。定性和定量实验结果证明本文方法在复杂环境和运动模糊情况下都具有较高的准确性和鲁棒性。
  2.提出一种基于边缘点置信度的三维物体跟踪方法。在复杂背景和局部遮挡情况下图像中存在许多非物体轮廓干扰边,现有基于边缘的跟踪方法容易产生大量错匹配的物体轮廓点,导致跟踪偏移和跟踪失败。针对此问题,本文提出一种新的基于边缘的跟踪方法。首先使用前背景颜色统计信息剔除前背景区域的非物体轮廓干扰点;然后结合边缘点的局部颜色信息和距离信息计算边缘点属于物体轮廓的置信度,通过边缘点的置信度搜索物体轮廓点,能大幅提高物体轮廓点的匹配精度;最后使用物体轮廓点的置信度对能量函数进行加权,能有效抑制错匹配轮廓点对位姿优化的干扰。本文还实现了多物体跟踪,能有效处理多个跟踪物体之间的互遮挡问题。我们使用两个大型公开数据集对跟踪性能进行定量和定性评估,实验结果显示本文方法能有效提高基于边缘的跟踪方法对复杂背景和局部遮挡的鲁棒性。
  3.提出一种基于逐像素加权的三维物体跟踪方法。现有基于区域的跟踪方法依赖准确的前背景颜色统计信息,但是局部遮挡和相似颜色会产生错误的前背景颜色统计信息,导致跟踪偏移和跟踪失败。针对此问题,本文提出一种新的基于区域的跟踪方法。首先提出使用物体轮廓附近的搜索线定义新的基于区域颜色特征的能量函数,其计算效率更高,并且利用搜索线采样点的连续相邻性能更有效的检测和处理局部遮挡和相似颜色问题。其次提出使用物体轮廓点的局部颜色信息和距离信息计算区域采样像素点的权值,并对能量函数进行逐像素加权,能有效抑制局部遮挡和相似颜色对位姿优化的干扰。我们使用两个大型公开数据集对跟踪性能进行定量和定性评估,实验结果显示本文方法能有效提高基于区域的跟踪方法对局部遮挡和相似颜色的鲁棒性。
其他文献
药物往往通过靶向相应的蛋白来发挥作用。因此,揭示药物和靶标的关系在药物开发中起着至关重要的作用。近年来,药物-靶标蛋白质相互作用(DTIs)的计算预测对于药物发现或药物重定位变得尤为关键。与昂贵且费时的体内或生物学试验相比,计算方法可以有效地识别潜在的DTIs并大大减少候选药物蛋白的范围。所以如何明确可靠的与药物相关的候选蛋白质,是一项值得研究的课题。本文提出了三种基于深度学习的DTIs预测方法-
现如今,人们正处于信息化的时代,研究学者们越来越热衷于从图像中获取所需的信息,而图像上的文本可以帮助人们更好的理解图像信息。因此,提取图像中的文本信息成为了近年来科研界的一个热门的研究任务,而自然场景下拍摄的图像非常复杂多变,给检测任务带来了极大的挑战。传统的机器学习方法已经不能满足任务的需求,得益于深度学习技术的推广和应用,给场景文本检测任务带来了新的机遇和可能性,广大研究学者纷纷将深度学习技术
学位
近年来,随着移动互联网和智能传感器技术的发展,移动群智感知计算模式在学术界、工业界和企业界得到广泛的关注。移动群智感知系统利用工人携带的智能设备的感知与计算能力,通过移动互联网进行协作来完成复杂的感知任务。在移动群智感知系统中,工人招募是一个核心共性的研究问题,是一种考虑任务和工人等因素的满足多种优化目标和约束条件的组合优化问题。移动群智感知中的工人招募问题的研究主要面临参与感知任务的工人数量不足
随着深度强化学习技术在视频游戏领域的不断发展,越来越多难度各异的视频游戏被深度强化学习智能体所掌握,这些智能体在某些视频游戏中甚至可以比肩人类职业游戏玩家。相较于视频游戏,基于文本语言的文本类游戏因其特殊的游戏方式和市场流行度较低等因素,使得关于文本游戏领域的研究相对于视频游戏领域要少一些。基于上述背景,本文将研究目光投向了流行度较低的文本游戏。在之前关于文本游戏的相关研究中,大多通过修改深度强化
随着人工智能的发展,我们的生活发生了翻天覆地的变化。其中,让机器懂得人类的语言一直是我们梦寐以求追寻的目标。人们对语言信息处理的需求越来越大,人们迫切需要用自动化的手段处理海量的语言信息。例如:机器翻译,问答系统,人机对话等。这些自然语言处理的应用已经深入的渗透到人类的日常生活中。但是,这些应用与人类的水平还有一段距离。其背后原因可能是机器并不是真正的理解自然语言所表达的含义。所以,自然语言理解的
在用户历史交互记录中,蕴含着丰富的映射用户潜在兴趣偏好的信息,这些信息可以帮助推荐系统建模,从而向用户推荐他们潜在兴趣的内容或商品,在电子商务领域中扮演着重要的角色。这种方式不仅方便用户以更高效、快捷的方式获取有利信息或商品,而且电子商务平台也可以通过推荐系统的技术,主动地将产品或者服务准确地投放给目标用户,以便他们获取更高的利润。由于用户的个性化商品推荐与人们日常生活息息相关,所以越来越多的研究
图像超分辨率重建是深度学习的重要分支,受到越来越多科研人员的关注。目前,图像超分辨率重建方法以深度学习为基础在图像的定性和定量上取得了突破性的发展。为了提高图像的重建质量,现有的基于深度学习的图像超分辨方法一般都是通过增加网络模型的深度提高图像的重建质量。但是,实验也表明随着网络模型深度的增加,图像过渡平滑现象会越来越严重。除此之外,由于自然场景下真实低分辨率图像受到天气、噪声和模糊度等因素的影响
现有的图像修复方法,主要针对自然场景、建筑物等图像,对于人脸图像的修复并没有过多的深入研究。自然条件下的人脸图像的修复,会随着人脸姿势、遮挡、表情等因素而造成修复结果产生偏差,比如出现边界区域模糊、结构不连贯等问题。本课题着重关于人脸图像的修复展开研究,提出了基于人脸结构特征先验引导的图像修复算法,该算法通过在残缺人脸图像中使用卷积神经网络提取人脸结构潜在信息,然后通过人脸结构条件约束和重建隐藏层
学位
电商平台和网络社交媒体的快速发展,让我们的生活更加丰富多彩,获取信息也更加方便,但是随之而来的是信息过载给我们上网所带来的巨大影响。而推荐系统则在一定程度上减轻了目前信息爆炸的问题,也可以有效的帮助人们更加迅速的寻觅到他们所需的信息。但是,数据稀疏和冷启动等问题会对推荐的质量造成较大的影响,如何克服这两个问题也成为了诸多学者研究的目标。已有研究表明利用信任信息可以在一定程度上解决数据稀疏和冷启动的
随着云计算、大数据及网络等技术的快速发展,社会进入了信息化时代,各种信息系统成为人们日常生活的基础设施,人们的工作、学习、生活无不严重依赖于网络,信息安全日益成为焦点问题。密码学是信息安全的核心与支撑性技术,密码技术的应用对社会信息化的健康发展具有不可替代的作用。  信息化时代,数据规模不断扩大,巨大用户数量、海量数据规模、高并发处理性能,都对密码运算的加解密速度、数字签名和验证速度等性能指标提出
学位