论文部分内容阅读
估计图像中物体的三维位姿(位置和朝向)是计算机视觉领域的基本问题,在增强现实领域起着非常核心的作用。在增强现实环境中,系统需要实时跟踪现实世界中特定物体的位姿,才能保证渲染的虚拟物体与现实物体保持几何一致性。基于视觉的三维物体跟踪方法是实现连续跟踪物体位姿的关键技术,由于其具有非侵入式、准确和廉价的优点得到快速发展。随着智能移动设备的普及和其计算能力的提升,基于单目彩色相机的三维物体跟踪方法成为研究热点,其目标是估计连续彩色视频帧中物体相对于相机的位姿。近年来,虽然诸多单目三维物体跟踪方法的跟踪性能在不断提升,但是实现稳定准确的三维物体跟踪仍然是具有挑战性的任务,存在许多亟待解决的问题。这些问题来自物体本身,包括缺乏明显纹理特征的表面和对称相似的结构,也来自周围环境,包括杂乱的背景环境、局部遮挡、相似颜色和动态光照,这些问题都容易导致跟踪偏移和跟踪失败。
针对上述问题,本文对基于单目彩色相机的三维物体跟踪方法进行深入研究。首先,研究物体轮廓边特征和区域颜色特征在三维物体跟踪过程中的自适应融合问题;其次,研究使用边缘点置信度提高基于边的跟踪方法对复杂背景和局部遮挡的鲁棒性;最后研究使用物体轮廓约束提高基于区域的跟踪方法对局部遮挡和相似颜色的鲁棒性。
本文的主要贡献如下:
1.提出一种基于自适应特征融合的三维物体跟踪方法。现有基于区域的跟踪方法仅使用物体轮廓附近的区域颜色特征进行位姿估计,忽略了物体轮廓特征,而基于边缘的跟踪方法仅使用物体轮廓特征,忽略了区域颜色特征。本文提出一种自适应融合区域颜色特征和物体轮廓特征的三维物体跟踪方法,实现两种特征的优势互补,提高算法在复杂环境和运动模糊条件下的跟踪性能。首先提出使用模型投影轮廓附近的搜索线提取区域颜色特征和物体轮廓特征;然后定义基于物体轮廓特征和区域颜色特征自适应加权融合的能量函数,并计算其相对于位姿参数的偏导数;最后通过LM优化算法求解最优化物体位姿。为更好地处理物体或相机的快速运动,采用由粗到细的策略在多尺度视频图像中进行迭代位姿优化。定性和定量实验结果证明本文方法在复杂环境和运动模糊情况下都具有较高的准确性和鲁棒性。
2.提出一种基于边缘点置信度的三维物体跟踪方法。在复杂背景和局部遮挡情况下图像中存在许多非物体轮廓干扰边,现有基于边缘的跟踪方法容易产生大量错匹配的物体轮廓点,导致跟踪偏移和跟踪失败。针对此问题,本文提出一种新的基于边缘的跟踪方法。首先使用前背景颜色统计信息剔除前背景区域的非物体轮廓干扰点;然后结合边缘点的局部颜色信息和距离信息计算边缘点属于物体轮廓的置信度,通过边缘点的置信度搜索物体轮廓点,能大幅提高物体轮廓点的匹配精度;最后使用物体轮廓点的置信度对能量函数进行加权,能有效抑制错匹配轮廓点对位姿优化的干扰。本文还实现了多物体跟踪,能有效处理多个跟踪物体之间的互遮挡问题。我们使用两个大型公开数据集对跟踪性能进行定量和定性评估,实验结果显示本文方法能有效提高基于边缘的跟踪方法对复杂背景和局部遮挡的鲁棒性。
3.提出一种基于逐像素加权的三维物体跟踪方法。现有基于区域的跟踪方法依赖准确的前背景颜色统计信息,但是局部遮挡和相似颜色会产生错误的前背景颜色统计信息,导致跟踪偏移和跟踪失败。针对此问题,本文提出一种新的基于区域的跟踪方法。首先提出使用物体轮廓附近的搜索线定义新的基于区域颜色特征的能量函数,其计算效率更高,并且利用搜索线采样点的连续相邻性能更有效的检测和处理局部遮挡和相似颜色问题。其次提出使用物体轮廓点的局部颜色信息和距离信息计算区域采样像素点的权值,并对能量函数进行逐像素加权,能有效抑制局部遮挡和相似颜色对位姿优化的干扰。我们使用两个大型公开数据集对跟踪性能进行定量和定性评估,实验结果显示本文方法能有效提高基于区域的跟踪方法对局部遮挡和相似颜色的鲁棒性。
针对上述问题,本文对基于单目彩色相机的三维物体跟踪方法进行深入研究。首先,研究物体轮廓边特征和区域颜色特征在三维物体跟踪过程中的自适应融合问题;其次,研究使用边缘点置信度提高基于边的跟踪方法对复杂背景和局部遮挡的鲁棒性;最后研究使用物体轮廓约束提高基于区域的跟踪方法对局部遮挡和相似颜色的鲁棒性。
本文的主要贡献如下:
1.提出一种基于自适应特征融合的三维物体跟踪方法。现有基于区域的跟踪方法仅使用物体轮廓附近的区域颜色特征进行位姿估计,忽略了物体轮廓特征,而基于边缘的跟踪方法仅使用物体轮廓特征,忽略了区域颜色特征。本文提出一种自适应融合区域颜色特征和物体轮廓特征的三维物体跟踪方法,实现两种特征的优势互补,提高算法在复杂环境和运动模糊条件下的跟踪性能。首先提出使用模型投影轮廓附近的搜索线提取区域颜色特征和物体轮廓特征;然后定义基于物体轮廓特征和区域颜色特征自适应加权融合的能量函数,并计算其相对于位姿参数的偏导数;最后通过LM优化算法求解最优化物体位姿。为更好地处理物体或相机的快速运动,采用由粗到细的策略在多尺度视频图像中进行迭代位姿优化。定性和定量实验结果证明本文方法在复杂环境和运动模糊情况下都具有较高的准确性和鲁棒性。
2.提出一种基于边缘点置信度的三维物体跟踪方法。在复杂背景和局部遮挡情况下图像中存在许多非物体轮廓干扰边,现有基于边缘的跟踪方法容易产生大量错匹配的物体轮廓点,导致跟踪偏移和跟踪失败。针对此问题,本文提出一种新的基于边缘的跟踪方法。首先使用前背景颜色统计信息剔除前背景区域的非物体轮廓干扰点;然后结合边缘点的局部颜色信息和距离信息计算边缘点属于物体轮廓的置信度,通过边缘点的置信度搜索物体轮廓点,能大幅提高物体轮廓点的匹配精度;最后使用物体轮廓点的置信度对能量函数进行加权,能有效抑制错匹配轮廓点对位姿优化的干扰。本文还实现了多物体跟踪,能有效处理多个跟踪物体之间的互遮挡问题。我们使用两个大型公开数据集对跟踪性能进行定量和定性评估,实验结果显示本文方法能有效提高基于边缘的跟踪方法对复杂背景和局部遮挡的鲁棒性。
3.提出一种基于逐像素加权的三维物体跟踪方法。现有基于区域的跟踪方法依赖准确的前背景颜色统计信息,但是局部遮挡和相似颜色会产生错误的前背景颜色统计信息,导致跟踪偏移和跟踪失败。针对此问题,本文提出一种新的基于区域的跟踪方法。首先提出使用物体轮廓附近的搜索线定义新的基于区域颜色特征的能量函数,其计算效率更高,并且利用搜索线采样点的连续相邻性能更有效的检测和处理局部遮挡和相似颜色问题。其次提出使用物体轮廓点的局部颜色信息和距离信息计算区域采样像素点的权值,并对能量函数进行逐像素加权,能有效抑制局部遮挡和相似颜色对位姿优化的干扰。我们使用两个大型公开数据集对跟踪性能进行定量和定性评估,实验结果显示本文方法能有效提高基于区域的跟踪方法对局部遮挡和相似颜色的鲁棒性。