论文部分内容阅读
从动态图像序列中恢复物体的三维结构与运动信息是计算机视觉领域的重要研究内容之一。基于动态图像序列的因式分解法具有较强的鲁棒性和准确性,因此该方法在解决三维运动重建问题中应用最为广泛。传统因式分解法的研究对象主要是静态场景下的刚性物体,对于动态场景下的非刚体难以直接应用传统的因式分解法进行处理。目前已有的非刚体三维运动重建算法都简单的假设非刚体的形状基个数已知,然而形状基个数对三维重建方法来说十分重要,如果形状基个数估算错误,会导致重建算法完全失效。此外已有算法都假设摄像机是仿射摄像机模型,仿射模型是真实透视投影模型的近似,这种近似只有在物体尺寸相对于物体与摄像机的距离很小时才成立,当物体距离摄像机较近时会造成较大的重建误差。针对以上问题,本文主要做了以下几方面的工作:(1)提出了一种基于单目图像序列的非刚体形变程度估计方法。形变程度估算是非刚性物体结构和运动分析研究中的一个重要问题。现有的形变程度估计方法通常不考虑特征点丢失问题,并假设无位置误差或不确定性是各向同性的,使得这些形变程度估算方法的适用性变得很差。为使算法更实用,本文提出了一种同时考虑图像的方向性误差和特征点数据丢失问题的形变程度估计方法。对人体活动图像序列的实验表明,该方法的适用性强且结果可靠。(2)研究了一种改进的线性迭代算法,解决在真实透视投影模型下从动态图像序列中恢复非刚体的三维结构与运动信息问题。现有算法都假设摄像机为弱透视投影模型,而这种假设只有在物体尺寸和深度变化相对于物体与摄像机的距离很小时才成立。因此本文利用线性迭代算法将非刚体因式分解法从弱透视投影模型下扩展到一般透视投影模型下。对人脸面部表情变化的动态图像序列实验,表明了本文改进算法的有效性和精确性。(3)应用幂因式分解法来解决基于动态图像序列的非刚体三维运动重建问题。基于奇异值的因式分解法中,对变换矩阵求解较为复杂,并且该方法的重建误差较大。因此本文研究利用幂因式分解来解决从动态图像序列中恢复非刚体的三维结构和运动信息,对人脸图像序列的实验验证了该算法的重建结果比用基于奇异值的因式分解法所得的结果更为精确。