论文部分内容阅读
非刚体的三维运动重建是指从一组运动图像的特征点序列中重建出物体运动的三维结构状态的过程,该问题的研究主要建立在矩阵的因式分解技术的基础上,利用形状基方法或者轨迹基方法对物体的运动结构进行重建。形状基方法是最早提出的用于求解非刚体三维运动重建问题的方法,但是该方法在解决不同重建问题时需要构建不同的形状基,有很大的局限性。轨迹基方法作为形状基方法的对偶性方法,很好地解决了形状基的局限性问题。但是轨迹基方法对轨迹基进行预定义的过程中也产生了一些问题。首先,因为轨迹基方法中用到的轨迹基是基函数定义的完整轨迹基的极少一部分,所以轨迹基的大小如何选择是很关键的问题,太小的轨迹基可能造成运动轨迹曲线的许多细节丢失,从而使重建的误差比较大;而如果选择太大的轨迹基,会使问题的求解变得困难,并且最终可能导致NP难的问题。其次是轨迹基种类的选择问题,这些类型可以是离散余弦变换(DCT),也可以是沃尔什-哈达玛变换(WHT),变换的类型有很多种,不同种类的轨迹基会影响重建的精度,得到不同的重建误差,因此选择一个合适类型的轨迹基是有必要的。针对上述问题,本文在现有的研究基础上进行了以下几方面的工作:(1)针对轨迹基的大小选择问题,本文提出了一种稀疏逼近算法。该算法的主要思想是:在用轨迹基重建非刚体运动轨迹曲线的过程中,根据不同轨迹曲线的特征,使用一组稀疏的系数来自动选取最能够代表曲线特征的轨迹基单元,这组系数在最大化的恢复非刚体实际运动轨迹曲线的同时,又避免了因为轨迹基选择的太小而忽略了一些运动细节的问题,因为这组系数是稀疏的,所以必定是可解的。本文在实验部分通过将稀疏逼近算法应用于不同的非刚体运动的三维重建,用稀疏矩阵来表示轨迹基矩阵各单元基对应的系数矩阵,降低了大矩阵问题求解的难度,同时避免了每次对不同的非刚体运动进行重建时都需要人为确定不同的轨迹基大小的问题,实验结果证明了该算法是高效的并且重建的结果是更加精确的。(2)针对轨迹基种类的选择问题,本文结合了稀疏逼近算法,提出了使用多种类型的轨迹基构建原子字典的方案。因为非刚体的运动是随机的、复杂的,所以如果只选择一种类型的轨迹基是不可能把所有复杂运动都精确地恢复出来的。本文在实验部分把两种不同类型的轨迹基联合起来,构建成了过完备的非相干原子字典,然后通过稀疏逼近算法进行原子系数的求解,这就使得待重建的轨迹曲线可以自适应地从字典中选取和该曲线特征最匹配的原子来表示。实验结果证明该方案可以提高重建的精度,进而得到更好的重建效果。