论文部分内容阅读
提取有效的图像特征是许多计算机视觉问题的重要步骤,往往决定了计算机视觉方法的成败。随着互联网和手持设备的普及,大规模的图像视频资料的实时处理已成为计算机视觉乃至整个计算机领域的挑战。这对提取图像特征提出了更高的要求。将特征二值化成二元码或者直接从图像中抽取二元特征为大规模和实时的视觉问题提供了很好的解决方案。本文的重点正是研究如何得到有效的二值化图像特征(或称二元图像特征)来解决不同的计算机视觉问题。首先我们提出了一种基于半监督学习哈希算法来实现对已有特征的二值化。我们选择了基于锚点的非线性哈希函数以提高泛化能力,同时利用了有标记的和未标记的数据信息,并提出了自助法序列学习方案,通过整体更正之前学习的位错误得到哈希函数。六个标准数据集上的实验结果证明了所提出的基于半监督学习哈希算法的有效性。接着我们提出了基于卷积树变换的二元特征实现快速实时关键点匹配。在我们的方法中,关键点识别问题被看作一个图像小块的检索问题,这样可以同时完成关键点识别和姿态估计。我们提出一种卷积树变换方法有效地从图小块中抽取二元特征。此外,我们还运用了相应的基于二元特征子签名的局部敏感哈希来进行快速近似图小块搜索。在人造数据和实际数据上的实验证明了所提出的方法比现存最先进的基于特征描述符和基于分类的关键点识别方法更有效。我们还介绍了基于随机映射二元特征在视频拷贝检测中的应用。一种有效的稀疏随机映射方法被用来编码图像特征并保持判别性。为了处理复杂的变换,我们在抽取全局特征时利用了有效的预处理技术。因为计算二元特征间的汉明距离非常迅速,我们提出了一种基于关键帧的拷贝检索方法。我们还提出了一种有效的评分和定位算法进一步精炼之前检索到的拷贝和准确的定位拷贝视频段。在TRECVID2011基于内容拷贝检测任务上的不错结果证明了我们提出方法的效果。