论文部分内容阅读
视频和图像中的标识包含着重要的语义信息,标识检测对视频图像内容理解、检索与过滤、知识产权保护等都具有十分重要的意义。标识可分为嵌入标识和实景标识。嵌入标识是人工添加到视频和图像.上的具有特定含义的标识,如电视台标、栏目标识等等。实景标识是在视频和图像中出现的具有一定含义的平面物体,包括商标、招牌等等。本文是围绕着如何快速准确地进行视频图像标识检测而展开研究,研究目的是从准确度和速度上提高标识检测的性能,取得如下研究成果:
1.基于多特征融合的嵌入标识检测方法针对现有嵌入标识检测多采用多帧帧差的方法,网络流量消耗大、检测时间长以及对半透明标识敏感的问题,提出了一种融合纹理、颜色和形状等多种特征的单帧图像嵌入标识检测方法。先使用纹理和颜色特征过滤图像区域,然后通过形状匹配得到最终检测结果。其中,针对现有的纹理颜色特征描述方法对镂空背景敏感的问题,提出了一种带镂空背景的纹理颜色特征描述子,提高了描述子的空间表达能力并降低镂空部分的权重;针对现有形状描述方法都未有针对半透明标识形状的随机性进行描述与匹配的问题,提出了一种基于匹配能量场的半透明标识形状描述子及其快速匹配算法。将半透明标识的形状匹配问题转化成能量的优化问题,使得形状匹配计算复杂度从O(n2)降低到O(n)。实验结果表明,这种基于多特征融合的标识检测方法在速度和准确度上都优于现有方法。
2.基于空间匹配的实景标识检测方法针对实景标识往往由于拍摄视角和光照条件不同而发生严重形变甚至部分被遮挡的问题,提出了基于空间匹配的实景标识检测方法。首先采用视觉单词词频的方法得到少量候选图像集,然后通过空间匹配得到最终检测结果,其中空间匹配是该方法的核心。针对现有空问匹配算法计算复杂度高并且对图像拍摄视角比较敏感的问题,提出了一种新的空问匹配算法ACN-RANSAC。首先通过基于特征仿射协变的邻近特征集(ACN)的匹配过滤掉局部区块特征向量在量化过程中造成的很多误匹配,然后通过RANSAC算法计算仿射变换。在仿射变换计算中,提出了一种将仿射变换分解成三个子变换的方法,从而可以仅利用一组对应的仿射协变区块就能够计算出自由度为6的仿射变换,而且不需要基于重力向量的假设,因而对拍摄视角变化更加鲁棒。实验结果表明,本文提出的基于空间匹配的实景标识检测方法在准确度和速度上都优于现有方法。
3.负载平衡的并行空间匹配方法空间匹配算法ACN-RANSAC虽然已经过优化,但其计算复杂度仍旧不能满足对时间要求较高的应用,因此本文实现了ACN-RANSAC算法在GPU(GraphicsProcessing Units)上的并行加速。为了提高并行算法的整体速度,提出了一种基于前缀和的负载平衡的并行空间匹配算法。在这种并行空间匹配算法中将计算任务均匀地分配给线程而实现负载平衡,并且通过优化存储器访问提高了存储器访问的带宽。为了提高前缀和的计算速度,提出了一种基于BITMAP数据结构的快速前缀和计算方法。实验结果表明,简单并行算法能够实现7-8倍的加速,而通过负载平衡优化之后的计算速度进一步提高了40%。最终,这种负载平衡的并行空问匹配算法能够在40-50毫秒内完成特定实景标识的检测。