论文部分内容阅读
随着智能手机和数码相机的普及,以及移动互联网、微信、微博等传播媒介的飞速发展,图像不仅广泛地融入到人类的生活当中,并且逐渐改变了人类的生活方式。图像所承载的丰富内容为人们带来无尽乐趣的同时,也让人们通过计算机视觉模拟人类视觉成为了可能。计算机视觉就是人们利用计算机模拟人类的生物视觉的功能,对环境进行感知、理解和信息计算。这样计算机就可以使得计算机可以像人类一样能够进行主动感知和目标检测任务。本文的研究内容主要围绕计算机视觉中的两大重要分支:运动目标检测和显著性检测展开。主要贡献包括: (1)在运动目标检测算法中,简化了背景模型的建立并改进了背景模型的更新。传统的背景建模算法如高斯建模和核密度估计均需要几十甚至上百帧图像进行学习,严重影响了算法的执行速率。考虑到图像中每个像素与其邻域内的像素相关(空间相关性),对每个像素用其16邻域内的随机8个像素对其进行建模,在第一帧就可以完成对模型的建立与初始化,能大大提高算法的效率。摒弃传统的每一帧都更新背景模型像素的更新方法,按照随机策略方式更新背景模型的像素点。一个像素模型必须包含最近几帧的像素,但是也没必要把那些旧像素点全部丢弃,这样提高了模型时间相关性。并且背景点随机更新邻域像素,提高了模型的空间相关性。 (2)现有的大部分算法在运动目标检测中对“Ghost”区域感到束手无策,这主要存在于初始化模型中有出现运动目标和目标由运动转为静止过程中。如果“Ghost”区域没有及时被去除,当运动目标经过这个区域时会造成更大的误检。考虑到背景模型初始化时背景里一般都含有运动目标,本文在视频序列的前十几帧中融入帧差法。因为“Ghost”区域是静止不动的,通过几次帧差以后这些区域能很明显的被去除。对于目标由运动转为静止产生的“Ghost”区域,本文通过更新背景模型的领域像素以及无记忆方式更新背景模型,可以将“Ghost”区域很快地纳入背景区域。 (3)本文本着中心-周围区域对比度的显著性区域的思想,先在Bottom-Up模式被动感知过程中,利用最大对称环绕方法获得高分辨率的视觉概率分布图,然后在贝叶斯框架下,利用Top-Down模式主动检测进一步在视觉概率分布图的基础上获得感兴趣的物体区域,并且在Achanta等人提供的公开测试集HUS10000对本文算法的ROC和Precision-Recall进行测试,验证了本文算法的有效性。