基于图像内容的目标检测算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:first111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能手机和数码相机的普及,以及移动互联网、微信、微博等传播媒介的飞速发展,图像不仅广泛地融入到人类的生活当中,并且逐渐改变了人类的生活方式。图像所承载的丰富内容为人们带来无尽乐趣的同时,也让人们通过计算机视觉模拟人类视觉成为了可能。计算机视觉就是人们利用计算机模拟人类的生物视觉的功能,对环境进行感知、理解和信息计算。这样计算机就可以使得计算机可以像人类一样能够进行主动感知和目标检测任务。本文的研究内容主要围绕计算机视觉中的两大重要分支:运动目标检测和显著性检测展开。主要贡献包括:  (1)在运动目标检测算法中,简化了背景模型的建立并改进了背景模型的更新。传统的背景建模算法如高斯建模和核密度估计均需要几十甚至上百帧图像进行学习,严重影响了算法的执行速率。考虑到图像中每个像素与其邻域内的像素相关(空间相关性),对每个像素用其16邻域内的随机8个像素对其进行建模,在第一帧就可以完成对模型的建立与初始化,能大大提高算法的效率。摒弃传统的每一帧都更新背景模型像素的更新方法,按照随机策略方式更新背景模型的像素点。一个像素模型必须包含最近几帧的像素,但是也没必要把那些旧像素点全部丢弃,这样提高了模型时间相关性。并且背景点随机更新邻域像素,提高了模型的空间相关性。  (2)现有的大部分算法在运动目标检测中对“Ghost”区域感到束手无策,这主要存在于初始化模型中有出现运动目标和目标由运动转为静止过程中。如果“Ghost”区域没有及时被去除,当运动目标经过这个区域时会造成更大的误检。考虑到背景模型初始化时背景里一般都含有运动目标,本文在视频序列的前十几帧中融入帧差法。因为“Ghost”区域是静止不动的,通过几次帧差以后这些区域能很明显的被去除。对于目标由运动转为静止产生的“Ghost”区域,本文通过更新背景模型的领域像素以及无记忆方式更新背景模型,可以将“Ghost”区域很快地纳入背景区域。  (3)本文本着中心-周围区域对比度的显著性区域的思想,先在Bottom-Up模式被动感知过程中,利用最大对称环绕方法获得高分辨率的视觉概率分布图,然后在贝叶斯框架下,利用Top-Down模式主动检测进一步在视觉概率分布图的基础上获得感兴趣的物体区域,并且在Achanta等人提供的公开测试集HUS10000对本文算法的ROC和Precision-Recall进行测试,验证了本文算法的有效性。
其他文献
思想意识对于实践活动时具有一定指导作用的,因此,一定要注重在意识方面的建设,树立正确的人生观、世界观以及价值观,才能够更好地学习及生活,在教育领域同样要注重对学生意
该论文在国家863计划项目资助的脱机手写汉字库HCL2000(Handwritten Character Library 2000)的建立项目基础之上,对HCL2000汉字库与高精度识别算法作了较为深入的研究.论文
随着我国社会经济的发展,合作意识在社会中尤为重要,合作已经成为社会中人们生活和学习的重要方面.数学这一门课程要求学生有较强的理解力,学生学习初中数学应该主要从数学逻
该文针对未知特性的平稳或近似平稳强背景声,研究基于听觉掩蔽效应的中低复杂度单话筒语音增强方法.论文工作之一是研究基于听觉掩蔽效应的语音增强准则,提出了一个实用的推
该课题的主要研究内容就是结合国内外在卫星ATM网方面的研究及发展情况,对组建卫星ATM网时应考虑的几项关键技术进行了探讨,并对卫星ATM链路的传输性能进行了分析和仿真,使其
小学数学对于小学生的逻辑思维的养成和日后的发展及进步有着极为重大的意义,所以提升课堂教学的有效性已是教师追寻的重要目标所在.基于此,本文从笔者自身的教学实践工作经
云计算是一种新兴的计算模式,它通过互联网为用户提供各种计算服务和存储服务。对于基于互联网和移动无线网络的多媒体应用和服务而言,由于其同时服务于大规模用户群体,需要大量
经济社会的发展推动上层建筑的改革,尤其是对我国教育领域方面有着重要的影响,社会对于人才需求的变化必将推动教育界的改革,从而为社会培养出各种专业人才,更好地服务于我国
DOA(Direction of Arrival)估计是阵列信号处理中的一个重要分支,在雷达、通信、声纳等领域都有着广泛应用。近年来随着压缩感知(Compressed Sensing)理论的不断发展,研究者将D
DNA疫苗是继传统疫苗和基因工程蛋白亚单位疫苗之后的新一代疫苗,质粒DNA大规模制备技术对DNA疫苗的产业化具有重要意义。论文第一部分从我国重大科研课题的需求以及生物制药