基于深度学习框架的背景减除算法研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:Cantarali
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机视觉技术的不断发展,视频图像已经成为传递信息的重要媒介,如何从海量的视频数据中高效率地提取目标的需求与日俱增,背景减除作为实现目标检测的关键技术,已经成为计算机视觉领域重要研究课题之一。近三十年来,国内外学者基于背景建模等理论对背景减除做了深入研究,并尝试将其从实验推广到实际应用。然而,实际应用中视频场景复杂多变,传统背景减除算法难以准确提取前景目标。近年来,深度学习凭借其对图像数据的强大表征能力,在计算机视觉任务中被广泛应用,一些研究人员已经尝试将深度学习应用到背景减除任务中,提高了背景减除算法泛化能力。本文基于深度学习相关理论,设计了两种能有效处理多种复杂场景的背景减除模型:提出了一种基于注意力机制的多尺度背景减除模型。在图像分割领域中,多尺度结构能促使模型提取不同尺度的特征,生成精细分割结果。因此,有研究人员尝试使用多尺度结构构建用于背景减除的神经网络模型。但是,目前基于多尺度结构的背景减除模型在融合不同尺度特征时,没有对不同尺度特征进行选择。针对这个问题,提出将注意力机制引入到多尺度结构中,使模型能够产生注意力感知的多尺度特征。另外,还设计了多输入编码器和多标签监督解码器,使模型能在深度监督的训练方式下提取更丰富的多尺度特征。为了评估模型的性能,我们在CDnet-2014和LASIESTA数据集上进行测试实验,证明了所提出的方法具有较高的鲁棒性。还提出了一种基于条件对抗网(CGAN,conditional Generative Adversarial Networks)的背景减除模型。随着研究人员对生成对抗网络(GAN,Generative Adversarial Networks)的不断优化,GAN在图像分割任务中应用越来越广泛,一些研究人员已经将其应用到了背景减除任务,但是目前基于GAN的背景减除模型都将背景图片作为先验信息,因此其模型的背景减除效果会受限于背景图片的质量,且都没有考虑视频序列的时态信息。针对上述问题,提出了一种基于CGAN的背景减除模型,与先前的基于GAN的模型不同,由两个CGAN模块分别构成静态检测模块和动态检测模块,静态检测以单帧图像作为先验条件,提取图片的空间特征生成静态检测结果。动态检测模块结合了静态检测结果及其相邻视频帧作为先验条件,聚合相邻帧的动态信息生成最终的检测结果。在CDnet-2014数据集上的实验结果证明了本文所提出的模型具有较高的鲁棒性。
其他文献
高光谱图像相比普通图像在很多方面有着巨大的优势,随着高光谱图像的采集成本越来越低和精度越来越高,研究如何将高光谱图像更好的为我们的社会生活所服务变得越来越重要。本
钙钛矿一直是太阳能电池领域研究的热点。随着钙钦矿研究的不断深入,人们发现了其在发光领域的潜在价值,尤其是激光方向。然而目前光电子领域研究最为深入的钙钛矿为甲胺铅卤化物钙钛矿,这种有机无机掺杂的钙钛矿极易被水侵蚀。因此本文着重研究一种全无机钙钛矿结构——CsPbBr3/CsPbI3,相对于有机无机掺杂钙钛矿的性质更为稳定。此外,目前固态钙钛矿的生长大都依赖于云母衬底,这种衬底与材料结合紧密,不利于材
图像配准是图像处理的重要分支,在视频图像分析,遥感图像,医学运动图像和三维场景的特征恢复等领域应用广泛。在最近几年,刚性图像配准的研究工作已取得不少进展,但非刚性图
稀疏表示已广泛应用到图像处理中,例如超分辨率图像重建和目标检测等。然而,由于传统稀疏表示模型对信号进行降阶处理,致使信息损失,导致重建图像颜色失真,结构模糊。为解决这些问题,有研究将四元代数引入到稀疏表示模型中。四元稀疏表示模型仿照人眼对彩色图像各通道并行的处理方法,能有效提高算法对多通道图像的处理效果。本文将基于四元稀疏表示模型的图像重建技术拓展到两个新的应用领域——脑图谱重建和彩色图像显著性检
区块链技术作为加密货币底层的技术支撑,其去中心化、防篡改、可溯源等天然属性受到了各国政府和业界的不断关注。得益于智能合约,区块链的区块认证与交易执行可在无第三方支
随着科技的发展,航天、汽车电子、智能电网等各个领域,迫切需要一种在高辐射、高功率密度、高压高频等环境下仍然能够正常工作的功率器件。在现有的半导体功率器件之中,碳化
随着区块链技术的不断发展,区块链在现实业务场景中的应用也在不断增多。但由于区块链本身的技术特点,每一个项目都是独立的封闭式区块链网络,链与链之间无法进行数据交流,形
随着移动互联网、车联网、智慧城市等新一代信息服务的不断发展,各行各业对轨迹数据的需求越来越高。轨迹数据包含丰富的时空信息,准确及时地发布轨迹数据能够为位置推荐、交
随着物联网和大数据时代的到来,信息技术高速发展。智能设备呈现出爆炸性增长,在给人们的生活带来巨大便利的同时也面临着严峻的信息安全问题。基于软件的加密方式面临着容易被攻击破解的风险,已不能满足当前信息安全的需求。基于硬件的加密方式一般利用物理的随机性产生加密密钥,硬件加密方式具有较高的防破解能力,因而受到了国内外研究机构的广泛关注。基于硬件的信息安全器件包括物理不可克隆函数与真随机数发生器等。物理不
本文针对三维点云数据的不均匀问题以及三维场景的语义分割问题,通过对三维点云数据的采集原理以及相关处理技术进行深入理解,提出了基于二维图像灰度的插值算法和三维点云语