基于深度神经网络的光场图像编码研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:woyaojiayou123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的发展,视频图像等影像数据的清晰度越来越高,他们所需要的存储与传输资源也越来越多。为了缓解存储与网络传输的负担,所以我们需要对影像数据做一定的压缩处理。HEVC(High Efficiency Video Coding)标准就是图像编码方法中的一种,它有着非常不错的编码效率,可以尽可能的压缩图像文件的同时保证图像质量。HEVC编码标准通过对图像分块来进行图像的编码,利用已经编码过的图像块来预测相邻块,将它们之间的差值记录下来就可以达到编码图像的效果。目前,将深度神经网络用于图像编码十分的火热,很多图像编码网络模型都取得了不错的效果,本文中我分别采用了长短期记忆网络(LSTM,Long Short-Term Memory)模型和生成对抗网络(GAN,Generative Adversarial Networks)模型来进行光场图像的编码。LSTM模型利用了循环神经网络,LSTM模型一共包含三个主要部分,分别是编码器,二值化网络,解码器。利用大量图像数据训练网络,可以得到一个用于编码的权重参数。在编码过程中编码器会加载这些权值参数,图像经过编码器和二值化网络会生成编码文件。解码过程中,解码器也会加载这个权值参数,将编码文件输入到解码器中就可以得到重建图像。整个编码过程可以经过多次迭代来优化,将每一次的结果代入到下一次的迭代过程中可以有效的提高编解码的效果。GAN模型可以学习输入数据的特征,根据这些特征来生成数据。我们将我们的图像数据集作为训练数据输入到GAN模型之中,GAN模型的生成网络和判别网络会在相互对抗的过程中互相优化。生成网络会依据这些图像的特征来模拟生成相似的图像,判别网络会判断生成数据的真伪。在这个过程中,生成网络生成的图像质量越来越高,直到判别网络无法再判别出生成图像的真伪时,生成图像的质量就非常接近于原始图像。我们分别使用这两种方法来编码我们的图像数据,分析这些方法的编码效果,并对其做了相应的总结。
其他文献
可穿戴射频识别(RFID)标签在识别、监控和传感方面具有无限的应用潜力而受到广泛关注。其中,刺绣技术被尝试应用于制备标签天线,并有学者进行了大量研究。为了避免多个导电纱
优化问题在生活中的各个领域都存在,且与我们的日常都紧密相关。近年来,启发式优化算法的出现,丰富了优化问题的理论,且因其实现简单,并具有易扩展、高效等优点,而成为研究的
随着无线网络的快速发展,人们对视频业务的各种需求也迅速增加。由于用户端设备种类的差异性,需要对视频进行转码以满足用户的不同需求。另一方面,由于无线网络资源具有动态
土壤重金属污染已成为制约农业生产与威胁农产品安全的重要环境因素。马铃薯是全球第四大的粮食作物,在我国其主粮地位日趋提高。迄今,有关马铃薯重金属的吸收与积累的研究相
计算机视觉作为一个十分前沿而又活跃的研究领域,已经发展为人工智能最重要的分支之一。基于视觉的目标检测算法已经在各个领域得到应用,比如智能视频分析系统,工业智能制造
本文以南淝河及其四条支流作为研究区域,在对研究区域内现状调查、评价基础上,基于南淝河流域水动力条件结合区域环境雌激素负荷估算,应用MIKE 11软件构建南淝河流域环境雌激
随着深度学习技术的发展,基于深度学习的目标检测取得了显著进步,然而小目标成像面积小、背景复杂,难以提取高质量的特征,使得小目标检测依然是个难点及热点。目前基于深度学
具有多自由度、多感知功能及良好的抓取操作功能的多指灵巧手受到了广泛的关注。由于灵巧手抓取模式的多样性和非结构化环境的复杂性,导致对目标物体的抓取规划变得非常复杂,
随着云计算技术的不断发展与完善,越来越多的用户和企业将数据加密后上传至云端,通过云服务器对数据进行处理和加工,由此减少本地的计算和存储开销。带关键字搜索的公钥加密
图像特征表示是计算机视觉和模式识别领域重要的研究方向。图像特征表示对图像识别与检索具有重要的影响。目前大多数浅层的图像识别与检索算法直接利用提取好的特征来进行识