论文部分内容阅读
随着科学技术的发展,视频图像等影像数据的清晰度越来越高,他们所需要的存储与传输资源也越来越多。为了缓解存储与网络传输的负担,所以我们需要对影像数据做一定的压缩处理。HEVC(High Efficiency Video Coding)标准就是图像编码方法中的一种,它有着非常不错的编码效率,可以尽可能的压缩图像文件的同时保证图像质量。HEVC编码标准通过对图像分块来进行图像的编码,利用已经编码过的图像块来预测相邻块,将它们之间的差值记录下来就可以达到编码图像的效果。目前,将深度神经网络用于图像编码十分的火热,很多图像编码网络模型都取得了不错的效果,本文中我分别采用了长短期记忆网络(LSTM,Long Short-Term Memory)模型和生成对抗网络(GAN,Generative Adversarial Networks)模型来进行光场图像的编码。LSTM模型利用了循环神经网络,LSTM模型一共包含三个主要部分,分别是编码器,二值化网络,解码器。利用大量图像数据训练网络,可以得到一个用于编码的权重参数。在编码过程中编码器会加载这些权值参数,图像经过编码器和二值化网络会生成编码文件。解码过程中,解码器也会加载这个权值参数,将编码文件输入到解码器中就可以得到重建图像。整个编码过程可以经过多次迭代来优化,将每一次的结果代入到下一次的迭代过程中可以有效的提高编解码的效果。GAN模型可以学习输入数据的特征,根据这些特征来生成数据。我们将我们的图像数据集作为训练数据输入到GAN模型之中,GAN模型的生成网络和判别网络会在相互对抗的过程中互相优化。生成网络会依据这些图像的特征来模拟生成相似的图像,判别网络会判断生成数据的真伪。在这个过程中,生成网络生成的图像质量越来越高,直到判别网络无法再判别出生成图像的真伪时,生成图像的质量就非常接近于原始图像。我们分别使用这两种方法来编码我们的图像数据,分析这些方法的编码效果,并对其做了相应的总结。