论文部分内容阅读
无线多媒体传感器网络(wireless multimedia sensor networks, WMSNs)指通过大量价格低廉的传感器节点以自组织的方式布置在应用场景中,这些不同种类的多媒体数据传感器节点可以不间断的获得应用场景的多媒体信息,然后通过网关节点传到互联网上。它的出现已经给我们带来了很多智能化的应用,如智能交通、智能监控和智慧城市等,因此,被学术界和工业界广泛研究。由于多媒体数据量巨大,需要进行传输前的压缩。现有的多媒体压缩标准有着优异的性能,但是这些标准对编码端有着很高的要求。另一方面,WMSNs节点是资源受限的,即能量受限、内存空间受限和运算能力受限。因此,海量多媒体数据压缩成为了WMSNs的一个重要挑战。压缩感知是一种新的采样理论,只需要通过少量的非线性投影值来重构出原始信号。一方面,压缩感知可以通过远低于奈奎斯特定律所要求的采样率去获取数据,大大降低节点所需要传输的数据量,从而减小了节点存储空间和网络传输能力的负担。同时,压缩感知将采样和压缩过程合并,只需要进行非线性采样。这样既避免了存储空间的资源浪费,又降低了对编码端的运算能力的要求。因此,压缩感知十分适合WMSNs中的压缩。在压缩感知的体系框架中,最重要的莫过于重构算法。随着对压缩感知重构算法的研究,研究者逐步意识到基于模型的重构算法能给性能带来大幅度提升。为了使得压缩感知体系实用化,考虑更加符合图像和视频实际的模型是十分重要的。因此,本文研究将压缩感知应用到WMSNs的图像和视频压缩,并使用更加符合图像和视频实际的非局部稀疏模型(non-local sparse model, NLM)。NLM是指利用图像中广泛存在相似块之间的相关性去更加容易的找到图像的稀疏算子。当NLM应用到图像压缩感知当中,我们的第一个创新点是利用NLM来获得更加稀疏的表示,第二个创新点为考虑图像是一个可压缩信号,即在重构中考虑图像细节的恢复。首先,我们提出将相似块聚合成三维的组合,通过对相似块组合进行三个维度的小波变换,就可以充分利用相似块之间的相关性,从而获得更加稀疏的表示。而在进行稀疏近似的过程中,我们使用经验维纳滤波的权值矩阵,使得变换域中代表稀疏算子的大系数有较大权值,而代表细节的小系数也有一定权值,从而细节得以保存。所以在获得良好重构PSNR的同时,也有良好的图像视觉效果。在NLM应用到视频压缩感知中,由于视频是多视角视频的一个特例,我们选择多视角视频作为研究对象。在该研究点中,我们有两个创新点,分别是利用NLM来消除多视角视频中的三个冗余(即时间、空间和视角冗余)和利用更加丰富的信息保存更多的图像细节。首先,使用NLM可以很容易的消除三个冗余,只需要寻找到足够的相似块,即既要包括同一帧中的不同相似块,也要包括来自于同一视角的不同时刻和同一时刻的不同视角的相似块。在寻找相似块的时候,我们提出了联合相似块匹配法则,它能帮助我们在噪声很大的情况,找准相似块并提供足量的相似块。在此基础之上,我们提出对相似块组合进行联合滤波。由于自适应基能比固定基带来更好的稀疏表示,我们设计了联合稀疏基求解的优化问题并最终得到自学习的联合稀疏基。与此同时,我们使用经验维纳滤波的方法来获得相似块组合的权值矩阵,从而在获得较高的PSNR的同时很好的保留了图像的细节。本文通过实验证明,基于NLM的图像和多视角视频压缩感知的算法能比现有的算法在性能上有着较大的提升,且图像细节恢复较好,有着良好的视觉效果。