论文部分内容阅读
稀疏域图像建模旨在寻求一种图像紧凑而又简洁的表示方式,进而挖掘出图像中有价值的信息,以便进一步加工处理。近年来,稀疏域模型受到广泛关注并推动了计算机视觉领域的发展,但在实际应用中,仍存在着受限等距性质的限制、稀疏性和不确定性、全局结构性的缺失、非紧凑性与高复杂度、耦合性过强等瓶颈问题。本文对上述问题进行了深入的研究与分析,基于进化计算、低秩表示和深度学习的思想针对性地提出了解决方案,并探讨了提出的模型在图像重构方面的应用。本论文的主要贡献概括如下:1.匹配追踪是一类解决稀疏表示原子选择问题的高效方法,其基本思想是选择相关性最大的原子做为候选原子,这种以相关性为主导的贪婪搜索技术受到了受限等距性质的制约,极易陷入局部最优解。对此,本文提出了一种基于进化计算的正交匹配追踪算法。该算法在进化计算的框架下对信号进行重构,将原子与残差的相关性视为一种启发式信息,用来指导原子的选择,并利用进化计算种群优化的策略提高算法跳出局部最优的概率。对不同分布的一维信号重构实验表明,该算法获得的重构概率和重构精度均优于现有经典的匹配追踪算法。另外,对二维图像的重构实验结果也进一步表明了该算法的优越性。2.稀疏模型的非凸性使得它很难获得一个确定的解析解,面对这种不确定性,许多算法放宽了模型的限制条件,或者采用凸松弛技术使模型可解,虽然在效率上有所提高,但它们忽略了?0范数的本源问题–组合优化,这也是搜索能力受限的根源所在。为此,本文受进化计算启发式搜索的启示,提出了一种基于高斯模型和进化优化的图像表示框架,该框架对光滑和复杂图像块采取差异化建模,用高斯模型对光滑块进行建模,并通过贝叶斯推理得到光滑块的解析解;对于复杂图像块,结合PCA字典的结构性与方向性设计了一系列启发式进化算子,实现了从组合优化的角度对复杂图像块进行精确重构。该框架在图像压缩感知重构、超分辨和修复问题当中展现了其有效性。3.分块处理是稀疏域图像建模常用的手段,它在提高了运算效率的同时也带来了图像全局结构性的缺失,而这种缺失是很难通过图像块的聚合与重叠来弥补的。针对这一问题,本文提出了一种基于高斯混合模型的低秩图像修复方法,该方法将图像块的局部统计特性嵌入到核范数模型当中,不但利用高斯混合模型来保持图像局部的细节信息,还通过核范数来描述图像全局的低秩结构,从而实现了对一类具有潜在低秩结构的图像数据的修复,并理论上揭示了高斯混合模型结构化稀疏的本质。实验结果表明,该算法比现有经典算法具有更强的鲁棒性。4.在解决图像超分辨、人脸画像合成等不同模态数据转换的问题时,稀疏模型通常会经过一个多模态字典训练阶段,在该阶段中两种模态的字典通常是交替、独立学习的,而不是在一个紧凑的框架内联合优化。在测试阶段,稀疏系数的计算又涉及到复杂优化问题的求解,大大降低了运行效率。受卷积神经网络成功应用于图像重构领域的启发,本文剖析了卷积神经网络与稀疏表示内在联系,并针对以上问题提出了一种改进的卷积神经网络模型应用于人脸画像合成。与传统人脸画像合成方法相比,该模型不但具有端到端的封闭形式,而且合成阶段不需要求解复杂优化问题。在人脸数据集上的合成实验表明,该方法不仅在合成效果上有所提升,还将传统方法的效率提高了1到2个数量级,展示了其潜在的应用价值。5.在基于稀疏表示的超分辨问题中,通常假设同一位置对应的高、低分辨率系数相同,这会强制同一位置的高、低分辨率图像的结构相同,而实际上高分辨率图像要比低分辨率图像的结构信息复杂得多。因此,有学者利用线性映射来表示低分辨率系数到高分辨率系数的映射关系,以此降低高、低分辨率之间的耦合性。但线性映射不足以描述两模态之间的复杂映射关系,为此,本文提出了一种半耦合卷积稀疏编码方法,利用高度非线性的卷积来描述高、低分辨率系数之间的映射关系,并将线性映射的方法作为一种特例统一到我们的框架中来。实验结果表明,该方法与现有经典算法相比更加灵活有效。