论文部分内容阅读
近年来,稀疏模型被广泛应用于信号、图像以及视频处理等领域。在该模型中,信号被表达为一组固定基(也称为字典)的少量原子的线性组合。研究表明,在大多数图像处理应用中,例如图像去噪、人脸识别、纹理分析、对象识别等,相较于基于预定义字典的稀疏模型,基于学习字典的稀疏模型能够取得更好的实验性能。基于学习字典的模型能够充分利用训练信号的语义先验知识,从而自适应地学习字典。本文主要针对字典学习模型及其在对象识别中的应用进行了研究,主要的研究内容如下:
1.介绍了本文的研究背景及意义,对相关领域预定义字典的典型应用压缩感知进行了概述,重点综述了国内外字典学习理论的研究进展,并分析了现有字典学习理论在对象识别应用中存在的问题。
2.综述了重构字典学习的基本理论,重点介绍了K-SVD算法。并在此基础上提出了四种基于重构字典的识别算法,包括基于局部字典的识别算法、基于拼接字典的识别算法、基于Bayesian的拼接字典识别算法和基于Bayesian的全局字典识别算法,并对各种方法进行了手写数字识别和人脸识别实验。将不同的字典组合方式应用于对象识别任务中,并首次将Bayesian理论应用于基于重构字典的识别模型中。
3.综述了判决字典学习的基本理论,重点介绍了其中的两种典型判决字典学习模型。判决字典能够克服重构字典缺乏判决能力的缺点,从而提高识别率。提出了一种新的判决字典学习模型,在原有的重构字典学习模型中引入softmax损失函数,以增强字典的判决性。然后利用截断牛顿方法得到一个近似字典更新问题,并利用类似于K-SVD算法中的字典更新方法求解新的字典。
4.综述了在线字典学习的基本理论,包括在线重构字典学习和在线判决字典学习理论。在线学习算法能够高效地求解大规模训练集问题,这是非在线学习算法的一大缺陷。在此基础上,提出了一种新的在线判决字典学习模型,该模型在原有的重构字典模型中引入了一个线性分类器,并将期望目标函数代替经验目标函数作为最后的目标求解问题。然后提出了一种基于块坐标下降方法的在线算法。与现有算法交替更新字典和分类器参数不同,新的在线算法能够同时更新字典和分类器参数。