论文部分内容阅读
基于稀疏模型和图嵌入的特征选择模型是近年来的研究热点,已被广泛应用在机器学习、模式识别等众多领域。研究表明,在特征选择模型中利用稀疏约束和图嵌入可以有效提高模型的鲁棒性及学习效率,有助于选择高效的特征,进而提高图像分类的准确率。本文以提高特征选择模型的鲁棒性及学习效率为目标,以无监督学习和半监督学习为理论背景,提出了几种新的基于稀疏约束和图嵌入的特征选择模型。具体地,本文主要研究内容如下:(1)传统基于图的特征选择模型大多基于两个独立的步骤:预先定义图结构,再学习投影矩阵。这使得特征选择效果高度依赖于初始定义图的质量,由于初始定义的图可能不是最优的,因此算法难以达到最优。针对这一问题,本文提出一种新的基于局部和相似性保持的无监督特征选择模型。该模型将图学习与稀疏重构并入同一个框架中学习,允许编码过程是稀疏的、自适应近邻和非负的,确保学习到最优的图结构;通过引入行一致性稀疏的l2,1范数,使得所选择的特征不仅能够保持数据的局部性和重构系数之间的相似性,而且具有较强的鉴别性和稳定性,提高了模型的鲁棒性和学习效率。(2)针对传统基于图的特征选择模型的缺点,即先定义图后学习投影矩阵的两步策略无法使算法最优,提出了一种新的基于局部保持投影的无监督特征选择模型。具体来说,该模型将图学习和投影学习统一到同一框架中,通过稀疏表示和局部坐标编码自适应地学习相似矩阵,同时通过相似图嵌入较好的保留了数据的局部结构,最终得到更适合特征选择的投影矩阵。(3)针对传统基于图的半监督特征选择方法依据预先定义的图无法准确指导标签信息的传递,且难以实现整体最优的缺点,提出了一种基于非负稀疏图的半监督特征选择模型。该模型将标签预测和投影学习集成到线性回归中,然后将线性回归和图结构学习统一在同一个框架内,使得线性回归和图学习同时进行,保证了整体最优。学习到的图可以准确地传播标签信息,这也使得线性回归可以学习到一个更具有判别性的投影,从而更好地拟合样本标签,准确地对新样本进行分类。综上,文中提出了三种基于稀疏约束和图嵌入的特征选择模型,通过理论分析和在图像分类任务上的实验,证明了所提模型能够有效选择高效的特征子集,提高后续数据分析的效果,具有较高的鲁棒性及学习效率。