论文部分内容阅读
回归(Regression)方法作为机器学习领域的一类基础模型,被广泛应用于数据的特征提取、分类、预测等任务中。然而,在大数据时代背景下,数据中含有诸多不确定性因素如高维、复杂噪声等,给传统的回归方法带来挑战。研究鲁棒回归模型对于实际情形中的数据分析具有重要意义。基于此,本文提出了几种基于鲁棒回归分析的图像特征提取和分类方法,主要工作如下:(1)提出了一种基于成对关系的子空间回归(PRDR)算法。该方法基于回归模型,从样本的Pairwise关系出发,将样本在原数据空间和标签空间中的成对关系嵌入子空间中,使得特征空间中同类特征的距离尽可能小,而不同类特征的距离尽可能大。在特征单位化条件下,该方法以最近邻分类为导向实现有监督的特征提取,从而增强特征的判别性。多个数据集上的实验验证了PRDR方法的可行性。(2)提出了一种基于鲁棒非负表示的子空间回归(NRDP)方法。为捕获数据间的相似关系,该方法采用(?)1范数下的非负表示进行数据关联建模,所求的非负表示系数直接反映了数据间的相似程度。基于该表示系数划分每一样本的局部样本和非局部样本,进一步以最小化局部散度和最大化非局部散度为目标,求得相应的判别投影矩阵以实现无监督下的特征提取。多个数据集上的实验验证了NRDP方法的可行性。(3)提出了一种局部约束组竞争回归(LDMR)方法。考虑到传统矩阵回归的分类方法通常采用各类重构误差进行分类,不同于其他方法对表示系数进行正则化,LDMR直接对各类重构图像施加惩罚,并采用各类重构图像的内积正则化来降低不同类别之间的相关性。为区分不同类别在表示中的作用,通过测试样本与各类别所张子空间的距离刻画其局部关系,对各类别施加不同权重,以增强模型的判别力。实验表明LDMR在图像光照、遮挡等变化下具有更强的识别鲁棒性。(4)提出了一种增强组稀疏非凸约束判别回归(EGSNR)方法。由于传统(?)1范数与矩阵核范数的有偏估计,EGSNR采用近似无偏的非凸MCP函数逼近(?)0范数。基于MCP函数导出向量γ范数和矩阵γ核范数,用以描述图像中的稀疏噪声和低秩噪声,并采用(?)2,γ范数增强表示系数的类别稀疏性。设计相应的ADMM算法进行求解,并在多个数据集上验证了EGSNR的可行性。