论文部分内容阅读
“高维度小样本”问题是模式识别应用中的主要障碍之一,易导致过拟合。导致这一问题的主要原因是当我们采用像图像这类数据量较大的信息时,我们所获得的样本的数量往往远小于样本的维度。当我们采用此类数据来进行建模时,因为维数和样本的巨大差异,极易导致模型产生过拟合,使模型的解病态,从而使建模出来的模型无法达到理论预期的效果。这就是“高维度小样本”之所以是模式识别中的一个主要障碍的根本原因。经研究表明,跨越上述障碍的有效方法之一是采用参数矩阵的低秩逼近,目的是控制模型复杂度,避免过拟合。常用的低秩逼近方法需要预先指定目标矩阵秩的大小,如主成份分析,但是我们通常无法根据给定数据从直观上给出一个比较好的秩信息。因此,寻找一个有效方法来使模型参数在不需要指定秩的前提下进行低秩约束是一个比较值得探讨的问题。本文主要对于人脸图像数据进行分类研究,为了保持人脸数据的完整性和空间上可能存在的关联性,不同于以往的以向量模式为输入模式的判别模型,我们所提出的判别模型主要针对图像数据,并采用与之表示模式相对应的矩阵模式的输入,以使其能够保持所采用数据的完整性和连续性。本论文的主要贡献为:对于矩阵模式的输入数据,提出了一种新的基于稀疏约束的低秩判别模型。我们所提出的模型是建立在原Logistic判别模型的基础上的,并对其目标参数进行矩阵分解,然后分别对子成分施加低秩(稀疏)约束,从而达到低秩逼近的目的。进一步,我们将这一思想嵌入一个双边判别模型,并用坐标下降法对目标函数进行优化,使得算法在低秩逼近的同时还有效利用了输入数据的空间特性,从而得到更好的推广性能,其有效性在几个标准图像数据库的识别应用上得到验证。