论文部分内容阅读
随着信息技术的飞速发展,机器学习已经发展成为当前人工智能领域的研究热点之一。稀疏性理论已被成功应用于许多机器学习方法中。核学习和谱图理论易于理解且具有较强推广能力,是当今机器学习领域的热点问题。本文将稀疏性引入到核函数的构造和图矩阵的构造中,提出了几种稀疏学习算法,采用机器学习方法常用的公测数据集验证了其性能。研究内容主要包括以下几方面:(1)在现有的稀疏编码分类算法的基础上,提出一种稀疏中心核编码分类算法。该方法首先通过k近邻思想在字典中选择中心样本,然后利用所有中心样本构造稀疏核函数,将字典和测试样本通过稀疏核函数映射至特征空间,最后在特征空间内对映射后的测试样本进行稀疏编码,利用得到的稀疏系数和误差判别函数进行分类。由于核映射时使用的是稀疏核函数,既增强了数据的可分性又减少了计算核函数的次数,使得该算法既能达到较高的识别精度,又能减少识别消耗时间。在常用的标准人脸数据库和手写体数字数据库上进行的仿真实验验证了该算法的有效性。(2)提出了一种基于核l1图的半监督分类算法。在现有的稀疏l1图方法的基础上,通过引入核l1图的思想,使得线性不可分的样本在特征空间内变的线性可分。将核l1图方法构造的图矩阵与半监督分类方法结合,构造了基于核l1图的半监督分类算法。由于获得的图矩阵增强了同类样本间的相似性以及不同类样本之间的差异性,因此在后续分类中可获得更高的分类正确率。在人工构造螺旋线数据、标准人脸数据库和手写体数字数据库上进行实验仿真,结果显示:与同类算法相比,分类正确率有所提高。(3)提出了一种基于核低秩编码的子空间分割算法。在该算法中,先通过核函数将样本集合映射至特征空间,再对新的样本集进行联合稀疏表示得到低秩编码系数矩阵,从而构造无向图进行谱聚类。由于核映射加强了数据的可分性,使得后续子空间分割正确率有所提高。在人工数据集、标准的人脸数据库和手写体数据的实验仿真表明:该算法与同类算法相比,分割正确率有所提高。本文的工作得到了国家自然科学基金(61072108,60601029,60971112,61173090),教育部新世纪优秀人才项目(NCET-10-0668),高等学校学科创新引智计划(111计划):No.B0704和中央高校基本科研业务费(JY10000902041)的资助。