半监督流形学习的算法分析与应用

来源 :湖北大学 | 被引量 : 0次 | 上传用户:play11200
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了基于流形的机器学习算法--流形学习。其中包括等距映射、局部线性嵌入映射、拉普拉斯特征映射和扩散映射,展现了这些经典算法的思想、推导过程以及实验效果,并在此基础上推出了维数约简算法的一个整体框架一图投影,在图投影框架中重新审视了各个算法的相似性定义,以及在信息挖掘和行为感知领域的应用。实际上,许多维数约简应用的例子都是处理一些具有部分标记样本的数据集。所以,在本文中我们将着重考虑基于标记信息的流形学习算法。我们推出了两种解决此类问题的算法来进行维数约简和数据表示,一种算法是基于拉普拉斯特征映射的,一种是基于扩散映射的。这两种算法都能够做到既保持流形的局部几何结构,又能保持整体统计标记信息。这两种算法与以往经典算法不同之处就是利用标记信息改造了基本几何信息构造的相似性矩阵。算法分别在手写数字,人脸图像和天气等数据库中得到了很好的应用。半监督的拉普拉斯特征映射是改造了经典的拉普拉斯特征映射框架而得到的,该算法使得目标函数考虑了标记信息。首先,通过局部邻域关系构建一个加权图,然后通过样本的标记信息改造这个局部结构关系使得样本之间的关系依赖于标记信息,最后通过解决广义特征分解问题得到样本在低维空间的表示。实验证明该算法通过考虑标记信息,使得性能得到了很大的提升。半监督扩算映射是一种基于传统的扩散映射的算法。该算法的相似性矩阵是通过样本标记的后验概率改造得到的,样本的标记后验概率是通过有限步EM迭代算法得到。值得一提的是,半监督扩散映射能够将不同标记的样本投影到不同的子空间中去,这样使得后续的分类和识别任务变得异常简单。并且该算法具有稳定性和抗噪音干扰性,因为样本之间的关系是逐步通过局部到整体扩散得到的。将半监督扩散映射算法应用到手写数字和耶鲁大学的人脸数据库,结果表明该算法对于分类问题具有非常好的效果。
其他文献
一个图G=(V(G),E(G))的边染色是指从其边集合E(G)到自然数子集{1,2,…,r}上的一个满射C。如果图G有这样的一个染色C,我们就称图G是一个边染色图,或r-边染色图,并用C(e)来表示边e的颜
目的:构建水稻osvdac7基因RNA干涉表达载体,获得osvdac7表达下调的转基因水稻植株。方法:采用pMCG161双元载体,以传统方法构建水稻osvdac7基因RNA干涉表达载体;愈伤组织转化
信号是承载信息的工具,信号去噪是信息处理中的重要篇章。小波分析与偏微分方程是信号去噪过程中非常有效的两个工具。其中小波理论中的小波阈值去噪与偏微分方程中的全变差
Littlewood-Richardson系数是组合数学中的一个重要研究对象,同时也是代数以及代数几何中的重要研究对象。在组合数学中,Littlewood—Richardson系数是斜Schur函数关于Schur函
在现实复杂的经济环境中,古典风险模型并不能很好的描述保险公司的运转,所以一直以来大家都致力于古典风险模型的推广,以使其更能刻画现实中保险公司的业务运行。通常保险公司将
本文研究非精确方法的收敛性和逆特征值问题的求解,给出了非精确方法的局部收敛性和半局部收敛性并且提出了若干种求解逆特征值问题的方法和它们的收敛性分析.本文主要内容分两
本文讨论无约束优化近似求解问题,在二次模型近似求解的基础上,讨论一种三次模型信赖域问题。信赖域算法是求解无约束最优化常用的方法之一,通过用泰勒展开式近似目标函数,把目标
1748年Euler建立了整数分拆的一个生成函数,基本超几何级数的研究由此开始。此后,Gauss、Heine、Rogers、Ramanujan、Watson和Slater等数学家做出了很多重要的成果,极大地推动了
本文讨论的是带有随机时滞的一类网络控制系统的H_∞输出跟踪控制问题。在连续时间网络控制系统的H_∞输出跟踪控制问题中,不仅考虑了传感器到控制器之间的网络产生的随机时
第一章主要考虑带粗糙核的奇异Radon变换在Lebesgue空间上的有界性.Radon变换的研究受Christ等人的启发,第一章的第二节证明了下面的结论定理1.1设r(x,t)在x0点满足曲率条件(C)