论文部分内容阅读
学习问题是利用有限的观测数据来寻找待求依赖关系的问题。在实际工作中,往往存在这种情况,即获得的样本包含大量的未标记样本,同时又有少量的标记样本。半监督学习就是解决这类学习问题的方法。因此半监督学习是一个需要解决的实际问题。
半监督学习的具体方法已经有很多,例如:最近邻法、半监督支持向量机以及流形上的学习方法。半监督学习的推广能力,是需要研究的问题。推广能力的研究对实际工作具有指导意义。
转导推理是Vapnik在1979年提出的一种推理方法。不同于一般的归纳-演绎方法。转导推理的目标是估计某一未知函数在预测点上的值。而不是预测该函数在整个定义域上的值。问题的关键是,通过求解一个要求较低的问题,可能得到更好的解,即不需要解决一个比实际需要更高的问题。
在文章第一部分,主要介绍学习理论的发展过程,学习理论要研究的主要问题,以及本文的研究背景。
在第二部分,首先介绍半监督学习的两种表达方式,建立半监督学习的研究模型。在RKHS空间中讨论半监督学习问题的正则化方法。然后通过一般的支持向量机,介绍半监督支持向量机的构造方法。同时比较两种支持向量机的区别与联系。
在第三部分,首先详细介绍了转导推理方法。然后将转导推理应用到半监督学习中,得到转导推理的推广能力。最后介绍等价类,同时引入VC维的概念。通过证明等价类是有界的,来证明我们得到的结果是成立的。
在第四部分,介绍有关流形上的学习内容,我们将所有的样本放在一个流形上。通过对标记样本的研究来对未标记样本进行分类。然后利用一个重要的容量概念覆盖数,我们得到流形上的学习问题推广能力的界,同时利用我们的结论找到流形上学习的收敛速度。