论文部分内容阅读
多视角学习是近年来机器学习领域的一个热门研究方向。多视角学习利用事物的两个独立或不相关的视角以特定的训练方式来进行学习。传统的多视角学习用来处理具备多个信息源的模型。多视角学习已经证实比一般的单视角学习在处理模型时具有更好的效果。但是大多数现实生活的例子中,仅仅有单信息源的数据,因此现有的多视角学习不能直接处理这些问题。为了解决这个问题,人们提出了一种能有效处理单个数据源的新多视角学习方法,该方法是通过把原来的向量形式的单个信息源的模型多视角化成多个矩阵形式表示的分类模型,这样做能够有效提高性能。本文中,我们的目的是在多视角学习框架之下引入新设计的Universum样本,形成一种新的多视角学习模型。所引入的Universum样本不从属于任何一类样本,但通过这些Universum样本可实现整个空间域数据分布信息的引入。本文的主要工作如下:●在实现过程中,我们结合多视角学习方法MultiV-MHKS,加入可以使用的Universum样本,得到一个更加有效的多视角分类器,我们称之为基于Universum的多视角分类算法,简称为JMultiV-MHKSo由于我们是在原有的多视角学习MultiV-MHKS的基础上加入了Universum样本,因此我们的方法在算法上来说比MultiV-MHKS多了一个Universum正则化项。为了论证我们所提算法的有效性,在实验中我们将我们的算法和其它几个类似的算法分别做了对比,比较这几个算法的分类精确度和训练时间。接着,又对我们所提的算法做了进一步的讨论,在正则化参数值选取的不同,Universum样本选取的规模大小和收敛性分析三方面做了详细的讨论。最后,通过复杂度的分析,我们证明了JMultiV-MHKS比MultiV-MHKS更能够获得一个更严格的误差边界。●为了论证Universum样本的选取是否对实验存在什么影响,我们也单独对Universum样本的选取方法进行了讨论。我们在现有的选取方法中选取了两种:基于几何模型的方法和最近邻选取方法。并将这两种方法和我们实验中所用的(?)mean选取方法做了比较。最后通过实验,分析得出不同的Universum样本的选取方法对实验不会存在太大的影响。