论文部分内容阅读
物体的不同视图描述了物体的不同特性,如何利用这些视图的互补信息和兼容信息充分发挥各自优势,规避各自局限,从而获得对目标物体的最深刻认识,是目前学术界研究的热点问题,这类信息融合的方法统称为多视图学习算法。与单视图学习算法不同,多视图学习算法能够学习到的特征更加全面,也更加鲁棒。单视图学习算法的性能往往受限于数据本身,特别是当数据的唯一视图不够全面时,会导致学习到的特性是片面的,就像“盲人摸象”一般。而多视图特征则可以通过互补信息规避这一缺点,因此获得的信息更加全面。此外,单视图学习算法常常由于噪声的存在导致性能急剧下降。而在多视图学习中,某一个视图或者某几个视图存在噪声点时,可以利用其他视图的数据进行补充,从而增加了算法对数据的鲁棒性。多视图机器学习算法已被广泛应用于计算机视觉、生物信息学、自然语言处理和医疗图像分析等多种领域。因此,对多视图算法的探究有着极其重要的应用价值。然而,如何选择视图、确定对应系数以及构建更加鲁棒的多视图学习和聚类算法,仍然是值得研究的问题。本文的主要工作及创新点概括如下:(1)提出一种面向三维图形学的多视图分类模型。针对三维图形分类任务中没有利用多视图信息的问题,本文首先提出了一种新的多视图三维图形特征抽取方法,称为卷积自动编码极限学习机(CAE-ELM),它结合了卷积神经网络(CNN)、自动编码机(AutoEncoder)和极限学习机(Extreme Learning Machine,ELM)的特点,具有训练速度快、旋转不变性等多种特点,并能够同时抽取三维图形的两种不同视图:体素化视图和距离场视图。通过两种视图的结合,本文提出的三维分类模型能够更有效地处理三维分类任务,得到更高的性能。(2)提出一种面向多视图的全局-局部核对齐算法。为解决两步算法中全局核对齐带来的同类样本多样性限制,本文首先定义了一种局部核对齐方式,来保持同类样本的多样性。然而,局部对齐方式会将具有相似特征的不同类样本对齐到同一个值,从而导致性能降低。为了结合全局和局部对齐方式的特点,避免各自的缺点,本文提出一种混合核对齐方式,并设计了对应的交替优化算法。大量实验表明,混合核对齐的方式与全局和局部核对齐方式相比能够获得更高的性能,与其他多视图学习算法相比能获得更好的分类效果。(3)提出一种基于重构核的多视图聚类框架。为解决样本中含有噪声视图的聚类问题并减小已有多视图聚类算法对视图质量的依赖性,本文提出一种简单有效的框架去自适应地提升每个视图的质量。该框架首先基于各个视图的聚类结果自动地发现样本的异常视图,然后设计一种新的交替优化算法迭代地优化这些样本所对应的缺失视图值。该框架将聚类结果与改进视图质量有机地结合起来,进一步提升了聚类的性能。本文将三种常见的多视图聚类算法集成在该框架之下,并设计了高效的算法来求解对应的优化问题,实验结果表明,本文提出的多视图聚类框架能够提高基础多视图算法的性能。(4)提出一种基于深度神经网络的大规模多核聚类近似算法。为解决已有多核聚类算法应用于大规模聚类任务中存在的内存开销过大问题,本文提出基于深度神经网络的大规模多核聚类近似算法。具体而言,近似算法首先抽取大规模数据集的部分样本,形成一个子集,并对该子集使用MKKM,得到子集对应的指示矩阵;之后使用子集中的样本和对应的指示向量作为数据和标签训练一个深度神经网络,训练完成后固定该网络。将整个数据集通过训练好的神经网络,得到的输出作为指示矩阵。该近似算法直接将输入映射为指示向量,从而省略了多核学习算法中计算核矩阵和奇异值分解的过程,大大减少了算法对时间和内存的依赖性。