多视图特征与缺失特征聚类算法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:yvhtoss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类算法是机器学习、数据挖掘领域重要的研究内容,它能够自动地从海量无标签的数据中提取信息使得相似的数据被聚在一起而不相似的被分离开来。最近几年来,具有多视图特征和缺失特征的聚类算法研究越来越得到学术界的关注,逐渐成为研究的热点问题。现有的多视图聚类方法通过相似度或者特征融合的方法在最优的相似度上做聚类,但是往往优化步骤复杂、算法复杂度较高。同时现有的缺失聚类算法将缺失值填充和聚类过程分割开来,往往不能取得令人满意的聚类结果。为了解决上述的两个问题,根据对目前已有的多视图特征聚类算法和缺失特征聚类算法深入研究,本文提出了基于后期融合的高效多视图特征聚类、基于后期融合对齐最大化的多视图特征聚类和缺失特征的k均值聚类。本文工作的贡献可以概括为三个方面:(1)提出了一种基于后期融合的高效多视图特征聚类算法框架(MKKMLF)。该框架通过生成由不同视图产生的多个聚类划分矩阵融合成最终的聚类划分结果。提出的后期融合用于多核方法来增强聚类结果的多样性的工作,同时大大降低传统多核聚类算法的时间复杂度。为了实现所提出的后期融合的框架,两种新颖的均值和自适应权重的算法被提出来解决所提出的多核k均值聚类优化问题,并且证明了收敛性。此外,从理论和实验上证明了这两种算法的时间复杂度随着样本数量的增加而线性增长,这使得所提出的算法的实用性大大增强。经六个多视图特征的标准数据集实验证明,MKKM-LF在大大减少时间开销的同时,始终展示出与目前最优的多核聚类算法相当或更好的聚类表现。这充分验证了基于后期融合的多核聚类框架的优势。(2)提出了一种基于后期融合对齐最大化的多视图特征聚类算法(MVCLFA)。MVC-LFA首先从理论上证明了最大化各个视图的划分矩阵和最优聚类结果之间的对齐在概念上等价于最小化现有的k-means算法的损失函数。因此,所提出的后期融合对齐最大化不仅能够使得各个视图的聚类结果趋近于一致,同时也有助于聚类性能的提升。MVC-LFA尝试通过最大化一致聚类矩阵和加权基划分矩阵之间的对齐来解决多视图特征聚类问题。为了高效的求解优化目标,一种轮替优化算法被提出来解决所设定好的优化目标,并且从理论和实验上都证明了它的收敛性。与现有的多视图特征聚类方法相比,MVC-LFA在测试集上表现出了更好的聚类性能和更低的时间复杂度。(3)提出了一种基于k均值的缺失特征聚类方法(k-means Filling)。与现有的算法独立进行填充和聚类学习不同,目标式将两种处理过程统一为一个优化目标。通过这样的设计,缺失的特征被交替地估算以更好地用于聚类,而现有的已经观察到的未缺失的部分在整个过程中保持不变。此外,通过提出一种具有快速收敛性的轮替优化算法来解决不完整数据聚类中的优化问题。在九个UCI标准数据集和一些大型实际应用的数据集上的实验表明,与目前常用的缺失特征聚类方法相比,所提出的算法始终达到更优的性能。
其他文献
学位
学位
学位
学位
随着科技的进步和社会的发展,位置信息服务成为了智能社会和现代战争不可缺少的重要服务。现有的定位技术中应用最广泛的是卫星导航系统,但卫星导航系统具有脆弱性,难以满足无缝定位的要求。利用覆盖广泛的移动通信系统与伪卫星等高精度定位技术融合实现导航通信一体化将是未来实现广域高精度定位的发展趋势。本文对面向导通一体的区域定位导航系统信号体制进行设计,并对新体制信号的性能进行评估。论文的主要工作总结如下:1、
学位
近年来,以卷积神经网络为代表的人工智能技术促进了计算机视觉领域的发展和实际应用。目标检测因CNN模型的成功应用而取得了很大的进步,各种先进的目标检测器层出不穷,推动了以目标检测为基础的计算机视觉技术的落地应用。基于CNN模型的目标检测器的骨干网络不仅对最终检测有影响,而且对检测头的性能发挥也有影响。研究者们以图像分类模型为基础,提出并改进了一系列用于目标检测的骨干网络。以特征金字塔结构为代表的骨干
在未来信息化战争中,卫星拒止条件下,现有装备无法满足在复杂环境中实现高精度导航定向的需求。与此同时,无人系统对独立于卫星导航的全自主、高精度、长航时的导航需求也愈加迫切。自然界部分生物可以从自然界的偏振光、地磁场等环境中提取自身运动的航向、姿态等信息用于导航。这种本领具有全自主、抗干扰、测量误差不随时间累积等特点,可以有效改善当前导航系统中定向误差累积,环境适应性不强等问题。因此,研究偏振光地磁复
近年来,无人机由于具有环境要求低、操作简单不易出错、灵活可靠成本低等特点,在军事领域和民用领域都获得了广泛应用。但随着任务环境越来越复杂、任务要求越来越高,单个无人机的有限容量已经不能够满足复杂的任务需求,利用多无人机协同执行任务成为了重要发展趋势。通过多无人机协同航迹规划可以实现对无人机群的整体控制,从而让航迹生成更加合理、飞行过程更加安全、任务完成更加高效。多无人机的协同航迹规划问题既要考虑防
认知雷达作为智能化雷达的初级阶段的产物,在军用、民用领域有着十分重要的应用。自适应波形设计技术是认知雷达的关键技术之一,是认知雷达智能性的集中体现。自认知雷达的概念提出以来,自适应波形设计技术就受到了相关领域学者们的广泛关注。本文对基于概率密度函数间欧式距离测度的自适应波形设计问题展开研究。第一章首先梳理了认知雷达的发展过程和研究现状,对现有的认知雷达架构进行统一;并且归纳了当前认知雷达自适应波形