【摘 要】
:
多视图聚类是机器学习的重要技术,旨在分析多个视图的数据特征对观测数据进行分组。由于基于张量的聚类分析有利于提取视图间的高阶相关统计,目前的多视图聚类研究重心从基于矩阵的子空间学习转移到基于张量的子空间学习。最近的研究表明,用三阶张量来表征多视图数据,并学习其低秩或稀疏的自表示张量实现多视图聚类是有效的,但是这些方法还存在一些不足。现有的算法,极大的依赖于本质的张量自表示学习,但没有考虑求本质张量的
论文部分内容阅读
多视图聚类是机器学习的重要技术,旨在分析多个视图的数据特征对观测数据进行分组。由于基于张量的聚类分析有利于提取视图间的高阶相关统计,目前的多视图聚类研究重心从基于矩阵的子空间学习转移到基于张量的子空间学习。最近的研究表明,用三阶张量来表征多视图数据,并学习其低秩或稀疏的自表示张量实现多视图聚类是有效的,但是这些方法还存在一些不足。现有的算法,极大的依赖于本质的张量自表示学习,但没有考虑求本质张量的同时进行子空间融合,更没有考虑在流形空间融合公共子空间;此外,探索数据高阶表示时缺少对数据局部几何结构的约束、缺少考虑编码相似度张量中的高阶关系及缺少提取点对间的高阶关系。本文结合这些不足围绕多视图数据融合学习和高阶关系提取问题,进行了一系列的研究工作。本文的研究成果主要集中在如下几个方面:首先,论文围绕“如何有效融合多视图信息”的目标,提出了基于张量自表示和流形学习的多视图聚类、基于张量自表示和子空间融合的多视图聚类。前者旨在Grassmann Manifold空间进行公共子空间融合学习,后者旨在Euclidean空间进行公共子空间融合学习。第一,为了克服传统Euclidean空间运算的局限性,本文提出了基于张量自表示和流形学习的多视图聚类。我们在同一的优化模型中同时优化自表示张量、多视图公共的相似度矩阵。该方法不仅利用张量提取到高阶的视图互补信息,而且还探索了Grassmann流形度量在子空间学习中的优越性。第二,为了更加直接的实现信息融合,本文提出了融入子空间整合策略的自表示张量学习模型。现有的聚类算法不能在学习自表示张量的同时探索所有视图之间的公共子空间。该模型将子空间整合策略很好的加入优化模型,克服了子空间表示的缺陷。其次,论文围绕“如何有效利用高阶信息提升算法聚类效果”的目标,提出了三种有效利用高阶信息的聚类模型,以期提升聚类的性能。第一,为了提升自表示张量的可靠性来改善聚类,本文提出了融入低秩约束和图约束的自表示张量学习模型。该方法可以自然地捕捉到基本的全局结构和高阶相关性,并且在自表达张量学习方法中引入了图约束,使得算法保持了原空间中样本之间的局部亲和性。第二,为了进一步提取高阶的有效数据表示,本文提出了融入多维稀疏编码策略的多视图聚类方法。该算法首先学习到自表示张量,从而运用多维稀疏编码策略分析了相似度张量中的高阶统计量。它的优良性能在于学习到隐藏在多视图数据中的新颖而重要的表示,从而有效改善了基准数据集上的聚类。第三,为了充分的探索数据的内在结构,本文提出了联合利用视图内和视图间的高阶相关性实现多视图张量聚类。该方法旨在通过探索多视图数据中的两种高阶统计量,即视图内的高阶相似性(点对-点对)和视图间的高阶相关性(视图-视图)结合到自适应学习模型中,学习数据的本质结构。最后,作者对所提的不同算法,进行了一系列的实验验证,实验结果证明了所提出模型在多视图聚类领域的有效性和实用性。本文提出的算法框架深入的挖掘了多视图数据的本质结构,显著提升了聚类的性能,并丰富了机器学习和聚类分析领域对该问题的研究内容。
其他文献
随着大尺寸平板显示器向8K及以上高分辨率方向的快速发展,超高画质的需求对显示器的时序控制器T-CON和源极驱动器SD之间的高速传输提出了极大的挑战。8K数据的大传输量和高传输速率,使得大尺寸显示屏的负载和寄生效应对信号传输路径的影响十分突出,导致信号传输系统的不稳定和传输信号质量的恶化。为了解决8K显示面板的频率带宽和信号传输质量等问题,本专业博士学位论文提出了新型点对点高速信号传输技术,对传输协
微尺寸LED(Micro LED)器件及其阵列因其功耗低、寿命长、响应时间短等显著特点,在显示、通信、医学治疗等领域,例如显示器的背光单元、自发射显示单元、以及可见光通信系统的发射端光源等具有广泛的应用潜力。为此,亟需设计和制备满足需求的高效高性能的微尺寸LED器件。针对微尺寸LED器件发光效率、-3 d B带宽特性的影响因素,本论文从提升发光效率的角度着重在器件结构、侧壁结构及其集成上开展了仿真
金属氧化物(Metal Oxide,MO)薄膜晶体管(Thin Film Transistor,TFT)因具有以下优势:1)载流子迁移率适中;2)大面积均匀性好;3)工艺制备温度低;4)可见光透过率高,被认为是下一代显示领域和新兴柔性应用中最有前景的新技术之一。然而,随着新型显示技术朝着大尺寸、超高清、高帧率和柔性应用等方向发展,TFT作为显示面板的构成要素,要求其必须往缩小尺寸和减小沟道长度的方
由于固体燃料成分复杂,其燃烧会经历一系列物理化学过程,属于非均相燃烧体系。深入理解燃料燃烧特性及燃烧产物的形成及转化过程是提高能源利用效率及控制污染物生成的基础。在高温条件下,固体燃料的燃烧反应很快,目前的燃烧模型仍存在适用范围小、经验参数选取困难等问题,燃烧特性及产物的实验研究是发展和优化燃烧模型的重要依据。对于高温复杂环境下的原位快速测量技术的发展为燃烧机理研究提供了新的方向。因此,本文致力于
河南省第十一次党代会提出确保高质量建设现代化河南、确保高水平实现现代化河南的奋斗目标,并将实施以人为核心的新型城镇化战略作为"十大战略"之一,这是新时期破解发展矛盾、促进城乡融合、激发发展动力、推动高质量发展的必然选择。为此,要遵循城镇化发展规律,凝聚各方力量,创新方式方法,着力优化城镇化空间布局,推动中心城市增强区域增长极和动力源功能,促进县域经济发展,加快形成以中原城市群为主体、大中小城市和小
超薄高密度柔性集成电路封装基板(FICS)在柔性电路板基础之上,往更高集成密度、更轻薄、更易弯曲扭转的方向发展。随着IC行业进入7-14纳米制程,超薄高密度FICS也进入2m以下制程,对材料和制造过程的品质控制性能要求也不断提升。在FICS表面缺陷检测过程中,仅靠基板传统检测方法,已无法达到工业生产的精度要求。在FICS图像预处理环节中,存在去除噪音的同时去除原有图像的纹理信息等问题。对于高倍显微
神经系统主要包括中枢神经系统和周围神经系统两部分,神经系统主要通过复杂的神经网络结构传输电信号来协调身体各部位的活动。无论是中枢神经系统还是周围神经系统损伤都会破坏脑组织与目标组织之间的电信号传导,导致患者功能的丧失。因此恢复神经组织电信号传导功能,重新与远端目标组织建立信号传输,是神经损伤修复的关键。而目前包括手术治疗、药物治疗、细胞治疗、外泌体治疗及组织工程支架治疗等策略均忽略了神经电信号传导
2.0μm单频光纤激光在高分辨率光谱学、非线性光学、激光雷达和引力波探测等领域拥有广阔的应用前景。2.0μm单频激光对人眼安全,可应用于大气中的相干探测和空间通信领域。相比于常见的1.0μm单频光纤激光,2.0μm单频光纤激光拥有更高的非线性效应阈值,在单频光纤激光输出功率提升方面更具发展潜力。此外,高功率单频光纤激光可应用于长距离相干探测,且其低噪声特性使得探测灵敏度更高。为了满足相关应用领域对
与普通绝缘体不同,拓扑绝缘体的边界上存在受体拓扑保护的边界态。这种边界态对结构参数的平缓变化不敏感,在信号的无损传输方面具有潜在的应用价值。除了在量子系统中实现电子的拓扑绝缘体,研究者们也试图在各种经典系统中寻找和实现拓扑绝缘体,包括光学、声学、机械、电路系统等等。其中,电路系统是最近几年才用于拓扑态的研究,并逐渐形成了拓扑电路这一概念。拓扑电路主要基于共振电路网络建立的,所需的电子元件简单;并且
应力发光材料是一种在外界机械刺激(如:拉应力、压应力、剪切力以及摩擦力等)作用下将机械能转化为光能的介质,在人工智能皮肤、结构健康诊断和应力传感器等众多领域有潜在的应用前景。本论文基于新型应力发光材料的设计与制备开展研究工作,针对当前生物体内应力分布原位、实时检测对应力发光材料发光波段、荧光强度和应用方法的需求,通过材料设计、机理研究和性能测试等方法,系统地开展了高性能近红外应力发光材料的设计、合