基于张量自表示学习的多视图聚类

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:lelerui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代和电子信息技术的飞速发展,多视图数据的身影时常出现在不同领域的科学研究和各种实际应用场合中。与单视图数据相比,多视图数据因为可以提供更多对学习任务有用的信息,所以对于聚类和分类学习任务具有更好的性能,因此多视图学习一直是人工智能和数据挖掘等众多领域的重要研究方向。近年来,基于张量奇异值分解(t-SVD)的多视图聚类算法,充分利用张量数据的低秩特性,可以更高效、更彻底地探索多视图数据之间的内在联系和本质结构,在提高算法聚类性能中取得了令人瞩目的成绩。然而,已有的基于t-SVD的张量核范数低秩约束方法忽视了不同奇异值之间的贡献度差异,导致处理噪声(含有光照、遮挡)数据时,算法聚类精度和稳定性出现明显退化。针对此问题,本文为了改进张量核范数低秩约束存在的不足,提出了两个更加有效和鲁棒的算法模型,本文具体工作如下:基于t-SVD的张量核范数忽略了不同奇异值之间的贡献度差异,导致算法聚类性能退化,为解决这一问题,本文提出了基于加权张量核范数低秩约束的多视图聚类模型(WTN-MVC)。该模型使用加权张量核范数对张量进行低秩约束,给每个奇异值分配不同的权重,有效地利用了不同奇异值间的贡献度差异先验信息。在此基础上,本文使用交替更新方法(ADMM)对所提模型进行有效的优化,并给出了完整的优化算法,在不同数据集上的聚类结果均表明本文所提模型明显提高了聚类性能。基于加权张量核范数低秩约束的多视图聚类模型(WTN-MVC)虽然嵌入了奇异值贡献度差异这一先验知识,但是只对子空间张量进行低秩约束,忽略了每一个视图下自表示系数矩阵的稀疏性。针对WTN-MVC模型所存在的问题,本文提出了基于加权张量核范数和稀疏表示的多视图聚类模型(SWTN-MVC)。引入l1范数对每一个视图的自表示系数矩阵施加稀疏约束来描述高维数据的局部结构,用低秩和稀疏表示同时约束自表示系数矩阵,进一步提高聚类算法的稳定性和准确性。同时,本文给出了完整且有效的优化算法,并对模型在不同的数据集上进行大量实验,不同数据集的聚类结果均比同类型算法聚类结果有明显提高。
其他文献
由于嵌入式系统的特点,嵌入式设备的软硬件往往是按需设计,无法预留满足各种功能的接口。这导致了嵌入式设备在切换工作场景时,其软硬件往往需要重新设计,以满足用户的个性化需求。同时,在通过分析某工程客户“机器人+视觉”的应用,发现该应用需具备多种功能,在项目的应用过程中,往往需要根据跟用场景的不同而频繁调正控制器的软硬件。为了有效解决上述问题,本文针对该工程客户“机器人+视觉”的应用,设计了一个可组态的
学位
牙科树脂以其良好的物理化学性能及容易操作等特点,成功取代了传统的银汞合金成为了目前牙齿修复的首选材料。但树脂修复体的平均寿命仍较大程度落后于银汞合金,其主要原因即材料本身力学性能不足导致的修复体断裂,以及树脂聚合收缩或热膨胀系数不匹配导致的边缘裂隙和二次龋齿等。因此,为了解牙科树脂固化动力学特征,相继诞生了一系列固化监测方法,如差示扫描量热法、动态热机分析法、介电分析法等。但这些方法大多为接触式方
学位
如今,电子商务与人们的日常生活密切相关。电子商务平台提供评论区供用户在线评论,评论数据会长期保存在电商平台上。这些评论对于消费者来说,直接影响到是否选择该商品;对于商家来说,可以了解用户对商品的评价,并及时改进不足。但各个电商平台上的评论区积累的评价内容十分庞大,直接阅读评论十分费力,难以获取有效的信息,不仅降低用户阅读评论的效率,也使得商家难以获取用户反馈的信息,增加改进商品的难度。因此如何在如
学位
三元组到文本生成旨在将知识图谱三元组映射到描述其信息的文本,在普遍使用知识图谱作为信息数据存储的大数据时代下,三元组到文本生成技术不仅可以助力互联网数据分析以提高产能和效率,并且对于自然语言中的结构化与非结构化数据转换研究发展具有重要的实际意义。从知识图谱生成文本是一项基本任务,任务的完成度取决于生成句子的质量以及对信息描述的准确性,以前的研究大多采用标准的序列到序列方法,这不可避免地无法捕获图结
学位
随着我国汽车保有量的不断上升,城市的泊车空间变得越来越紧缺,泊车环境也愈发严苛,特别是在大城市中,安全泊车已经成为困扰人们的问题之一,在交通事故中,因为泊车失误导致的交通事故也屡见不鲜。作为自动驾驶汽车的重要组成部分之一,自动泊车系统在汽车发展行业一直具有广泛的应用前景,也是当前研究自动驾驶以及汽车智能化技术领域的热点。当前自动泊车系统仍存在几个明显缺点:首先,现有自动泊车系统都是基于倒车实现,而
学位
当伺服系统的运行工况发生变化时,如负载转动惯量和负载转矩的改变,会对系统控制的平稳性能产生较大的影响。由此可见,伺服系统的负载鲁棒性是高性能伺服系统的一项重要指标。因此,本文对存在负载转动惯量和负载转矩扰动的永磁伺服系统鲁棒控制进行了研究。首先,本文详细介绍了永磁同步电机数学模型的简化过程,给出了永磁伺服系统的矢量控制架构,并描述了永磁伺服系统的工作原理。为了能够更好地设计鲁棒控制器并分析其性能,
学位
随着社会科技的进步信息时代的来临,我们日常生活中产生了越来越多大规模且高维度的数据。这些数据往往具有物理意义,呈现出非负性,我们称为非负张量数据。非负张量数据中有许多有价值的非负信息,因此对非负张量数据进行特征提取是分析与挖掘潜在信息的必要手段。在特征提取领域中,非负张量分解是一种进行特征提取的有效方法,它可以直接对张量数据进行表征,所以被研究人员广泛的使用。但是对于经典的非负张量分解算法来说很难
学位
随着社会经济的持续发展,我国对电能的需要日益提高。在较为发达的地区,由于架设新输电线路难以实现及各种条件因素的制约,导致用电形势日益严峻。然而架空线路的载流量大小除了与导线自身的性质有关外,还与气象条件存在密切的关系。同时,人工智能算法在气象数据的统计分析方面有着巨大的优势。因此,如何使用人工智能的相关算法有效地挖掘架空线路的载流能力以满足人们日益增长的用电需求成为了架空线路运维领域亟需研究和解决
学位
近年来,社会的发展给人们各方面生活都带来了很大的改善,但也因此打乱了人们从前的工作生活规律,现今越来越多不规律的生活作息现象在年轻一代中显现,导致了各种疾病的产生。脑肿瘤作为致死率较高的人脑部疾病,也渐渐向年轻一代转移,垂体瘤便是其中一种常见的颅内脑肿瘤。核磁共振成像(MRI)技术由于其高质量、高分辨率、多模态等特点,被广泛应用于临床脑部医学成像。但关于如何将得到的脑垂体瘤MRI影像中垂体瘤部分分
学位
微小故障的诊断对保障现代工程系统的可靠性和安全性具有重要意义,也是故障领域很有挑战的任务之一。早期的微小故障如果未被检测出来,可能会演变成其他类型的故障,轻则损害系统的性能,严重时会导致系统瘫痪失效,引发灾难性的事故。比如在发动机旋转失速的诊断中,如果能够及时准确检测出旋转失速,防止喘振现象的发生,就能很好预防飞机出现重大事故,这对保障航空发动机安全稳定运行具有重大意义。随着信息技术和故障诊断领域
学位