多视角的图学习聚类方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:hanosn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是无监督学习中一种方法,它可以把数据切分成多个组别,并让较为相似的数据样本分到同一组别内。但是,传统的聚类方法大多是基于单个视角的数据,在多视角数据环境下往往不能取得令人满意的聚类性能。为解决这个问题,便提出了多视角聚类。多视角聚类的目的是整合多个视角数据的信息,获得更加本质的样本关系,进而求解出更加准确的分组。多视角图学习聚类是多视角聚类中的一类方法,该类方法会先学习出一个相似度图,并利用该图得到最终的簇分组。考虑到该类方法使用简便并且在聚类任务上常常能获得较好的聚类性能,所以,本文主要围绕该类方法进行拓展。目前,在多视角图学习聚类上已经取得一定的进展,但是仍存在一些需继续深究的地方。一方面,大多数方法没有对最终生成的统一相似度图作进一步优化,导致该图上还会存在大量噪点;另一方面,部分方法没有考虑到多个视角相似度图学习与统一相似度图学习之间的联系,而将这两个步骤分离开来,使聚类性能变差。另外,在构建多视角一致性与不一致性时,很多方法仅构建多视角一致性而没有明确构建多视角不一致性,从而导致提取的一致性部分中会含有干扰信息。针对以上挑战,本文提出两个多视角图学习聚类的方法:(1)带有块对角规范化的多视角统一图聚类模型。一方面,为了获得具有更高聚类性能的统一相似度图,该模型引入块对角规范化,它可以弱化统一相似度图中非同簇样本的相似度关系,并保持图中的块对角结构。另一方面,该模型同时构建视角一致性与不一致性关系,在一定程度上缓解仅构建多视角一致性而造成的一致性部分中存在干扰信息问题。(2)联合单视角图学习的多视角聚类模型。一方面,该模型将多个视角相似度图学习与统一相似度图学习这两步骤整合到一起,能够使它们在学习过程中相互促进。另一方面,在模型中也同时考虑到多个视角的一致性与不一致性关系,从而获取更加纯净的一致性部分。另外,通过在学习单个视角的相似度图时引入带有平滑规范化的子空间学习,能够更好地提取原始数据中的局部结构。提出的两个方法分别在多个数据集上进行实验,算法能在少数的迭代次数下达到收敛。与近期的一些多视角聚类的方法作比较,在大部分的数据集上都可取得最佳的聚类性能,证明所提出方法的有效性。
其他文献
现有的机器人抓取模型大多都是针对不透明的物体或折射和反射率较低的物体来进行指定的抓取任务,无法对日常生活中常见的透明物体实施有效的抓取,从而限制了机器人的应用和发展。对透明物体进行深度补全是赋予机器人抓取技能的重要方法。通过运用深度补全算法,可以对透明物体缺失深度信息的原始深度图进行有效的补全,将补全后的深度图运用到抓取模型中,使得机器人可以有效地感知到透明物体的大小和位置信息,从而实行对透明物体
学位
农药、植保机械与施药技术为植物化学保护的三大支柱,其中施药技术是连接农药学科和植保机械学科的关键环节,是农药从研发到田间应用的“最后一公里”。农药科学使用并不是一个简单的选择农药和施药量的药物学问题,而是涉及作物学、植物保护学、农业工程学、气象学等多学科交叉的系统工程。本文就农药雾滴雾化与运动特性、沉积与分布状态、流失与飘失行为,以及害虫行为与农药雾滴雾化运动和沉积分布关系等方面的研究进展展开综述
期刊
精确的环境感知系统是自动驾驶及机器人技术实现的关键,其中基于激光雷达点云数据的3D目标识别是视觉感知领域的重要任务。由于激光雷达点云数据的无序性、稀疏性、旋转性等特点,传统机器学习方法、聚类方法和卷积深度学习方法很难直接对雷达点云数据进行特征提取。本文基于现有研究提出了一种基于信息融合的3D目标识别算法,对当前的点云目标识别方法进行改进。首先,针对点云数据体素化带来的细节丢失问题,提出了一种体素预
学位
阿尔茨海默症(Alzheimer’s Disease,AD)是一类不可逆的大脑神经退行性疾病,其患病率随着年龄的升高呈显著增长趋势,被认为是导致死亡的第七大原因,目前仍然缺乏明确有效的生物标志物,只能通过早期干预延缓AD病情的发展。功能核磁共振影像(Functional Magnetic Resonance Imaging,fMRI)是研究脑部疾病的重要医学工具,可以观察大脑相关区域的功能变化,而
学位
移动互联网和自媒体的兴起使得互联网中的多媒体数据快速增加,人们对于爆炸式增长的、形态各异的数据应接不暇。如何建立一套自动化理解数据内容和分析数据关系的智能工具来帮助人们更好地利用网络多媒体数据资源成为重要问题,多媒体数据分析因而受到广泛关注。作为多媒体数据分析中两个基础任务,跨模态检索和多视角聚类旨在分析异构数据内容之间的关系,成为支撑下游应用的关键技术。本文从这两个方面入手,对多模态数据内容相关
学位
随着互联网技术的不断发展,人们的日常生活活动中产生了海量数据,这些数据中蕴含着巨大的价值,从数据中挖掘出有价值的信息是许多领域的研究课题,其中不同于相关关系,因果关系是非常有价值的信息,得到因果信息可以实现干预,反事实等行为,因而从数据中发现因果关系是许多领域的关键研究课题。因果关系发现的传统做法是使用干预或通过随机实验,这在许多情况下过于昂贵、过于耗时,甚至是不可能的,因此通过分析观测数据来揭示
学位
随着物联网和传感器网络的飞速发展,大量分布式电子传感节点广泛存在于生活的各个角落,如何为此类分布式传感器供电成为当前的关键问题。传统电池因持久性差、污染环境、灵活性低等问题有很大的局限性,基于多种物理效应的纳米发电机的出现为高效收集环境中的能量提供了可能,然而单一模式的纳米发电机面临能量转化效率低,输出性能差等问题。针对以上问题,本文提出了三种不同结构的混合纳米发电机并展示了其应用场景。论文的主要
学位
偏导射流伺服阀主要的结构特点为阀体阀芯部位两端封闭,主要功能为在液压系统中可以将微弱的电控制信号转换为大功率的流量或压力输出信号,它的动态响应快,控制精度高,压力和流量的增益线性度好。但偏导射流阀在使用过程中会受到大范围的、剧烈的温度冲击。温度冲击会直接影响到伺服阀关键零部件和油液性能等变化,在伺服阀上产生复杂的综合作用。偏导射流伺服阀在剧烈温度冲击作用的工作环境下,伺服阀的各项工作指标会呈不同程
学位
医疗信息物理融合系统(Medical Cyber-Physical Systems,MCPS)是一种用于现代医学领域的信息物理融合系统(Cyber-Physical Systems,CPS),在各种疾病的预防和检测中发挥着重要作用。每个MCPS都具备嵌入式控制设备和独立的网络系统,使用物理空间作为物理基础,通过感知设备向网络空间提供感知信息,并接收来自网络空间的控制信息对物理设备进行控制。考虑到医
学位
<正>近年来数字人民币在中国大陆发展迅速,使用场景由向公众派发数字红包、当地零售消费付款到公共服务缴费等,目前试点城市已多达23个,覆盖了全国1/5的人口。为了深化数字人民币的应用,2022年4月,深圳市地方金融监督管理局印发《深圳市扶持金融科技发展若干措施》,
期刊