基于可微分子空间学习的双模聚类研究

来源 :福州大学 | 被引量 : 0次 | 上传用户:zgbian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类作为机器学习领域中一项基本而重要的任务,得到了极大的发展。具体来说,该任务以数据标签未知为前提对数据进行分组,应用范围广泛。在过去数十年间,单模聚类的方式占据了主导地位,这种方式仅考虑到样本在特征上的分布情况。然而,最近的研究表明,双模聚类的性能表现通常优于单模聚类。具体地,双模聚类基于样本和特征之间的二元性,即样本可以根据其在特征上的分布进行分组,同时特征也可以根据其在样本上的分布进行分组。这种双向同步划分的方式潜在地考虑到了数据的内部关系,显然十分适合于结构化数据,因此在应用领域颇有建树。例如,它可以对推荐系统中的用户和电影进行并行聚类。目前,虽然存在一些算法,但仍有许多问题亟待解决。以此为出发点,本文借助于子空间学习和可微分编程等方法,探索双模聚类相关问题,并有贡献如下:1.提出了一种基于类别一致性学习的稀疏近邻约束双模聚类方法。该方法将双模聚类描述为非负矩阵三分解问题,同时还建模了特征空间和样本空间中近邻与类别的潜在关系,并通过两个正则项保持了数据亲和性和标签分配的一致性。然后,通过一种乘性迭代规则求解目标优化问题,并从理论上保证了算法的收敛性。此外,文中还对算法进行了参数敏感性、邻接关系构建等相关讨论。最后,综合实验表明,该算法与现有算法相比具有良好的竞争力。2.提出了一种基于全局和局部判别性的健壮带权双模聚类方法。具体地,为避免数据噪声带来的不良影响以及考虑到特征间存在着重要性不同的情况,该方法在聚类过程中同时建模并学习数据噪声与特征权重。此外,它从全局角度考虑到了样本及特征的簇间散度关系,亦从局部角度考虑到了样本及特征的高维邻接关系,并以正则项的形式引入目标函数中。最后,文中对算法进行了收敛性、参数敏感性等相关讨论,并通过完整的实验阐明了该算法的出色性能。3.提出了一种可微分视角下的双模聚类方法。该方法同时考虑到数据和类别间的线性及非线性关系,将对偶正则化矩阵分解作为基本目标函数,并以非精确交替最小二乘法为基本框架,进行可微分化。具体地,将更新规则中的某些部分参数化,并以此构建神经网络来学习。相较于传统方法,这种方法对初始化更不敏感,且可以通过损失函数学习额外的约束,而不需要嵌入于算法中,通常可以获得更好的性能。最后的实验表明,该方法是有效的。
其他文献
随着信息通信产业的发展,在我们经历了互联的网时代、移动互联网的时代之后,如今已经走向物联的网时代,这个时代赋予了应用创新和发展的更大的机的会。在诸多场景应用中,对的于物的联网技术运用的得最丰富和的典型的就是的智能家居。智能家居是的以家庭的住宅为的平台,使用的物联网技的术集成与的家居生的活有关的基础的设施,提供了智能化的智能家居服务,从而为人们提供便利和舒适居住环境。同时随着各类智能虚拟助手的兴起,
学位
视觉目标跟踪是计算机视觉的一个重要研究领域。对于一个图像或视频序列,在仅有第一帧标注的情况下,视觉跟踪方法需要在后续的帧中预测目标位置。视觉目标跟踪可以对图像与视频中的任意目标进行跟踪,因而常常作为大型视觉系统的重要组成部分,具有较高的理论和应用价值。基于深度学习的目标跟踪方法在多个测试基准取得了较好的表现,但是仍然存在模型构建成本高、泛化能力受限、物体表征精确度低等问题。为应对上述挑战,本文从语
学位
随着智能手机等设备的普及,各种数字图片更加频繁地出现在人们的日常生活当中。如何让计算机通过图像来认识世界是许多学者一直研究的任务,其中一个重要子任务是图像显著性检测。图像显著性检测是许多图像处理任务的重要步骤之一,目前已经提出很多图像显著性检测方法。RGBD图像相较于彩色图像拥有额外的深度图,具有更全面的3D空间结构信息。本文致力于研究基于深度学习的RGBD图像显著性检测方法,包括基于边缘感知和跨
学位
文本情绪原因识别任务的目标是从文本中识别某种情绪表达背后的原因,已逐渐成为自然语言处理领域中的热点研究方向之一。近年来,随着深度学习技术的发展,该领域的相关研究取得了不错的进展。尽管如此,仍然存在着诸多挑战:未能充分利用文本子句间的相对位置距离特征,难以精确定位目标情绪子句的位置所在;未能充分挖掘文本中字符级、词语级等多粒度的文本语义特征;不能很好解决情绪多样化和数据不平衡带来的模型性能受限的问题
学位
公共交通在很大程度上能提高道路利用率,降低程度拥堵。城市轨道交通在公共交通中占据了相当重要的一环,相对于普通公交而言,轨道交通拥有独立路权,不会受到高峰时期道路拥堵的影响,同时城市轨道交通的运力又远大于同样拥有独立路权的快速公交。城市轨道交通成为了越来越多大城市缓解道路拥堵问题,改善路面交通的首要手段,是城市交通的核心之一。地铁客流关系到地铁系统的运营调度,是地铁数据中重要一环。分析不同条件下地铁
学位
跨领域文本情感分类旨在利用迁移学习算法实现领域间的知识迁移以解决目标领域标注样本匮乏的问题,是自然语言处理领域中重要研究分支之一。目前研究者们提出了一系列基于深度学习的方法来学习领域间的共性特征并取得了一定的成果。尽管如此,仍然存在以下挑战:现有方法捕捉句子中局部关系的能力不足,导致情感分类存在偏差;以往方法在提取文本特征时难以有效利用文本的上下文依赖关系与整体信息;现有模型存在分类特征空间受限的
学位
发型是人脸外貌的重要特征,发型识别在许多领域都具有价值,如美容美发行业的发型推荐,游戏角色自动生成中的发型选择等。基于头像的发型识别是指给定一张包含具有头发,人脸信息的头像图片,通过对头像的分析,识别出头发的造型。本文针对网龙网络游戏公司提出的发型识别的任务需求,通过计算机视觉技术对发型识别进行了研究,主要工作如下:(1)通过引入注意力机制和多金字塔池化模块,本文提出了基于PSPNet改进的头发语
学位
随着知识数量的指数增长,知识图谱成为了组织知识的有效工具,其已被广泛应用于各行各业。近年来,为了应对知识缺失问题,以机器学习为基础的知识表示学习方法备受关注,该方法将知识表示为向量,使计算机能够理解和使用。目前,平移模型和基于神经网络的模型是知识表示的两大研究热点。平移模型虽然可以有效地捕获知识的结构信息,但该类模型设计简单,学习能力常常受到限制。基于神经网络的模型虽然表现出强大的学习能力,但其忽
学位
异构信息网络是现代信息网络中的普适性存在,且随着互联网技术的日益发展,其智能分析结果广泛应用在个性化推荐等各种领域中。但作为一种复杂的非线性结构,异构信息网络的高维、异构等特性给其直接挖掘带来了困难。网络表示学习通过映射函数的学习将信息网络中的节点表示成低维、稠密的向量形式,可为后续节点聚类等智能分析任务提供有效的特征表示机制,目前已成为信息网络挖掘中重要的研究基础。目前,网络表示学习方法在同构信
学位
随着现代医学成像技术的发展,不同类型的成像设备为医学诊断提供了不同模态图像,从不同层面反映器官或者组织的功能信息或者结构信息。临床上通常需要综合同一个病人多个模态图像的信息以作出更加准确的诊断。因此,不同模态医学图像的配准和融合是医学图像智能处理领域中的研究热点。临床上使用的医学图像模态种类繁多且成像差异显著,给医学图像的配准和融合带来了极大的挑战。一方面,不同模态间成像差异的表征各不相同,现有医
学位