基于结构感知的表征学习及其应用研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:a419132258
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的高速发展,在人类活动中产生了大量多源异构的高维数据。如何从这些具有复杂结构的数据中挖掘有用信息,是一项具有较大科学价值与社会价值的课题。表征学习是一种重要的高维数据分析技术,旨在提取数据的关键信息用于指导数据挖掘,已成功运用于计算机视觉、生物识别和信息检索等领域。通过表征学习得到的是一种中间表示,它需要适应于具体的下游任务才会具有实际的应用价值,本文主要面向子空间聚类分析进行表征学习的理论与应用研究。近年来,在先进的子空间聚类方法中,表达数据亲和关系的结构信息得到了广泛关注,它能够有效地用于表征学习。然而,现有面向子空间聚类分析的表征学习方法对所选数据的敏感性较高,获取的聚类精度不稳定,同时这些方法往往需要迭代优化,计算成本较高。为了解决这些问题,本文研究了一种新颖的基于结构感知的表征学习模型,用于学习具有良好判别力的数据表征,又将其从子空间表征学习延伸到降维表征学习中,通过结构保持的方式进行数据降维得到对应的低维嵌入,有效地解决了高维数据在子空间聚类分析中存在的维数灾难问题。本文的主要研究工作概括如下:(1)为了降低算法对不同数据的敏感性,解决现有子空间聚类方法因分组效应不高而导致的聚类精度不稳定的问题,本文提出了一种基于结构感知的子空间表征学习模型,它通过一种新的联合分组度量方法,利用不同结构之间的一致性关系促进数据内在结构的感知,得到一个能够全面表达数据亲和关系的结构图,再将该结构图用于子空间聚类分析。在生物信息、手写数字、物体图像与语音信号数据上的实验结果表明,所提模型与大多数先进方法相比表现了更好的聚类性能,其中在生物信息上的提升最显著,关于聚类精度与归一化互信息的最优结果分别提升了8.24%与5.18%,验证了所提模型能够有效学习判别力良好的子空间表征,更好地解决了针对高维复杂结构数据的子空间聚类问题。(2)为了解决高维数据子空间聚类分析中存在的维数灾难问题,本文在结构感知的基础上,又提出了一个基于结构保持的数据嵌入算法。不同于传统流形学习方法使用欧式距离度量样本之间的相似关系,所提算法使用结构表征刻画样本之间的一致性关系,有效地将表征学习与数据降维集成到一个最优框架中,相对高效地找到了最优的嵌入方向。实验结果表明,所提算法表现了一致的最佳性能,在具有多重变化的人脸图像数据上可提升12.51%的聚类精度,验证了该算法在降维表征学习上的有效性。本文提出的结构感知是一种通用的表征学习模型,它不需要任何迭代优化,因此计算成本相对较低,同时在全局结构感知方面,引入简单的散度优化方法提升了算法效率,降低了模型的复杂性。此外,该模型的重点在于构建能够全面刻画样本关系的结构图,具有一般性,可以自然地拓展到表征学习的其他研究领域,为今后从事基于图的表征学习研究提供了一种新思路。
其他文献
图像信息获取的场景复杂,直接制约和影响图像信息的采集和图像数据质量。在常见的强弱光环境、光照不均匀环境或光源色温变化场景下,成像系统所采集的图像会出现清晰度下降、灰度分布不均衡以及颜色失真等问题,严重影响图像辨识及其内容理解,常导致图像后期处理中图像分割、目标检测与识别的困难。因此,研究复杂场景下图像采集的质量衰退机制,构建改善图像质量的图像增强方法,对图像的产业化创新应用具有重要的理论价值和工程
学位
本文主要利用达布变换与退化的达布变换研究广义的复修正Korteweg–de Vries方程,即带有5阶扩展项的复修正Korteweg–de Vries(ecmKdV)方程的精确解,以及其怪波解的动力学分析。第一章主要介绍达布变换以及孤立子解、怪波解等精确解的研究背景与发展历史。第二章构造ecmKdV方程的达布变换与退化的达布变换,并生成ecmKdV方程的新解与种子解分别在达布变换与退化的达布变换下
学位
软件缺陷预测是在软件生命周期的早期阶段识别缺陷的一种有效方法,这种方法旨在帮助测试人员更有效地预测软件产品中潜在的缺陷模块,从而开发出稳定、安全的软件产品。大量的统计和机器学习模型被用来预测软件模块中的缺陷,但这类软件缺陷数据集具有天然的类分布不平衡和噪声问题,即,数据集中无缺陷的实例数远远高于有缺陷的实例数,另外,数据在收集的过程中还会存在被误标记的实例。类分布不平衡和噪声问题导致了大多数预测模
学位
模数转换器(Analog-to-Digital Convertor,ADC)和数模转换器(Digital-to-Analog Convertor,DAC)是电子信息系统的重要组成部分,是连接客观世界和数字系统之间不可或缺的桥梁。由于受采样保持电路带宽和采样时间抖动等因素的影响,电子ADC已经很难同时满足高采样率和高精度的需求,电子DAC很难实现高频、高带宽信号和特种波形信号的产生与恢复。随着光子技
学位
车联网技术的飞速发展有效提升了道路通行效率,越来越多的用户在车联网中传输分享数据,随着网络规模的扩大,数据隐私性、安全性等问题逐渐显现,车联网引入了区块链技术保障数据的匿名性、一致性,但交易性能也受到了限制。区块链固有的全局共识和链式存储技术限制了所有节点必须同步处理一个区块,无法并行共识多个区块,限制了高密度交易时车联网区块链的交易处理性能。为了解决这一问题,本文围绕车联网区块链的共识机制、存储
学位
目的:探讨结缔组织病相关性间质性肺病(CTD-ILD)合并肺感染患者的临床表现特征,并分析其感染相关因素。方法:回顾性分析福州肺科医院呼吸内科2018年8月—2020年10月收治的152例CTD-ILD住院患者的临床资料,比较91例合并肺感染(感染组)患者和61例未合并肺感染(非感染组)患者的一般情况、临床表现、相关实验室检查等指标的差异,利用Logistic多元回归方法分析肺感染的独立影响因素。
期刊
现如今社会化推荐系统受到了广泛的关注,其通过用户的社会信息如关注、信任等内容来缓解推荐系统面临的稀疏问题,从而提高推荐系统的推荐性能。但是社会信息中存在着两方面问题:稀疏问题以及噪音问题。矛盾的是,如果只解决稀疏问题,那么噪音问题就会变得更加严重,而如果只解决噪音问题,那么稀疏问题就会变得更加严重。因此,社会化推荐系统的关键核心在于缓解社会信息中的稀疏、噪音问题以及特征的提取方式的设计。本文以社会
学位
脉搏作为人体重要的生理健康指标,在心血管疾病诊断以及其他的医疗过程中发挥着重要的作用,现阶段通常使用接触式的设备对脉搏波进行精确测量。数字散斑相关方法作为一种新型的非接触式光学检测手段,因其操作简单、测量精准的特点已被广泛应用于工业测量、生物医学等领域。其通过记录运动物体变形前后的数字散斑图像,根据散斑图像灰度特征的相关性,计算物体表面位移和估计全场应变。本文将数字散斑相关方法应用于人体脉搏检测领
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)是一种全天候微波成像雷达,具有极其广泛的应用前景。譬如,在民用领域,运用SAR对运输船只进行位置检测,有利于海洋的监测与管理,在军事领域,对特定目标进行位置检测,有利于战术部署,提高海防预警能力。从SAR图像目标的特点和表现形式,以及信息几何分析和深度学习模型的发展来看,信息几何和深度学习技术在SAR图像处理的理论和应用领域具
学位
高纬电离层的等离子体对流不仅是空间天气的一个重要现象,也是电离层研究中的一个重要参数。它包含了一系列关于太阳风向磁层电离层系统能量传输的重要信息。许多电离层对流的研究主要集中在分析电离层等离子体对流对近地空间参数的依赖性,例如行星际磁场分量、太阳风速度、太阳风动压和地磁活动指数。电离层对流图像不对称性的研究有利于进一步理解电离层对流与近地空间参数的关系,对理解和分析空间天气具有重要意义。本文通过对
学位