基于鲁棒子空间聚类的维数约简方法研究

来源 :集美大学 | 被引量 : 0次 | 上传用户:shining321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术和大数据的日益发展,人们每天都要面临和处理大量的数据,如何在这些高维的,多源的,复杂的数据中提取出有效的,低维的,本质的信息是当下机器学习和数据挖掘任务的难点和重点。研究发现,数据的本质结构信息常常蕴含在数据的低维子空间中,子空间学习的目的是通过寻找到数据的低维子空间来近似表示原始高维空间的数据,从而挖掘出高维数据的聚类结构特征及内在的本质结构特征。近年来,图学习的引入为子空间学习方法提供了新的思路,但是这些方法存在如下问题:首先,这些模型通常将图学习和子空间学习分开,导致其获得的数据聚类结构特征不明显;其次,这些模型容易受到由冗余特征和噪声的影响,鲁棒性较差。为了解决上述问题,本文从谱图理论出发,通过结合数据的图表示和子空间无监督特征选择的方法,以挖掘数据的内在本质结构和解决高维图像数据的聚类问题。本文的研究具体包括以下两个方面:首先,针对现有的谱聚类及自适应邻居聚类方法,对噪声敏感,局部流形结构不突出的问题,提出了鲁棒局部自适应图聚类及投影聚类算法。通过引入一个局部影响因子,自适应的调节在计算过程中局部邻域内样本点的权重,以突出高维数据的局部聚类结构特征及局部流形信息的可分性。其次,针对现有基于图学习和稀疏正则化无监督特征选择方法中正则化方式存在参数难以调节及鲁棒性和稀疏性特征不突出的问题,提出了基于自适应弹性损失的无监督特征选择算法。首先,提出了一种全新的自适应正则化方法——自适应弹性损失函数,并应用于无监督特征选择中。其次,该方法将图学习,数据重构及自适应弹性正则化结合在了同一个无监督特征选择框架中,同时突出了模型对数据全局结构及局部结构的提取,此外,本文还在理论上分析了算法的收敛性和计算复杂度。最后,通过在人造数据集和真实基准数据集上的多种类型的实验,并与相关优秀的高性能的模型进行实验比较,实验结果验证了本文所提出算法的有效性。
其他文献
报纸
随着经济发展对环境所产生的负外部性越来越严重,环保行业应运而生,并逐渐在国民经济发展过程中凸显重要地位。环保行业呈现涉及行业多、与各行业相互交叉的特点,同时存在市场准入时较高的技术投入壁垒与资金投入壁垒双重特性,在发展过程中需要投入大量资金,投资周期长、回款速度慢,这也是环保行业融入资金困难的主要原因。在“碳达峰、碳中和”环保新形势背景下,针对环保行业融资效率和融资行为的研究,对促进该行业稳定发展
学位
随着越来越多的审计师从会计师事务所跳槽进入企业担任高管,在我国现代化进程中形成了一种“审计背景高管崛起”的现象。这类群体不仅具备会计、税法、战略管理等方面的专业优势,更兼具过去审计师工作的思维方式和工作态度,进而拥有了一定的“反审计”能力。根据高层梯队理论,这些特征会使他们在决策时有更多自己的考量和行事风格,从而影响组织行为。当面对企业避税行为时,审计背景高管的审慎性和“大局观”可能会抑制该行为,
学位
2015年8月,证监会宣布减持禁令解除,资本市场迎来了大股东的“减持潮”。据Wind数据库统计有1594家上市公司发生减持,累计减持金额高达5554.60亿元。许多上市公司通过先上市融资增值再减持的模式进行“套现盈利”。大股东减持后造成的资本市场股价波动、公司经营绩效下滑等不良的经济后果,却由中小股东来承担。从短期来看,大股东的减持行为打击了中小股东的信心,同时也抑制了中小股东进入市场的积极性;从
学位
学位
随着计算机数据处理在计算机视觉领域中的迅猛发展,人工智能迅速崛起,人们对于智能化工具的依赖也越来越强。自动跟随技术凭其无需人工操作即可自动跟随主人(主体目标)的特点得到广泛应用。自动跟随的关键技术主要包括:检测出要跟随的主体目标,并进行精确定位;实现对检测到的主体目标进行稳定跟随,并控制运行速度和方向。基于深度学习的计算机视觉在目标检测、识别与跟踪具有很多的优势。因此,本文基于深度学习理论对自动跟
学位
随着社会的发展和科学技术的进步,各种机械设备的使用量也大大增加。滚动轴承是保证机械设备正常工作的重要零件。因此,需要对其状态进行监测,以判断有无故障产生。目前通常将采集到的轴承振动信号通过网络传输至云平台,在云平台进行故障识别。但随着物联网接入设备的增加,网络传输的数据量也将会急剧增长,从而增加了延迟,很难保证故障诊断的时效性。因此,很有必要在机械设备的边缘端使用嵌入式设备来进行实时故障诊断,从而
学位
报纸
报纸
报纸