基于约束权重学习与字典学习的降维及聚类方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:liantonglingsheng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,各行各业都产生了大量的高维数据,如何挖掘隐藏在高维数据中的宝贵信息是现代机器学习研究的一个热点。然而高维数据存储量巨大,计算代价十分高昂,使得传统的机器学习算法面临着巨大挑战。这就是人们常常说到的“维数灾难”问题。降维和子空间聚类都能把数据从高维空间映射到低维空间中,从而对数据进行概括和抽象;降维旨在保留数据中具有区分性的特征,去除一些共性冗余特征,可以看成是一种特殊的聚类;子空间聚类则是用少量的分组去对海量的数据进行抽象和概括,也能看成是一种特殊的降维。随着数据规模的不断增大,这两种方法得到了广泛的研究与应用。本文在分析了现有半监督降维方法,子空间聚类方法的发展现状和现存问题的基础上,围绕约束权重学习、图的构造和优化、字典学习等方面针对降维,和聚类方法进行了研究,本文的主要工作和创新点如下:1.提出了基于加权成对约束的自适应半监督降维方法(ASSDR-PPC),ASSDRPPC对成对约束进行类似概率性质的加权来利用监督信息,并通过构造稀疏图的方式保留数据的内部结构信息。并将投影矩阵的计算,图的构造,以及约束权重优化融合成一个整体进行降维学习。实验分析表明ASSDR-PPC要优于其他相关的半监督降维方法。2.提出了基于潜在空间字典学习的低秩稀疏子空间聚类方法(LRSSC-LSDL)。通过引入字典学习的概念,加强对数据的表达能力,同时使用潜在空间学习来降低计算低秩稀疏重构矩阵的时间代价。实验表明,当在数据被大量污染的情况下,LRSSC-LSDL要优于现在主流的子空间聚类方法。3.针对LRSSC-LSDL不能利用监督信息的不足,将LRSSC-LSDL与加权成对约束结合起来,提出了基于加权成对约束与字典学习的半监督聚类方法SSLRSSC-LSDL。该方法能同时进行字典学习,潜在空间学习,约束权重学习来获得低秩稀疏表示用于聚类。实验表明SSLRSSC-LSDL能够比传统的子空间聚类算法,以及基于成对约束的半监督聚类算法,更加具有优越性。
其他文献
工业生产中比较常见的控制目的是维持被控变量等于设定值,即设定值控制,然而在很多情况下,综合考虑产品的产量、质量以及能耗物耗等前提时,系统输出不再是严格的设定值跟踪,
光标是图形用户界面中的重要组件,在人机交互过程中起着非常重要的作用。但是在操作中我们有时会遇到失去对光标的跟踪,不能及时发现光标位置的情况。本文提出了八种新的光标
在过去几十年,存在于内嗅皮层的网格细胞和存在于海马体中的位置细胞陆续被发现。内嗅皮层细胞的位置编码是如何形成的?这个问题对研究类脑智能机器人具有重要意义。内嗅皮层
目的本文将介绍一种新的可延伸外固定支架在后踝骨折治疗中的应用并对比该方法与支撑钢板治疗后踝骨折的优劣。方法从2013年1月-2014年9月选取收治的36位后踝骨骨折的患者,(1
20世纪90年代以来,随着现代社会对个性化、多样化、高品质产品的迫切市场需求,小批量、定制化的间歇过程已经成为现代工业的重要生产方式,所以间歇生产过程运行的安全性、可
预焙阳极作为电解铝产业的配套产业,其发展与电解铝技术的进步是分不开的。在预焙阳极炭块生产过程中,要经过煅烧,焙烧,成型和组装等工序。本文主要研究的阶段为焙烧阶段,旨
近年来,智能机器人加快了融入人类日常生活的步伐,已经从单一的工业领域转向各个领域。而在智能机器人的相关研究中,导航技术是研究的核心之一,高精度的导航技术对机器人安全
随着社会、经济的飞速发展,人们对无线通信数据的需求量迅速膨胀,对业务种类的要求也日益多样化,未来无线网络将呈现出以业务为主导、多种无线技术共存的发展态势。传统无线
互联网和移动通信技术的飞速发展,以及移动设备的普及,使得移动应用的数量呈现爆发式增长,并且涌现出大量拥有千万乃至亿级别用户的超级应用。伴随着软硬件的不断成熟,各类功
如今,全球逐步趋于一体化,人类社会的协作也越来越迫切。无论是学问、技术、文化,还是日常生活,亦都迫切需要翻译。自中韩建交以来,两国的交流愈来愈是密切,大量的韩国作品被