基于图的半监督分类算法在高维数据上的研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:li_heping1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在常见的半监督分类算法中,基于图的半监督分类算法在近年来取得了不俗的分类效果。传统的基于图的半监督算法有两个主要缺点。首先,表示相似度矩阵的图的是在分类器训练之前预先定义好的,这样的图并不能很好地利用分类器训练和相似度矩阵学习之间的交互作用。其次,当处理带噪声或者冗余特征的高维数据集时,在原始高维数据空间构建的图是不合适的,甚至使得分类效果下降。在本文中,我们提出了一种面向高维数据的基于图的半监督分类算法(Graph-based semi-supervised classification,GSSC)。在该算法中,相似度矩阵是在标签空间和另外的子空间共同学习的,能够缓解在单独的数据空间下学习到的相似度矩阵不稳定的问题,同时避免高维冗余特征对相似度矩阵学习的影响,以此获得比原始数据空间更好更鲁棒的效果。基于GSSC,我们进一步提出了基于图和自适应子空间的半监督分类算法(Graph-based semi-supervised classification with adaptive subspace,GSSC-AS)。在GSSC-AS中,为了获得一个高质量的子空间,我们通过保持样本的局部结构和全局结构来学习子空间投影矩阵。最后,我们将分类器训练、图的构建和子空间学习整合成一个统一的框架。在这个框架中,分类器参数、相似度矩阵和子空间投影矩阵以一种迭代循环的方式自适应学习,最终获得联合最优解。我们在多个真实数据集上对本文提出的两种算法进行了大量的实验,包括参数敏感度实验、相似度矩阵可视化实验、与多种经典前沿的半监督分类算法的对比实验、与降维方法的对比实验、算法收敛性实验和算法运行时间对比实验等等。实验结果表明了本文提出的算法的有效性和优越性。
其他文献
广州市作为一个有着久远历史及鲜明气候特征的城市,在建筑上体现了鲜明的地域特色,广州的地域性现代建筑作为岭南建筑的一部分,也有其相对独立的发展脉络与特点。本文基于对地域性的认识——主要从自然特征和人文历史特征两大方面出发,以广州的地域性现代建筑为研究对象,梳理了广州的地域性现代建筑自1920年代以来的发展历程及阶段特征,并在此基础上与同时期国内外其他地区的地域性建筑思想与实践状况进行了对比,既借此厘
碳量子点作为一类“零维”碳纳米材料,近年来受到广泛关注,其直径通常在10 nm以下,由于具有独特的荧光性、氧化还原性、电子转移特性、水溶性、生物相容性,在荧光成像、催化、药物输送、生物传感等方面有着广阔的应用前景。木聚糖是半纤维素的主要组成成分,与己糖组成的糖类相比,其水热的碳化效率更高[1],因此是制备碳量子点的优质碳源。但是木聚糖碳点的荧光性能和电化学性能还不够强,其应用受到限制。本研究通过复
多端混合高压直流输电系统结合了传统直流输电输送容量大、成本低以及柔性直流输电无换相失败风险、有功无功独立可控的优势,成为了直流输电未来发展的趋势。该系统的控制与保护是保证直流输电系统安全稳定的基础。在控制方面,换流站控制器与系统稳定性和动态性能紧密相关,是系统稳定运行的重要保障;在保护方面,直流线路故障为系统高发故障,直流线路保护也在系统众多保护中最为复杂。为此,本文围绕多端混合高压直流输电系统换
对于偏远山区、海岛等与电网联系薄弱地区,电网供电能力不足且可靠性较低。由于电网升级投资规模较大,有效利用当地风、光等可再生能源,建设风光柴储微电网具有较高的可行性。如何更好地发挥微电网接纳新能源发电的能力,提高微电网电能质量,是迫切需要解决的技术问题。而谐波谐振作为可以使谐波源的负面影响成倍放大的电能质量问题,在微网中应受到足够的重视。本文以风光柴储独立微电网系统为研究对象,对不同情况下微网系统的
视网膜母细胞瘤易感基因(Rb1,retinoblastoma)为癌变过程中的重要肿瘤抑制基因,该基因也参与调控体内的多个生理过程,主要包括细胞周期、细胞凋亡以及细胞分化等进程。Rb1主要通过与E2F1/DP1的相互作用调控细胞周期运转和细胞凋亡过程,而Rb1与肌源调控因子(myogenic regulatory factor,MRF)之间的相互作用在骨骼肌发育过程中也至关重要。Rb1可以抑制骨骼肌
随着现代社会的高速发展,各种基础设施的建设对土体的承载能力与变形控制有了更高的要求,在土力学中,怎样科学又准确地计算地基沉降量一直是待解决的难题。目前国内最常用的沉降计算方法为国家规范推荐的分层总和法,由于规范法经验系数取值为0.2-1.4,误差较大,是一种半理论半经验的沉降计算方法,且计算是采用通过室内试验获得的压缩模量,并不能反映土体的原状性。依据现场原位试验而建立的切线模量法可以克服室内试验
随着我国城市发展模式的转变,城市更新成为很多大城市发展的主要方向。使用后评价对指导城市更新具有重要意义,一方面可以对城市更新的效果进行科学地评价并发现存在的问题,另一方面可以将评价结果反馈给策划端,促进规划设计标准的完善和质量的提升,有效指导未来的实践活动。然而,城市更新项目具有时间周期长、空间范围广、利益群体复杂和目标多样等特点,问卷调查和专家访谈等传统评价方法的局限性日益显现。随着智能终端的普
作为下一代重点发展的光伏发电技术,有机光伏电池(OPVs)以质量轻、柔性、半透明、可溶液加工等优势备受关注。得益于非富勒烯受体材料的突破性进展,近年来有机光伏器件效率迅速提升,其最高能量转换效率已超过18%,展现出广阔的发展和应用前景。对于高性能非富勒烯受体分子的设计,目前研究重点主要集中在中心核构建、侧链工程、π桥单元修饰和端基修饰四个方面,其中侧链工程作为一种可快速改变分子光电性能以调控活性层
语义分割任务是计算机视觉中最重要的任务之一,该任务要求将输入图像的每个像素都匹配到一种语义类别中。在实际应用中,语义分割在自动驾驶和机器人导航视觉等领域发挥着重要作用。近年来,语义分割备受关注,研究人员基于卷积神经网络(CNNs)提出了各种针对语义分割任务的技术方案,这些方案取得了良好效果,但也普遍存在一个共同的缺点:网络参数过多,计算成本高。因此,设计一个有效的且小尺寸的实时语义分割模型意义重大
缆索承重桥梁在交通运输事业中发挥着重要作用。拉索作为缆索承重桥梁的主要承重构件,容易受到交通荷载和外界环境的作用而产生损伤,从而导致拉索承载能力下降。拉索失效造成的工程事故时有发生,对社会经济发展产生严重影响,因此必须重视对缆索承重桥梁拉索索力的健康监测。传统的索力测试方法属于接触式方法,需要人工布置索力测试传感器,存在测试成本高和测试效率低等问题。本文开展基于计算机视觉的索力测试方法研究,可以为