面向半监督流形正则化分类学习的改进框架研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:PLF119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
半监督分类学习是机器学习中一个重要研究领域,同时利用有标记和无标记样本进行学习,以缓解样本类标记稀缺的问题。流形正则化(Manifold regularization,MR)是半监督分类中一个经典有效的学习框架,但仍存在以下不足:1)在MR中,已标记样本的位置是随机的,可能处于边界区域甚至相反类中,将这些样本的标记传播到它们的近邻样本,可能会误导MR分类,尽管学习中会同时考虑未标记样本的分布结构。2)MR的平滑约束是基于所有样本对实现的,即将每个样本对看作一个单独对象。然而,光滑性本质是逐点的,具体来说,光滑性自然地发生在“每一点处”,体现每个样本点与其近邻点的相关联行为。因此,本文的研究问题主要包括以下的两个内容:首先,为减少已标记样本极其稀缺或位置存在误导时所产生的影响,对已标记样本集进行扩充,提出一种新的标记扩充的MR框架(Label-expanded Manifold Regularization for semi-supervised classification,LE_MR)。在LE_MR中,先利用聚类方法,如KFCM,发现每类中的高可信度样本,此类样本通常处于聚类中心区域。再利用所获样本及其聚类标号扩充标记样本集,缓解标记样本缺乏的问题,以帮助提升MR的分类性能。在真实数据集上的实验结果表明:基于扩充的标记样本,LE_MR可有效提升MR框架的学习性能。其次,为保留平滑性的逐点特性并且减少样本对的误导,通过考虑单个样本而非样本对的光滑性提出一种新的逐点MR框架(Pointwise Manifold Regularization for semi-supervised learning,PW_MR)。在PW_MR中,通过考虑单个样本而非样本对,平滑性的逐点特性得以保留;同时,引入了单个样本的重要性,可由局部密度描述,以帮助提升MR的分类性能。在真实数据集上的实验结果表明:逐点MR可帮助提升MR框架的学习性能。
其他文献
目前,国内政府相关部门规定,上市企业需要对外公布财务报表与内部控制情况。以前我国只对财务报表审计做出强制性要求。后来,随着国际上多起重大财务舞弊案件的发生,国内外均逐渐意识到内部控制的重要性。我国后来将内部控制也规定为强制披露。基于审计成本、审计风险等方面的考虑,整合审计后来发展成为主流趋势。整合审计虽然正在普及,但是并没有规范制度对其做出具体要求。按照专业硕士论文分类标准,本文属于规范研究类。论
人类一直致力于研究出能够代替其完成各种工作的机器设备,由此机器的智能化程度也是日新月异。而机械臂作为机器人的一个重要组成部分,已经成为机器人学领域一个重要的研究课
流通部门作为连接生产与消费的中介,是支撑中国国民经济发展的重要产业之一,然而,长期以来中国流通部门一直被视为“劳动密集型”的产业,受到这种观念的影响和制约,流通部门
拟扭转码(QT码)作为常循环码和准循环码(QC码)的推广,是一类重要的线性码.本文主要研究整数剩余类环Zq、有限链环F2+uF2和矩阵环M2(E5)上1-生成元QT码,具体内容如下:第一,研
近年来,高性能计算呈现加速发展态势,机群是高性能计算的一种重要实现方式。异构机群由于具有高效能特性,在国际上渐受重视。异构机群系统由大量不同机群组成,不同机群中的计
土壤盐渍化大尺度制图是土地信息化领域非常重要的前沿之一。目前,土壤环境问题涉及的尺度日趋增大,小区域斑块化盐渍化信息的提取难以让决策制定者了解和掌握大尺度土壤环境总体的变化趋势。当前大尺度制图问题在于有效样本点过少,导致遥感建模、插值等技术生成的面状数据不确定性较大,此外,单时相的遥感参量缺乏时间的潜在影响。而植被物候信息提取自整年的遥感影像,涵盖植被随时间的动态变化趋势,巧妙地解决了植被指数的不
无线通信技术的快速发展,带动着用户的需求也随之日益增长,正因如此,现有的可供使用的无线物理频谱资源越来越少。虽然有相关的频谱分配方式来提高频谱的利用率,但是目前存在
近年来,世界和中国都发生着广泛而深刻的变革,国家的基础教育领域也跟随时代的发展不断的改革和创新。自我国实行基础教育新课程改革以来,教材改革作为新课程改革的重要环节一直受到关注。迄今为止,我国的教材编写工作已经经历过多次更新。2016年国家教育部依据《义务教育历史课程标准(2011年版)》编写的初中历史教科书正式出版,并且陆续在全国的初中投入使用,如何更好地认识、运用部编版教科书成为广大一线教师关切
本文致力于三维薄体问题的虚边界元法研究。薄体结构在工程中的应用越来越广泛,但其数值分析是科学计算领域的难点。传统边界元法分析薄体问题时,特别是各向异性薄体问题,涉
考勤是企业内部一项最为基础性的工作,是保障正常的工作秩序以及提高单位的工作效率的基本保障措施。当前使用信息技术来对考勤进行管理已经是一项普遍的做法。而一套好的考