基于自步学习与稀疏自表达的半监督分类研究

来源 :首都经济贸易大学 | 被引量 : 0次 | 上传用户:hughy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息化时代的飞速发展,各种信息化数据也呈现出爆炸式的增长,传统的机器学习方法,如有监督学习和无监督学习,在处理各类问题时已显得越来越力不从心。具体地,有监督学习在模型的训练过程中高度依赖有标签数据,但是有标签数据的获得需要耗费大量的人力物力;而无监督学习方法虽然不依赖于有标签数据,但由于缺乏有效的引导,其可能很难达到预期的学习结果。因此,能够同时利用少量有标签数据和大量无标签数据的半监督学习方法正逐渐成为机器学习和模式识别领域的研究热点之一。按照研究内容的不同,半监督学习方法中也存在多个不同的研究领域,本文主要研究半监督分类问题,特别是基于图的半监督分类问题。基于图的半监督分类方法在进行学习时会根据一定的原则为样本数据构建一张邻域图,以此来反映样本数据之间的结构关系,然后通过构建的邻域图将信息从有标签数据向无标签数据进行传递,最终达到分类的目的。基于图的方法由于其能够将数形结合,利用图的形式直观的对数据间的关系进行展示,且具有求解方式相对简单,泛化能力强的优点而得到了广泛的关注。在传统的半监督分类方法中,大多数方法未能对样本按照重要程度的不同进行划分,但在实际问题中,不同样本所包含的判别信息是不可能完全一样的。另外,在传统的基于图的半监督分类方法中,其邻域图的构造多采用固定尺寸的方式,在面对实际问题中数据分布不均匀的情况时会影响分类的效果。且多数基于图的半监督分类方法都是直推式的,无法获得显性的分类函数,这使得其在在线决策中的应用受到了限制。针对以上基于图的半监督分类方法存在的问题,本文在现有研究成果的基础上进行了创新,提出了基于自步学习和稀疏自表达的半监督分类算法,主要的研究工作和创新点如下:(1)本文基于自步学习机制提出一种新的自步学习项。所提的自步学习项在原有自步学习模型的基础之上,通过引入新的“年龄”参数,将传统方法中数据重要程度的软权重与硬权重相结合,来指导模型的学习。(2)基于自步学习机制自动给出样本的重要程度。考虑到样本间个体的差异性,本文将所提的新的自步学习项以一个正则化项的形式引入到模型中,来指导模型在每次学习的过程中按照样本的重要程度逐步进行学习。(3)使用稀疏自表达模型,自动获取数据间的关系,使模型具有较高的判别性。本文采用稀疏自表达模型对数据结构进行学习,能够自适应地建立数据间的关系,且同时具有较高的判别性。(4)所得分类器是归纳式的。本文所提的方法为归纳式的,能够获得多类的显性非线性分类函数,有利于处理在线分类任务。本文进行了大量的实验验证,在Altkom、BANCA、ORL、CMUPIE、CBCL五个标准集图像数据库上,本文所提的方法所获得了较好的分类效果。
其他文献
我国的失业保险制度建立之初就明确了具有保障生活和促进就业的双重功能,运行至今已有30余年,然而,在具体实践过程中,失业保险更注重保障基本生活方面的功能,缺乏对就业促进功能的合理设计与妥善安排,在实施上更是不尽如人意。现阶段,我国经济增长进入新常态,经济增长的速度放缓、经济增长方式也在逐步转变,在这一时期我国将长期面临周期性失业与结构性失业的综合性问题。为缓解逐渐加大的就业压力,保证人民的基本生活,
电子商务数据是指电子商务经营者在进行生产经营活动的过程中获取、生成的,以电子数据为表现形式的信息。电子商务数据蕴藏着巨大的经济价值,是电子商务繁荣发展的源动力。明确电子商务数据法律保护应当实现的价值目标,确立电子商务数据的法律地位,是构建电子商务数据法律保护体系的根本所在。然而,我国现有法律中没有确立电子商务数据的法律地位,也没有规定具体的保护制度,学术界对此的研究也不充分。因此,研究电子商务数据
学位
学位
近年来,京津冀地区雾霾天气频发,使得该地区的空气污染问题受到广泛关注,而细颗粒物PM2.5是引发空气污染的重要因素。研究PM2.5及其影响因素之间的关系,有助于确定空气污染对人们的生产生活的影响,从而能够更加准确地对空气污染进行研究和治理。时空交互模型能够从时间效应、空间效应和时空交互效应三个方面反映自变量对因变量的影响情况,模型包括时空过程和白噪声过程两部分。其中,时空过程由均值过程和时空变化趋
马克思主义虽19世纪90年代就已传入我国,但1919年五四运动尤其是1921年中国共产党成立后马克思主义才在众多思潮中脱颖而出,获得了广泛的传播和众多信仰者。那么,大革命时期中国共产党人如何理解和运用马克思主义来解决当时复杂的革命问题是本文想要着重探究的一大问题。尤其是五四运动之后国内民族主义情绪日益高涨,针对此种情形,中国共产党应当如何利用国内高涨的民族主义情绪推动国民大革命乃至世界革命的发展,
学位
学位
随着信息技术的飞速发展与广泛应用,传统商业方法与计算机技术相结合活跃在金融、银行、电子商务等多个领域。新型商业方法所表现出的技术性特征和现有法律保护的不足,迫切要求着专利客体范围的扩张。在商业环境的冲击之下,2017年4月我国《专利审查指南》中首次承认了含有技术特征的商业方法的专利客体地位,2019年12月我国《专利审查指南》再次制定了详细的审查标准。在此背景下,本文首先分析了新修专利指南出台前后
贸易保护主义尚未落下帷幕,逆全球化思潮持续升温,中美两大世界主要经济体贸易摩擦不断升级,而我国出口企业自身的技术高度和研发能力尚不足以应对如此日益复杂的国际环境。但随着我国国民经济实力的整体上升,国内市场体量不断扩大,为出口企业回归本土市场提供了便利条件,拓宽了出口企业决策范围。因此,结合目前中国出口企业所面临的内外部环境,从异质性企业视角,重现企业面对关税冲击时的即时反应和长期决策,具备一定的理