基于稀疏表示的图像分类和聚类算法研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:lyh555
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,大数据正深刻地改变着人们的思维和生活方式,并且促进了社会的进步和经济的发展。然而,大数据也伴随着复杂度高、数据过量和信息冗余等问题。因此,如何对数据进行有效地分析并从中学习具有鲁棒性和判别性的数据表示是一个极具挑战性的问题。为了解决这一问题,基于稀疏表示的特征学习算法应运而生。稀疏表示理论是模式识别领域非常重要的研究话题,因其出色的数据表示和特征提取能力,近年来受到了众多研究者的密切关注。从数据有无标签的角度出发,现有稀疏表示算法主要分为两大类:有监督的和无监督的稀疏表示。其中,基于监督学习的图像分类和基于无监督学习的图像聚类是稀疏表示的主流应用方向。为了学习具有判别性的数据表示以及不同视图之间共享的一致性特征,研究者们提出了许多基于稀疏表示的图像分类和多视图子空间聚类算法,然而这些算法仍然存在以下几点问题:1仅使用l1/l0-范数的稀疏表示不能有效去除样本中大面积的连续块遮挡噪声;2在非深度模型中没有借鉴深度学习的特点来同时探索数据的非线性和线性结构;3在多视图子空间聚类任务中无法自适应地削弱聚类结构模糊的视图对公共子空间学习带来的影响;4样本噪声仅服从单种分布的假设使得模型对混合噪声的鲁棒性较弱;5对表示的结构化设计不合理;6分类器和数据表示分离的学习方式无法保证所学表示对于分类来说是最优的。为了解决以上问题,本文主要针对基于稀疏表示的图像分类和多视图子空间聚类进行研究并提出一系列改进算法。具体地,可以从固定字典、单合成字典学习和字典对学习三个方面对本文所提算法进行概括。(1)基于固定字典的稀疏表示:1为了提升基于l1-范数的稀疏表示对连续块遮挡噪声的鲁棒性,提出一种基于核范数矩阵回归的稀疏正则化人脸识别算法。相关研究表明,连续性噪声通常具有低秩的特性。通过最小化二维误差矩阵的核范数,可以充分利用误差的低秩结构信息,从而实现分离噪声的目的。受此启发,同时考虑到l1-范数的稀疏特性有助于增强数据表示的判别能力,该算法将基于核范数的矩阵回归和基于l1-范数的稀疏表示融合在同一个模型中,能够同时探索误差的二维低秩特性和表示的稀疏性。实验表明,这种融合可以有效地缓解连续块遮挡噪声对人脸识别的负面影响。2为了继承深度学习中深度特征级联和非线性特征变换的优点,提出了一种深度交替级联的表示学习算法。该算法利用基于重构误差的Soft Max向量将稀疏表示和协同表示进行交替地级联,有效地将表示的稀疏性和协同性集成到统一的模型中。此外,该算法能够充分挖掘数据中潜在的判别结构信息,可以看作是单层稀疏编码的深度拓展。实验表明,随着级联层数的增加,所提深层表示学习模型的分类精度明显优于传统的单层模型。(2)基于单合成字典学习的稀疏表示:3为了快速且精准地对大规模数据进行聚类,提出了一种快速自引导的多视图子空间聚类算法。该算法以公共锚点学习为研究基线,首先使用局部的每一个视图轮流地学习不同视图共享的一致性表示,然后利用对所有视图进行级联得到的全局特征来学习包含所有判别信息的全局数据表示。为了将全局学习和局部学习进行连接,该算法利用l2,1-范数来学习行稀疏的投影矩阵,使得模型能够自适应地从全局判别信息中选择最有用的特征来引导局部公共子空间的学习。通过这种全局监督局部的学习方式,该算法能够有效地抑制在局部一致性表示学习过程中那些聚类结构模糊的、信息冗余的视图。实验结果表明,该算法与最新的基于锚点学习和深度学习的多视图子空间聚类算法相比,能够取得更高的聚类精度和聚类效率。4为了学习更加合理的结构化数据表示并且提升字典学习对混合噪声的鲁棒性,提出了一种用于人脸识别的基于松弛块对角表示的噪声鲁棒字典学习算法。该算法以低秩矩阵恢复理论为基础,对字典学习的重构误差同时施加l1-范数和F-范数约束,使得模型能够从污染样本中同时分离出服从拉普拉斯分布和高斯分布的噪声。此外,该算法对严格“0-1”块对角结构逐类地引入基于l2,1-范数的松弛项,使得模型能够更加松弛地学习块对角结构化的数据表示,并且能够有效保持类内表示的相似性。实验表明,集成松弛块对角表示学习和基于低秩表示的混合噪声移除于一体,能够有效提高复杂噪声污染下人脸识别的性能。(3)基于字典对学习的稀疏表示:5为了同时学习结构化的合成字典和解析字典,提出一种基于局部约束松弛块对角表示的字典对学习算法。该算法在严格“0-1”块对角结构的基础上引入基于哈达玛积的松弛块对角表示学习项,使得模型能够更加松弛、高效地学习结构化的数据表示,同时能够保证合成字典原子的多样性。此外,为了避免表示学习的过程过于松弛,该算法引入局部保持项来促使相似的样本有着相似的解析编码。实验表明,基于哈达玛积的松弛学习项和对解析编码的局部保持项是互补的,它们均有助于提升模型的分类性能。6为了学习更适用于分类的结构化表示,提出一种基于尺度约束自适应结构化表示的字典对学习算法。该算法首先对表示系数施加非负约束,然后利用字典原子二值标签矩阵将训练样本的表示系数线性地投影到训练样本所对应的二值标签矩阵。这样一来,该算法能够在“和为1”的尺度约束下自适应地学习到块对角结构化的数据表示。因为字典的标签矩阵可直接用作线性分类器,所以该算法仅利用一个正则项就可以同时实现结构化表示学习和线性分类器学习的目的,显著降低了模型优化和参数调节的复杂度。实验表明,和最新的字典学习甚至是某些深度学习算法相比,该算法可以达到更高的分类精度。
其他文献
本文通过对河南省焦作市“百姓文化超市”这一公共文化服务创新实践进行案例分析,总结其取得的创新实效,探讨推进公共文化服务创新发展的路径与策略,提出了创新公共文化发展理念、创新公共文化供给方式、创新公共文化管理体系等3个方面的创新发展路径,希望能对提高公共文化服务质量和创新发展公共文化服务体系提供一定参考。
期刊
逐年增加的CO2排放引起了严重的环境问题,现在碳减排已经上升到关乎国际关系和人类生存的高度。CO2加氢制甲醇是实现碳减排的有效技术手段。甲醇不仅可以用作燃料,而且能被进一步转化为烯烃、芳烃等高附加值化学品。然而,该课题具有很大的挑战性,CO2加氢制甲醇为放热反应,副反应逆水煤气变换反应为吸热反应。升高温度会导致甲醇选择性的显著降低,而低温下CO2转化率很低,低的甲醇收率难以满足工业生产的要求,因此
学位
本论文以城市中的少数民族流动群体—上海龙柏朝鲜族经营者为研究对象,试图通过探讨龙柏朝鲜族经营者的社会网络在其城市生存与发展过程中的体现,揭示其社会网络的全球性特点,呈现其在城市生活中的特殊形式—即“在沪模式”。本研究是从移民城市融入的视角,按照龙柏朝鲜族经营者入沪后对其落脚与适应过程,从打工仔到老板的创业过程进行的民族志研究,其中特别关注龙柏朝鲜族经营者的社会网络在城市融入过程中如何延续、拓展以及
学位
奥斯卡·王尔德(Oscar Wilde,1854-1900)其人、其行、其作,是世界文学史上一个常言常新的话题,这固然与他的戏剧性人生经历和风格独特的文学创作有关,但更多地是与他的各种反世俗、反主流的艺术理论和伦理哲学相联系的。他所提出的艺术与伦理主张不仅给英国乃至整个欧洲的文学艺术和道德伦理造成强烈的冲击,而且牵涉到当时社会现实的诸多领域,如民族主义、宗教信仰、日常审美、性爱观念以及思维范式等,
学位
哺乳动物是恒温动物,它们需要恒定的体温来确保最佳的生活状态。这就给哺乳动物颤抖性产热和非颤抖性产热在内的产热系统带来了巨大的选择压力。在中国,由于南北方的纬度相差大,造成年平均气温相差较大,导致许多物种生活在不同的温度环境中,包括家养牛在内。在夏季,中国南方地区的温度明显高于北方地区,这使中国南方牛被暴露在极热的环境中,相反,北方牛的生活环境比较凉爽。在冬季,中国北方地区的温度比南方地区的温度低的
学位
【背景】结直肠癌(colorectal cancer,CRC)是目前发病率第三位的恶性肿瘤,也是恶性肿瘤中第二位的死亡原因。近年来,尽管结直肠癌的早期筛查逐渐完善,结直肠癌的患病率和死亡率仍在逐年升高。目前,结直肠癌的治疗主要采用手术结合放化疗的方式,早期的结直肠癌治愈率及预后都较好,但是对于晚期转移的结直肠癌,常规治疗就会大大折扣,预后也明显较差。随着人们对结直肠癌转移机制的探索,靶向治疗逐渐成
学位
贫困一直是经济社会发展的问题之一,自新中国成立以来,我国在扶贫、减贫等方面投入了大量的精力。2011年随着《中国农村扶贫开发纲要(2011-2020年)》的出台,我国将“精准扶贫”作为新时期贫困治理工作的重点。随着脱贫攻坚工作的不断推进,其成果也不断显现:到2019年,我国农村居民可支配收入达到12363.4元,是1978年的93倍,贫困人口也降到了4335万人,贫困的发生率也下降到4.5%。并在
学位
互联网时代,既存在现实社会的各种思潮不断谋求在网络空间上出场及传播,从而衍生出新的变种、转化为新的形式,也涉及网络空间孕育出全新类型的社会思潮,这些都可以纳入社会思潮生成范畴进行讨论,使得表征着从非存在到存在或由某种质到另一种质升级变化的社会思潮生成具有研究的必要性和可行性。从现实状况上看,互联网与社会思潮的发生发展有着密切联系,尤其是对于社会思潮生成而言,不仅网络信息成为重要养分、网络媒介成为重
学位
背景与目的:心力衰竭(heart failure,HF)已成为主要的全球健康问题,具有较高的发病率和死亡率。低收缩压(low systolic blood pressure,LSBP)是限制HF患者使用或上调滴定抑制心肌重构药物的一个重要因素。沙库巴曲缬沙坦是一种血管紧张素受体脑啡肽酶抑制剂,研究表明血压较低的射血分数降低型心力衰竭(HF with reduced ejection fractio
学位
背景:结直肠癌(Colorectal cancer,CRC)是最常见的消化道肿瘤之一,威胁患者生存质量且引起了严重的社会和医疗负担。现阶段的治疗手段很难从根本上抑制CRC的病理进展。因此,进一步深入探索CRC发生发展的分子机制对CRC的早期诊断和干预具有重要的科学意义和临床价值。RHBDF1与许多肿瘤的发生发展密切有关,但其在CRC中的潜在作用及相关机制尚未完全明确。目的:本项目拟首先检测菱形家族
学位