快速判别性稀疏编码及其在图像识别中的应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:awii0813
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
稀疏编码方法自1996年在国际著名学术期刊《Nature》上被首次提出以来,已经成为图像处理领域的研究热点。作为稀疏编码基本模型的一类推广模型,判别性稀疏编码模型被成功应用于针对识别任务的图像特征提取,形成了基于判别性稀疏编码的图像特征学习技术和图像特征构造技术。然而,判别性稀疏编码模型的训练和推断的时间长,该问题已经成为限制这类模型走向实际应用的瓶颈。  针对这一问题,本文开展了对判别性稀疏编码快速算法的研究。具体地,我们聚焦于以下几个问题:  (1)图正则化稀疏编码模型是一种典型的判别性稀疏编码模型。虽然该模型已经在图像识别领域被成功应用于图像特征学习和图像特征构造,但是图正则化稀疏编码非常耗时的问题使得这些技术很难走向实用。针对该问题,需要设计图正则化稀疏编码的快速算法。  (2) Fisher判别性字典学习方法是近年来提出的一种判别性稀疏编码方法。该方法的原始算法非常耗时,虽然简化的模型训练速度很快,但该模型忽视了协同性重构的作用,因此在不同类别变化不平衡的分类任务中表现不稳定。针对这样的分类任务,需要为Fisher判别性字典学习重新设计快速而稳定的算法。  (3)现有的非负字典更新策略是批量式的,或者是为基于l0“范数”的非负稀疏编码模型所设计。针对这一问题,需要设计适用于一般非负稀疏编码模型的字典更新快速算法。  本文致力于解决以上问题。全文的主要创新点和贡献总结如下。  (1)针对图正则化稀疏编码(Graph regularized Sparse Coding,GSC)运行速度过慢的问题,本文提出了一种加速GSC的方法。GSC采用了一种交替优化框架,该框架反复解一个l1正则最小二乘问题的变体问题,我们简称该问题为GSRsub。解GSRsub的传统方法是解该问题的原问题,虽然GSRsub原问题的目标函数是强凸的,但是不可微,这导致算法收敛过慢。我们提出通过解GSRsub的一个对偶问题来加速GSC,我们简称该问题为D-GSRsub。D-GSRsub的目标函数强凸、平滑,且D-GSRsub的变量数比GSRsub要少。基于D-GSRsub的性质,我们尝试了四种计算复杂度较低的对偶上升策略,并且在真实数据集的图像分类、图像聚类任务上测试了这四种策略的效果。实验结果表明,这些策略在保证GSC效果的同时,可以显著提高GSC的计算效率。  (2)为了设计适用于不同类别变化不平衡的分类任务的快速Fisher判别性字典学习(Efficient Fisher Discrimination Dictionary Learning,E-FDDL)算法,我们提出解一个近似的Fisher判别性稀疏表示(Fisher Discriminationbased Sparse Representation,FDSR)问题,它的目标函数是原始FDDL算法中FDSR问题目标函数的上界。该近似FDSR(Approximate FDSR,A-FDSR)问题考虑了判别性重构和协同性重构两方面的作用,并且稍稍重视后者的作用,这使得E-FDDL在处理同类别变化不均匀的分类任务时更加鲁棒。进一步地,A-FDSR问题的结构使得快速的优化策略适用于该问题,这又带来了E-FDDL的快速性。我们在人脸识别实验的结果证实了E-FDDL快速稳定的表现。  (3)针对快速非负字典更新策略的问题,我们设计了一种既适用于基于l0“范数”的非负稀疏编码又适用于基于l1范数的非负稀疏编码的字典更新快速算法。该算法按顺序解K个单位范数和非负约束下的投影最大化问题,我们简称该方法为K-UNPM。我们比较了K-UNPM和N-K-SVD在单个字典列更新过程中的浮点运算次数,说明K-UNPM比N-K-SVD的计算复杂度低。我们设计了一种以K-UNPM为字典更新策略的基于图像块的判别性非负稀疏编码(PDNSC)方法,该方法在USPS手写体数字数据集上的聚类实验中超越了经典特征学习方法,这间接佐证了K-UNPM在优化PDNSC模型时的有效性。
其他文献
由中风、脊髓损伤等引起的运动功能障碍严重影响患者的生活自理能力,而术后运动功能的恢复在很大程度上依赖于运动康复训练。研究表明,长时间的集中运动康复训练有助于促进神经
该文在对航母运动资态极短期预报的历史背景和国内外研究现状进行分析比较的前提下,首先对航母运动姿态进行谱分析,以证明所研究数据的有效性和合理性,理论和仿真结果表明经
随着医学影像技术的不断创新及计算机科学技术的快速发展,医学影像处理和分析能够给医生在疾病诊断和手术规划中提供更多有价值的信息。医学影像处理和分析越来越受到重视,并广
该文将人工神经网络技术和遗传算法融合用于醋酸乙烯合成反应器的建模和操作优化,并采用LonWorks建立化工企业计算机集成过程系统(CIPS),在以下诸方面开展了一些有意义的工作
数据分数据挖掘的一个重要功能.神经网络以其良好的抗噪性和鲁棒性而成为一种广泛使用的数据挖掘工具,尤其是运用在数据分类中.但是,神经网络对用户来说是一个黑箱,所获得的
随着大数据时代的到来,人们可以访问和获取的图像视频信息呈现出爆炸式的增长,如何快速高效地理解海量的图像视频信息是机器学习与模式识别的研究热点。图像标签是获取图像语义
该论文对现代电源中的零电压准谐振开关电源系统进行了研究.该文着重分析了两种典型的零电压准谐振的工作原理:降压型零电压准谐振以及全桥型零电压准谐振.然而从分析设计的
该文是结合国防预型号项目"H/SJL-863猎雷声纳控制稳定系统"的研制工作进行的,对舰载"捷联式"猎雷声纳基阵控制稳定系统的设计和实现及相关的理论问题进行了分析和深入研究,
该文针对含有跳变参数的时变线性系统、非线性系统,建立多种不同的多模型自适应控制器,并对优化模型集的建立、指标切换函数的选择、闭环系统的稳定性分析作了系统的研究工作
该文以遗传算法为主线,以制造系统调度问题及其相关问题为背景,阐述了遗传算法、调度问题及其问题的数学模型,并在遗传算法中嵌入中可以改善其性能的其它算法(如模拟退火、启