基于字典学习的多视角学习方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:andalee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的飞速发展,每个领域的数据都表现出井喷的增长趋势,对于同一个物体,可以通过不同的维度或方式进行描述,因此数据表现出特征维度高、数据结构复杂等特点,这在一定程度上推动了多视角学习(Multi-view learning)的发展。多视角数据来源于不同的领域或者采集器,不同的视角信息表现着数据的不同属性,如何充分利用视角间的共识信息以及每一视角独有的特征信息,从而提高分类的准确度,这始终是多视角学习的重点难点所在。近年来,字典学习作为特征学习的经典算法持续受到研究人员的关注,字典学习可以通过若干个字典原子的线性组合对信号进行重构,有效地学习样本背后关键的特征属性,并利用稀疏编码替代原始数据作为输入的表示。但是现有的研究成果中却较少有学者考虑字典学习与多视角学习的联合学习。为了更好地提高多视角学习的分类精度,本文提出了一种基于字典学习的多视角学习方法(Multi-view learning based on dictionary learning with consensus of view,MVDL-CV)。首先,我们在每一视角上进行字典学习,获得数据的稀疏编码表示。然后,我们对不同视角字典进行相互靠近的约束,从而更好地探究视角间的共识信息,这将有助于提高稀疏编码的判别性,以便后续标签分类器的训练与获得。在优化的过程中,我们利用交替优化的方法进行模型参数的求解。在实验部分,我们将MVDL-CV方法与基准方法在多个数据集上进行验证,实验结果表明MVDL-CV方法在分类任务上效果更好。综上所述,本文在结合字典学习的多视角学习问题上的工作和贡献可以概括如下:1.我们将字典学习融入了多视角学习的过程中,通过字典挖掘出视角数据背后关键的特征属性,利用不同视角字典间的关系解决了视角间相关性不足的问题。MVDL-CV还同时考虑了样本数据经过字典学习后得到的稀疏编码的判别性,与数据在原始特征空间中的内在结构。2.我们在每一视角上进行字典学习,充分探究样本的视角特征信息。由于不同视角数据具有相同的标签属性,因此我们在目标方程中考虑了视角数据的相似性。令不同视角字典的相互靠近,我们可以进一步获得视角间的共识特性,并确定不同样本间的相似性。经过字典学习后,输入样本可以获得具有稀疏性的表示。随后,我们将稀疏编码映射至标签空间进行分类器的训练学习,这不但降低了视角分类器学习的难度,而且在相同标签的约束下,学习得到的稀疏编码将具有判别性。在算法优化的过程中,我们使用了交替优化方法获得模型各参数的最优解,在实验部分,我们也展示了模型MVDL-CV的收敛性分析。3.我们从不同的角度组织了实验验证我们方法的有效性。通过与六个基准算法对比,实验结果表明MVDL-CV比其他方法在分类任务上能获得更好的表现,是一个更具有竞争力与稳定性的方法。
其他文献
随着大数据时代和电子信息技术的飞速发展,多视图数据的身影时常出现在不同领域的科学研究和各种实际应用场合中。与单视图数据相比,多视图数据因为可以提供更多对学习任务有用的信息,所以对于聚类和分类学习任务具有更好的性能,因此多视图学习一直是人工智能和数据挖掘等众多领域的重要研究方向。近年来,基于张量奇异值分解(t-SVD)的多视图聚类算法,充分利用张量数据的低秩特性,可以更高效、更彻底地探索多视图数据之
学位
情绪,高度概括了人们的主观认知经验,在人与人的沟通中具有重大意义。目前单模态情绪识别研究已经很成熟,但在当今,人们都是通过混合的方式来表达情绪,现有的多模态情绪识别研究在获取各个单模态的情感特征时,往往忽略了情感特征的交互性与完整性,特征的丢失导致模型在准确度和性能方面都有所欠缺;同时,在多模态数据融合的过程中,存在无关信息干扰,且没有最大化的保存各个模态之间的有效交互信息。因此本课题针对上述存在
学位
随着5G通信领域的飞速发展,无线通信设备爆炸式增长使得有限的频谱资源日渐紧缺。因此研究如何解决紧张的频谱资源和频谱的低利用率问题具有深远的研究意义。目前,认知无线电技术中已经开发了许多频谱感知方案用以寻找频谱空穴,进而达到提高频谱利用率的目的。但其中部分频谱感知方案依然有着一些问题,例如:判决门限的计算复杂且低效、未考虑感知环境中存在个别异常用户干扰的影响等。本文为了解决当前已有的频谱感知方案性能
学位
工业产品表面缺陷分割是指在产品表面分割出缺陷的部位以及识别该缺陷的类别。它是工业产品生产过程中不可或缺的一部分,能有效的监控工业产品的质量,为产品的美观度、舒适度和性能等提供有力保障。尽管目前的缺陷检测算法对于工业产品表面缺陷检测已较为成熟,但仍然存在以下挑战。首先,由于待检产品表面图像采集场地存在多种复杂光源的干扰,使得一些具有金属材质的工业品容易产生不同程度的反光现象,从而造成对工业品表面缺陷
学位
多标签学习处理的是将给定的样本同时与多个标签相关联的问题。近年来,多标签学习已成为机器学习文献中的一个热门话题,并引起了大量的研究。然而,如何准确地描述标签之间的真实关系,以及如何进一步增强标签之间的相关性依然是多标签学习所面临的挑战。另外,以往大多数的多标签学习方法只考虑了单个视角的信息,很少有与多视角学习结合起来。为此,为了解决多标签分类问题,本文提出了一种基于标签相关性的多视角多标签学习方法
学位
随着无人控制技术的发展和现实应用场景需要,机器人技术逐渐向自主化、智能化方向发展,机器人不仅需要具有稳定的运动能力,还需要感知、识别周边环境,实现准确定位以及自主规划。在室内环境中,GPS信号容易受到干扰和屏蔽,无法为机器人提供可靠准确的位置信息,而室内光学动作捕捉系统布置繁琐、设备成本高。基于视觉的同步定位与建图技术通过少量传感器即可实现自主环境感知,能够建立可供定位和导航规划的环境地图,是解决
学位
最近几十年,针对非线性系统的自适应控制研究已经有了许多重要的成果,对整个自适应控制领域的发展起到十分重要的作用。但是,一些针对时不变参数非线性系统自适应镇定控制的算法,在具有时变参数的不确定非线性系统中并不适用。因此,具有时变参数的不确定非线性系统的自适应镇定控制问题是控制领域一直以来需要深入探讨的重要研究方向。针对具有时变参数的不确定非线性系统的自适应镇定控制问题,本文应用了一种称为变量凝结的方
学位
随着科学技术不断的迭代与更新,当今社会生活和工业领域存在的系统日趋复杂,如交通系统、冶金系统、电力系统等,这些复杂系统往往具有高度的非线性,且难以建立准确的数学模型。因此,如何去克服系统未知动态带来的问题,实现对非线性系统的控制成为广大科研工作者关注的焦点。近年来,多种基于神经网络的非线性系统智能控制方案被提出,其中局部加权学习神经网络算法由于其对系统未知非线性良好的辨识性能和灵活性,受到众多学者
学位
随着我国经济的飞速发展,人们对青少年的发育状况变得愈发重视,因为在儿童与青少年人群中出现发育问题的案例呈现增长趋势,骨龄作为评判青少年发育状况的重要指标,常常在临床上使用骨龄作为青少年儿童的成熟水平的衡量标准。如果只通过骨龄专家人工的方式来进行骨龄评测,不仅效率低而且主观性强,同时因为骨龄专家的缺少,导致有很多青少年儿童不能及早的发现问题。因此本课题设计并开发一个基于Android系统的青少年AI
学位
命名实体识别和关系抽取作为信息抽取的基本任务,可以为知识库提供准确和大量数据的支持。知识库不仅仅可以为相关产业发展打下坚实的基础,更可以通过知识库对产业进行分析总结,最终实现相关产业可持续高速发展。但是目前来说,信息抽取的研究依旧还有待更进一步的发展。命名实体识别任务存在着如何能有效利用单个字与词语的结构特征输入以及如何按词语的重要性来赋予不同的高权重的两个问题。关系抽取任务存在传统方法使用依赖抽
学位