基于核保持嵌入的表示学习方法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:qiming1155
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着机器学习、深度学习技术的进一步发展,基于表示学习的分类算法性能有了很明显的提升,但基于表示关系的算法大多仅通过原始样本的直接关系进行建模,而如何在子空间或表示空间也能够保持原始数据的相似性关系和空间结构,是提升表示学习模型性能的关键。本文立足于表示学习中的子空间学习、字典学习和深度字典学习,研究具有更高识别精度的表示算法。所取得的研究成果如下:(1)针对子空间学习算法或未能考虑样本的类标信息,或只利用了类内局部关系构图,忽略了不同类样本之间的表示关系及其在构图中的作用这两点不足,提出了一种基于核保持嵌入的子空间学习方法(KESL)。KESL将核函数引入样本的自表示学习中,利用核保持关系学习到的相似性表示分别构建类内图和类间图,增强了对类与类之间不相似性的利用,使得在投影子空间中,同类样本的核保持关系得到加强,不同类样本间的核保持关系被进一步抑制,通过核保持矩阵和图嵌入的迭代优化得到最优表示下的子空间投影。继而提出基于空谱特征网络与KESL优化的高光谱图像分类方法(SSN-KESL),先得到空间-光谱融合数据然后再利用KESL进行特征嵌入。实验证明所提方法在分类任务中的性能优于主流的子空间学习算法。(2)针对单一特征表示的局限性和视角差异性问题,提出了基于核保持与块对角化的多视角字典学习方法(KBR-MVDL)。该方法首先利用解析型字典的得到每种视角数据的表示系数,引入块对角化结构约束让每个样本尽量由其同类样本表示。基于数据来自不同视角但标签共享这一事实,将来自不同视角的表示系数串联后训练分类器。考虑到局部信息的重要性,提出了基于核保持嵌入与公共空间表示的多视角字典学习方法(KESSR-MVDL)。该算法给每个视角学习一个权重以区分不同视角的贡献度,利用核保持关系给每一个视角都学习一个类内表示和一个类间表示,学习一个公共表示空间以挖掘视角互补信息,利用图嵌入框架使样本在原始空间和子空间具有同样的邻接关系。在多个数据集上的实验证实了所提算法能够有效提升多视角数据分类精度。(3)针对深度字典学习方法得到的表示系数判别性不足的缺陷,提出了基于核保持和判别约束的的深度字典对学习方法(KDC-DDPL)。引入字典对学习模型使得表示系数中含有更多数据信息,一方面,通过对合成型字典进行费舍尔判别约束和低秩约束增强其判别性和鲁棒性,另一方面,用判别转换矩阵对表示系数约束,增大不同类别样本的差异性。多个数据集上的实验结果表明,算法在提升分类性能的同时,有效挖掘了数据的判别信息。
其他文献
随着金融环境的不断变化,传统金融管理方式遭遇强烈竞争,在新的金融形势下,银行绩效考核体系之于银行发展的重要性与日俱增。合理运用绩效考核体系可以帮助公司挖掘问题,分配利益,达成预期目标,从而促进公司成长。合理的绩效考核体系是企业管理者与员工的纽带,科学地将两者联系起来,可以使得管理者与员工积极投入工作以提高客户满意度,从而提高公司整体效益。此外,公司客户经理在绩效考核体系中扮演着重要的角色,因此,对
学位
金融科技的发展促使了传统银行业在产品和客户服务、销售渠道、IT系统及数字化几个方面不断深入探索。到2020年,银行业已经有近30%的营收受到直接影响。因此,响应时代发展,寻求新的产品及营销策略成为商业银行促转型和谋发展的必由之路。进入应用阶段时无可避免地与一群天然生长在互联网和新兴事物下的群体发生联系,这就是本文中提到的年轻客户群体,简称年轻客群。移动支付尤其是手机支付的诞生与发展,使得这个群体对
学位
环状铁氧体是一种广泛应用于扬声器、拾音器、微波炉、电视等电子产品中的非金属磁性材料,其生产过程中会产生掉块、直裂、圈裂、杂质、粘膜、油污等缺陷,严重影响产品质量。目前主要通过人工观察进行质检,检测效率低、成本高。论文设计了一种基于机器视觉的环状铁氧体外观缺陷检测分拣系统,旨在减轻质检工人的劳动强度,提高质检效率,降低生产成本。根据环状铁氧体的滚动特性和磨床立式滚出工件的特点,论文设计了借助工件重力
学位
如今,立体匹配和图像压缩是计算机视觉中的关键研究问题,并且由于对自动驾驶汽车和场景理解的巨大需求而备受关注。跨光谱立体匹配是克服多光谱图像对之间的光谱间隙和估计视差图的一个非常具有挑战性的问题。此外,图像压缩是影响后续计算机视觉任务的基础研究领域,其主要目的是通过编码器将未压缩的图像压缩成比特流,以实现高效的存储和传输。在本论文中,我们研究了基于深度学习的跨光谱立体匹配和学习图像压缩。本文的主要工
学位
在室内自主定位领域,虽然目前已经有多种定位方式可供选择,但视觉SLAM因其成本低、可视化强、理论成熟等优势而备受欢迎,活跃在各种应用场合,极具潜力的移动机器人市场更是催生了各种令人惊羡的视觉SLAM算法。其中,ORB_SLAM2算法在基于特征点法的一类视觉SLAM算法中,具有里程碑意义。本文以ORB_SLAM2算法为理论基础,对室内自主定位方法进行探索和研究。首先,为了使视觉SLAM算法在图像发生
学位
传统机器人由于结构限制难以在狭窄非结构化环境执行预设任务,而连续体机器人相对于传统机器人其构型拥有无限冗余特性。无限冗余特性使得连续体机器人在拥塞的环境中有着极佳的柔顺适应性,其柔顺特性使其在狭窄拥塞的非结构化环境中彰显出广阔的应用前景。但无限冗余特性也给连续体机器人建模、跟踪控制带来了巨大挑战。本文以多段连续体机器人为研究对象,通过仿真与实验对其运动学和跟踪控制展开相关研究,主要工作如下:为了描
学位
近年来,数字化多媒体技术发展迅速,用户对数字化的图像和视频的需求量呈爆炸式增长。但是图像和视频的信息量相比于文本十分巨大,传输和存储需要大量的网络带宽和存储空间,因此需要对其进行数据压缩。目前,大多数的国际通用图像和视频压缩标准采用基于分块的DCT变化压缩编码技术。尽管这种技术可以提供相对接近原图的图像和视频,但其不可避免的会产生压缩伪影,包括块效应,带状效应和振铃效应。这些压缩伪影不仅影响用户的
学位
近年来,随着深度学习理论的兴起,计算机视觉的各个领域都得到了充分的发展。多目标跟踪技术作为计算机视觉中重要的组成部分,在这次深度学习浪潮中获得了长足的进步。由于多目标跟踪在军事、刑侦、商业分析等多个领域有重要的作用,因而对其研究有着重要的价值。相较传统方法,目前主流的基于深度学习的多目标跟踪算法已经有了显著的进步,但是人们对多目标跟踪算法提出了更高的要求,如实时高效跟踪、拥挤场景跟踪等。现有的跟踪
学位
随着电子信息技术的迅速发展,人们对光的认知不断地加深,不同波段光信息的获取变得尤为重要,通过光电传感器的数据采集与传输系统是获取光信息的重要手段。目前,大多数的数据采集系统可采集的通道数量有限且系统的功能也比较单一,难以根据光电传感器通道的数量进行灵活地扩展和系统升级。因此,本文根据多通道光电探测器阵列实际需求,研究探测器阵列、模拟信号调理模块、数据采集模块、信号处理模块与传输接口模块等结构及其相
学位
视觉目标跟踪是计算机视觉领域的一项经典研究课题,在视频监控、自动驾驶和人机交互等方面应用广泛。尽管对于目标跟踪的研究取得了很大进展,但单模态信息的局限性和不确定性影响跟踪效果,如可见光成像受光照、雨、烟和霾等环境条件的影响较大,红外成像虽受环境影响小,但其成像机理导致红外图像分辨率较低、纹理少,在热交叉条件下目标与背景难区分等。基于可见光和热红外(RGB/Thermal,RGBT)的双模视觉跟踪器
学位