基于卷积和字典学习的图像表示学习方法研究

来源 :中北大学 | 被引量 : 0次 | 上传用户:xujin2003cn
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,我国高度重视人工智能技术的发展,加快人工智能行业布局规划,各地积极部署、实施和完善人工智能政策,推动保障相关行业的高速发展。目前,计算机视觉技术(Computer Vision,CV)已较为成熟,在算法、算力和数据量上均有较大的进展和突破。然而,高维(High Dimensional,HD)数据的特征提取仍然是目前人工智能机器学习算法中的难点问题和重点关注焦点之一。本文针对高维图像数据,研究如何有效学习图像的低维(Low Dimensional,LD)判别特征表示。通过结合卷积神经网络(Convolutional Neural Network,CNN)、稀疏编码(Sparse Coding)和正交投影(Orthogonal Projection),提出了一种通用的端到端联合学习方法,即jointly optimizing Sparse coding and Convolution for learning Lowdimensional discriminative image representations,简称Spar Conv Low。所提框架的图像表示学习过程总结如下:首先,利用骨干卷积神经网络提取高维卷积特征;其次,对卷积特征进行正交投影以降低维度,并根据正交投影后的卷积特征求取相应的稀疏编码;随后,再次利用投影矩阵将稀疏编码映射为低维稠密的判别图像表示。框架学习过程被视为解决基于迹商最大化(Trace Quotient Maximization)准则的联合优化问题,全局目标函数被定义在CNN参数空间、斯蒂菲尔流形(Stiefel Manifold)、斜流形(Oblique Manifold)和格拉斯曼流形(Grassmann Manifold)的乘积空间上,并通过显式梯度传递、梯度反向传播和共轭梯度下降算法实现优化。在八个图像数据集的实验结果表明,该方法与现有的图像分类、目标分类和人脸识别方法相比,具有很强的竞争力。同时,本文进一步提出一种联合深度半监督卷积神经网络和稀疏编码字典学习的端到端半监督学习方法,称为Semi-supervised learning based on Dictionary learning and Convolution(SSDConv),旨在学习到具有更强判别性的图像特征表示,提高半监督卷积神经网络模型的性能表现。传统卷积神经网络及Spar Conv Low的学习范式为有监督学习,需要大量有标记的训练样本,而半监督学习范式下的SSDConv框架可以利用未标记的训练样本,提高对海量数据的利用率,减少标注样本所需花费的人力和时间。SSDConv框架中卷积特征提取部分和字典学习部分具有共同的目标函数,学习判别性更强的图像低维表示,实现更准确地高维图像分类。同有监督学习场景相似,本文的半监督框架依然利用了共轭梯度下降算法、链式规则和反向传播等算法对目标函数的参数进行优化。最后,多个数据集的实验结果验证了SSDConv框架的有效性,本文所研究的图像表示学习算法在半监督分类场景中亦有出色的表现。综上,本文基于卷积和稀疏编码,针对有监督学习和半监督学习范式分别设计了两个图像低维表示的学习框架,并在图像分类任务中进行了实验。研究和实验结果验证了所提出的基于卷积和稀疏编码图像表示学习算法具有竞争力,在低维判别特征提取能力上有出众的表现。
其他文献
在微生物科学取得巨大研究进展的今天,无论是生物制药还是工业发酵等领域都离不开对相应细胞的培养过程。而在细胞的培养过程中,细胞活性的鉴定和活细胞浓度信息是人们对生物过程进行分析和调节控制的关键所在。如何在细胞培养过程中,在避免细胞培养环境被污染的情况下及时了解并记录细胞的生长情况,已经成为了国内相关研究人员亟待解决的问题。本文以实现对活细胞浓度进行实时、准确、在线测量作为研究方向,通过比较现有多种细
学位
行人意图识别无论对于现今无人车智能驾驶,还是未来智慧交通系统构建,都具有重大意义。然而目前人工智能领域主要研究方向集中于行人检测,对行人意图识别的方法和研究很少。本文围绕行人姿态和注意力机制对行人过街意图识别展开研究,分为行人目标检测、行人姿态估计、过街意图识别三个部分,其主要内容如下:1、提出改进YOLOv4的行人目标检测方法。针对YOLOv4算法在光线不明等实际场景中检测精度降低的问题,通过引
学位
随着互联网技术飞速发展、移动通信设备迅速增长、数据传输速率不断提高,频谱资源出现严重短缺现象。现有频谱分配政策只允许授权用户使用分配的频谱,而其他认知用户无法使用该频谱。认知无线电(CR)技术通过将频谱资源分配给主用户(PU),次用户(SU)正确检测PU信号和减少对授权用户通信的干扰来机会访问空闲频谱,提高频谱利用效率。为了减少对授权用户通信的干扰,提高频谱检测的有效性和准确性,提出了各种各样的频
学位
近年来,光纤通信迅速发展,光纤网络的规模也随之越来越庞大。如果光纤线路中某处出现了断裂、损伤等异常,光纤网络的服务就会受到严重影响。为了保证光纤网络通信服务的质量,需要快速在长距离光纤中确定异常位置,从而及时解除异常。这使得光纤网络的维护变得十分困难。OTDR是传统的光纤故障排查中常用工具,但是需要从OTDR信号曲线中人工判断出测试光纤是否发生故障及故障类型。人工判断效率低下,精度低,并且对维护人
学位
近年来,无线传感网络的覆盖范围越来越广,无源、集成化、低功耗和测量灵活性成为了传感节点的新要求。近场通信(NFC,Near Field Communication)技术作为一种新兴的无源无线技术,有着受环境影响小、建立时间短、通信稳定、可靠性高等诸多优势。使用NFC技术设计NFC无源无线测量系统,可使测量系统实现微型化和低功耗,适用于复杂、多样化的测量环境。本文通过借助仿真工具和实测仪器进行具体实
学位
听诊是临床上最为常用的检测方式,能够通过听取人体器官发出的声音对病情做出初步的判断,由于其简单、高效、无创的特点使得这一检测方式经久不衰。听诊器作为听诊的主要工具,能够对人体发出的微弱声音进行放大。随着电子技术的发展,电子听诊器凭借高效的性能,逐渐替代机械式的听诊器。由于目前不同型号的电子听诊器使用的传感器种类不同,导致听诊器的性能参差不齐。为了保证电子听诊器能够采集到丰富、准确的信息,需要一种面
学位
随着工业4.0的到来,机械臂和计算机视觉等新型技术高度结合,如今,传送带广泛用于工厂的配送、仓储、制造和生产,以实现自动化和更快的交付。如何结合视觉跟踪和物体抓取等技术,使机械臂能够成功地抓取传送带上的运动物体,是一个具有挑战性的问题。为了提高抓取效率和准确率,本文围绕机械臂对多类动态目标的抓取展开研究,具体工作如下:(1)针对机械臂目标检测问题,提出了一种轻量化网络的抓取检测方法。采用YOLOv
学位
室内可见光通信(VLC)是利用白光LED光源,在照明的同时实现无线通信,具有传输速率快、节能环保等优势。但目前白光LED的最大调制带宽约20MHz,且在发射功率较高时存在非线性效应,使VLC的通信速率受到制约。为了满足当前日益增长的室内无线通信需求,在现有LED器件条件下如何提升VLC调制速率和传输可靠性是急需解决的科学问题。本文采用正交频分复用(OFDM)多载波调制方式,以充分利用有限的调制带宽
学位
空间激光通信是以激光为载波,携带信息进行无线传输的通信方式,由于其传输速率高、免电磁干扰、传输距离远等优点逐渐成为通信领域研究的热点。但是,由于大气湍流的影响,携带调制信息的激光束在传输过程中会受到各种效应影响,导致传统的解调方案难度增加,系统整体性能下降。盲优化技术可以不借助额外训练序列,仅通过接收端信号的先验信息来优化信道特性,使得输出序列尽可能逼近发送序列,应用在激光通信领域具有一定优势。因
学位
我国是世界上自然灾害种类最多的国家,自然灾害的发生往往对社会以及人民生活造成不可逆转的损失与危害,是人类历史上面临的最严峻的挑战之一。野外自然灾害长期无人值守系统大多采用锂电池等传统电源供能,由于其存在定期充电问题,不能满足监测系统长期工作的需求。摩擦纳米发电机的问世彻底打开了微能源领域的大门,为实现自供电无线监测系统提供了可能,如何高效采集环境能并满足监测节点长期无人值守供能需求成为了一个挑战。
学位