基于深度学习的图像特征表示及视频超分辨率研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:ty782406826
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像和视频作为视觉信息的载体,成为计算机视觉研究的核心。图像是视频的来源。很多计算机视觉任务,如目标识别、检测和跟踪等,都是建立在图像处理、分割和识别等基础上。在这些任务中,有效的图像特征提取是决定算法性能的关键。在各种特征提取算法中,度量学习作为一种特征学习方法,主要是通过学习一个特征的低维的嵌入空间,使得在这个空间中相同类别的图像距离近而不同类别的图像距离更远,是一种主流的方法。基于度量学习的图像分类方法已在现实生活中具有广泛的应用,例如人脸识别、图像检索和纹理识别等。依靠大数据的优势,基于梯度下降算法进行迭代优化的深度卷积神经网络(CNN)已经获得了广泛的研究和应用,但也有一些研究集中在使用非迭代优化方法来学习CNN,如PCANet。这类算法简单而高效,尤其是在数据量较少的一些分类任务中,具有较好的性能。另一方面,由于高分辨率的视频帧中包含着更多的细节信息,所以其对于帮助人们获取信息和感知世界都有重要的作用。视频超分辨率主要是通过算法来解决如何实现视频从低分辨率到高分辨率的映射过程,其具有广泛的应用场景,例如视频监控、高清电视和卫星图像等。在视频超分辨率方面,由于摄像机或物体的运动等因素的影响,为了超分辨重建对应的低分辨率帧(参考帧),在算法设计过程中通常会将多个相邻帧(支持帧)与参考帧对齐。很多方法采用可变形卷积进行隐式的帧间对齐,从而获得较高的性能,如EDVR。本文主要基于深度学习算法,对图像特征表示和视频超分辨率这两大任务进行了研究,主要贡献具体如下:(1)基于边界Fisher分析的图像特征表示网络本文扩展了 PCANet的研究方向,提出了一种基于深度边界Fisher分析(MFA)的CNN,称为DMNet。该算法利用局部MFA对卷积层参数进行优化,解决了 PCANet在样本不服从高斯分布时的局限性。它使用图嵌入框架,通过最大化边缘点的类间可分辨性以及最小化类内距离来优化卷积核参数。通过级联的方式,MFA卷积层可用于构建深度网络。此外,为了使网络生成更加稳健的特征向量,本文将随机性引入哈希方法中,提出了一种二进制随机哈希(BSH)方法作为非线性层,该方法根据卷积得到的特征图的重要性来进行特征的选择。实验结果表明,该方法在非迭代优化CNN方法中取得了最先进的结果。消融实验也验证了我们提出的BSH方法的有效性。(2)基于频率分解对齐的视频超分辨率网络现有的基于变形卷积的对齐方法只是简单地对齐帧的所有特征,而没有考虑高频和低频分量对齐的难度差异。本文将一种可导的频率分解方法引入超分辨率的网络架构,提出了一种基于频率分解的帧间对齐模块,称为FDA。基于频率的对齐方法可以让视频帧中重要的高频信息在对齐的过程中减少其它信息的干扰,从而加强帧间的对齐效果。同时,在网络的训练中增加了一种新的损失函数,其目的是使得重建后的帧仍然可以通过下采样的方式获得原先低分辨率的帧,从而保持重建帧与原参考帧信息上的一致性。为了验证FDA的有效性,本文将其应用于EDVR网络架构中,并与一些表现良好的算法进行比较。实验结果表明,FDA模块可以有效地提高模型的性能。消融实验也进一步展示了支持帧高频信息的有效对齐对于重建高分辨率参考帧的重要性。
其他文献
自1998年我国建立个人住房贷款制度以来,我国商业银行个人住房贷款余额快速增长,在金融机构贷款业务中的重要性日益攀升。但由于商业银行特别是一些分支机构忽视对个人住房贷款业务的风险管控,使得该业务的潜在风险不断累积,如管控不当不仅极易引发银行业务的系统性风险,而且可能诱发房地产市场动荡和土地利用浪费等问题。因此,深入分析商业银行个人住房贷款面临的风险及其影响因素,研究提出个人住房贷款风险管控对策建议
学位
耕地的细碎化是与耕地规模经营相对应的一种土地利用格局,是影响农业生产效率和农业竞争力提升的重要因素之一。为改善农业生产条件,降低耕地细碎度,中国开展土地整治和推进农地流转。党的十九大报告再次提出加强土地整理和土地经营权流转,实现小块变大块。耕地细碎程度如何,土地整治活动是否对耕地细碎状况有改善作用,改善程度有多大,已成为亟需研究的重要科学课题,这对掌握我国耕地细碎状况、科学评估土地整治绩效和改进土
学位
数字化正畸是近年来在口腔正畸领域出现的一种先进的计算机辅助诊疗技术。相比传统口腔正畸中高度依靠牙医经验进行正畸治疗的方式,数字化正畸以数据为基础,依靠各种数字化与智能化技术,极大地减少了人力资源投入,缓解了目前在口腔医学领域广泛存在的人力资源短缺问题。牙齿分类任务是数字化正畸的关键步骤,数字化正畸系统要在分类结果的基础上,再进行进一步的数字化正畸诊断,最后才能提出正畸方案以及实施正畸治疗。因此,牙
学位
作为计算机视觉最重要的研究方向之一,细粒度图像分类是识别图像具体属于哪一种基本类别的子类别。对于细粒度图像分类来说,不同子类别的目标对象之间差异细微,而相同子类别的目标对象会因光照、姿势、角度等存在明显差异。因此,细粒度图像分类仍具有很大的挑战。为了解决上述挑战,学习细微的类间差异是细粒度图像分类的关键。目前主流的细粒度图像分类算法通常先定位有判别力的区域,再通过基于判别部位的特征提取进而学习到丰
学位
随着全球定位系统、移动设备和遥感等多种定位技术的快速发展,基于位置的社交网络(LBSN)日益普及,产生了大量的签到数据。从数据中挖掘有价值的知识对现实世界的应用至关重要。现有方法通常通过对这些签到进行建模,产生密集的兴趣点表征,然后再进行下游数据挖掘任务。然而,这些表征中的坐标没有任何有意义的解释,现阶段关于兴趣点表征的可解释性问题鲜少被学者关注,而这种不可解释性将对于下游数据挖掘任务性能的提升产
学位
信息时代背景下,我国电子工艺技术飞速发展,在提高综合实力的同时,也进一步提高了在国际市场的竞争力。为了形成系统、完备的电子工艺技术创新和研发战略,需要明确发展方向,并针对发展中存在的问题制定相应解决策略。基于此,结合现代电子工艺技术发展现状及特点,分析电子工艺技术未来发展方向,针对发展过程中存在的实际问题,提出相应解决策略,以促进电子工艺技术持续发展。
期刊
针对目前水稻氮肥施肥量大,肥料利用率低,环境污染严重等问题,国际肥料研究中心研制了超大颗粒肥料只需一次施肥就可以满足水稻整个生育期的需求,然而其在推广使用中必须深施避免烧苗,增加了劳动力成本;将超大颗粒尿素包膜研制成控释肥料可以克服上述缺点。本文将传统尿素颗粒(直径为0.5~4 mm)压制成超大颗粒尿素(直径为16 mm),并采取蓖麻油基聚氨酯对其包膜,研制了植物油基包膜超大颗粒控释尿素,通过在膜
学位
背景:子痫前期是一种常见的妊娠特异性疾病,表现为高血压和多种器官衰竭,包括肝、肾和肺功能衰竭,尤其是重度子痫前期。重度子痫前期对孕产妇、新生儿或胎儿健康有严重危害。我国在放开三孩政策后,该疾病的发生率及发病人数很可能呈上升趋势。若能在亚临床阶段尽早发现有较大风险出现重度子痫前期的孕妇,采取一定预防措施并积极进行临床监测及干预,能够对减少不良妊娠结局的发生具有一定的现实意义。目前,重度子痫前期唯一确
学位
莠去津作为一种三嗪类除草剂,由于其成本低、除草效果好,已在全球范围内广泛使用,但是由于其稳定性极强,不易被降解,施用后会引起环境污染,尤其是对土壤的污染。虽然目前已有很多关于莠去津在土壤中对蚯蚓的急性和慢性毒性研究,但大都以人工土壤为供试土壤,但其在现实环境中施用后的土壤与人工土壤是有一定差异的,所以用莠去津在人工土壤中对蚯蚓的毒性来代表莠去津在真实土壤环境中的毒性是不够全面的。为了更加准确地评价
学位
山区树种的精确识别一直是遥感识别的重点和难点,其识别精度直接影响森林遥感制图精度。近年来,遥感技术在森林树种识别中得到广泛应用,为山区树种的精确识别提供了重要参考。多光谱遥感树种识别具有宏观性、周期短、可重复等特点,在大空间尺度调查中具有优势,而现有多光谱遥感树种识别中的光谱信息均直接使用波段值,光谱指数可扩大光谱间的微小差异,提高树种识别精度。现有的树种识别方法中,支持向量机应用广泛且精度较高,
学位