低分辨率图像分类与识别方法研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:jiekoala
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
低分辨率场景下的目标分类与识别问题对社会公共安全和国防等意义重大。随着图像信息获取技术的巨大进步,人们对获取的图像信息的使用需求也越来越大,特别是在一些特定应用中,对图像中精细目标信息的需求愈加强烈。然而该类精细目标的图像分辨率相对较低,能够获取的有用信息量较少,在借助高分辨率模板图像进行目标相似性度量时,待识别低分辨率目标图像与高分辨率模板图像之间的维度空间不匹配问题,使得低分辨率场景下的目标识别和分类面临极大的困难和挑战。为了更好的实现低分辨率场景下的目标识别和分类任务,本文开展了低分辨率图像数据集的建立与分析,基于双层耦合映射方法,非线性多层耦合映射方法和低分辨率场景下的目标识别系统四个方面的相关工作。1)针对低分辨率图像数据集的生成和建立问题,首先,搭建了一个基于深度学习的远距离车牌图像提取网络,采用分步提取的方法,获取不同分辨率的远距离车牌图像。在此基础上提出了一种基于DCT系数的模糊车牌图像评价方法,利用DCT变换将空域中的图像变换到频域中,并在频域中提取图像左上角四分之一区域的信息作为图像的特征,进行六种不同分类器的训练和测试,实现远距离车牌图像分辨率的区分和低分辨率车牌数据集的建立。其次,将高分辨率人脸图像进行下采样,实现低分辨率人脸图像数据集的生成,为后期的低分辨率图像的分类和识别做好实验数据的准备。2)针对低分辨率目标分类中,待识别低分辨率图像和高分辨率模板图像之间的维度不匹配问题,提出了一种基于双层局部保持耦合映射(DLCLPM:Double layer coupled locality preserving mappings)的方法。已有的耦合映射方法将高分辨率图像和低分辨率图像映射到统一的子空间,并进行距离度量和分类。本文提出的方法将单层耦合映射结构拓展成双层结构,并在模型的训练阶段引入中间级分辨率图像,充分利用样本几何空间的特征和不同尺度图像之间的特征信息,进行有效性的特征信息互补。测试阶段,对目标进行分类时,利用双层结构中局部信息相结合,进行全局优化,并引入权值机制,获取了一种更加精确的度量方式。通过对比提出的DLCLPM和CM、CLPM、LGCM等算法在数据集FERET,Yale和CMU上的实验结果,提出的DLCLPM方法对低分辨率图像的识别具有更好的识别性能。3)为了能够改善图像数据线性不可分问题,提出了一种非线性多层耦合映射方法(NMCM:Nonlinear multilayer coupled mappings)。该方法根据原始高分辨率训练图像分离出来的多个不同分辨率级别的图像,将这些不同分辨率级别的图像和低分辨率图像构造多层耦合映射结构。为了获取可分性较好的耦合空间,本算法通过非线性映射将这些图像特征映射到更高维的空间中,利用核技巧实现非线性化的过程,并在变换之后的空间中建立多层耦合映射模型。将各层耦合映射相结合,构造出一个全局性的多层耦合映射结构。设计求解耦合映射矩阵的目标函数,通过对训练样本的学习,得到相对应的耦合映射变换矩阵。最后将测试样本映射到相应的多层耦合空间中,结合全局相似性度量进行目标的分类。通过对比五个数据集上与CM,CLPM,LGCM,DLCLPM算法的实验结果,提出的NMCM方法有效地提高了低分辨率图像分类的准确率,减小了单层耦合造成的信息损失。4)针对低分辨率场景下的目标识别问题,设计了一个目标识别软件,该软件功能分为两个模块。一个低分辨率人脸图像的识别模块,嵌入了非线性多层耦合映射模型,实现低分辨率人脸图像的判别。第二个模块实现远距离监控视频中的车辆检测,跟踪及车牌识别功能,可以对视频中的车辆目标的信息进行结构化显示与分析,并依据车牌图像识别结果,可以进行反向查询,从而获取特定车辆目标的信息。
其他文献
为缓解能源危机和减少二氧化碳(CO2)过量排放,发展新的技术手段重新再利用CO2这一丰富的碳资源成为各国的研究热点。其中,电催化CO2还原为高附加值的化学品被认为是非常有效的将CO2资源化和能源存储的技术途径。然而,电催化CO2还原具有高的热力学和动力学障碍,传统的贵金属材料(Ag、Au、Cu和Pd等)是电催化CO2还原的高效催化剂,但其高成本、低稳定性及污染环境等限制了它们大规模应用,在可替代贵
随着国内游戏产业的发展与硬件技术的提升,从八十年代起我国游戏产业开始逐渐摸索出自己的道路。在短时间内取得了一系列的成果。并在源头上对游戏制作环节进行整体的探索,逐渐重视技术与制作概念的创新,通过国内外优秀的游戏产品与制作概念交流,在目前的环境形势下,如何设计创作出具有中国特色与传承价值的游戏作品,并在外来游戏产品的强大实力下立足生存,是亟待解决的关键问题。本文试图研究水墨元素如何在游戏美术与制作环
新兴的物联网(Internet of Things,IoT)应用,如智能制造和智能家居,对提供低成本、高精度的室内定位和导航解决方案提出了巨大的需求。惯性测量单元(Inertial Measurement Unit,IMU)通常可以在较短的时间内提供较精确的位置解算,但是由于加速度计传感器存在测量误差的累积效应,其定位和导航误差随着时间的推移而迅速增加。另一方面,超宽带(Ultra-Wide Ba
艺术语言是创作者艺术表达的具体体现,能够代表创作的水平和画家的思想,版画创作中艺术语言的产生及演变是在众多因素共同作用下的结果。随着经济、政治等均实现了快速扩张发展,艺术、科学技术水平也在不断演进。新媒体、新文化以及新技术已融入到版画艺术里,使当代版画艺术不断呈现出新的表现语言与创作方法,给版画带来了新的机遇。在以往的版画展览中,某些传统版画的艺术语言较为局限,更新速度较慢,比较缺少与当代文化、当
近年来,语音识别技术在无噪环境下取得了突破性的进展,但在带噪环境下识别性能仍然存在下降的问题。因此,鲁棒语音识别研究受广泛的关注,如鲁棒语音特征提取、语音增强和鲁棒性声学模型等。鲁棒性声学模型是提高语音识别系统抗干扰能力的关键技术。然而,鲁棒性声学模型在实际应用中仍然存在很多有待克服的技术问题,譬如对未知噪干扰的泛化能力和对复杂应用场景的建模方案。为了解决这些问题,本课题从端到端的声学模型和深度神
近年来,无人机和机器人等无人智能设备迎来了快速发展,其与接收站实时共享机载传感器数据成为工业界的迫切需求。然而,由于奈奎斯特(Nyquist)采样率的限制和通信信道是极其有限。因此,亟需一种新的技术突破经典的奈奎斯特采样理论,而压缩采样正符合这种技术。压缩采样技术将采样和压缩过程合二为一,极大的减少了采集信号的存储空间。接下来,利用深度学习的方法对压缩采样数据进行数据恢复。由于深度学习卷积网络模型
动漫产业作为我国文化产业的重要板块,是国家近年来大力扶持发展的重点产业。我国动画水平曾立足于世界巅峰,却从20世纪80年代后逐渐落寞,崛起之路困难重重。2015年随着“IP时代”的到来,动漫产业乘着IP的风呈现爆发式增长,一度成为资本市场的宠儿,拓展动漫IP价值的需求不断涌现。与此同时,在互联网浪潮的推动下,跨界融合逐渐成为全球各产业主流的发展趋势,为动漫IP带来了前所未有的发展机遇。然而,由于我
人类行为识别是计算机视觉中一个重要的主题,行为识别既包括单人执行一系列动作以完成某项任务,也包括许多人分散在一个大的空间里,共同努力完成一个共同的任务,即群体行为。群体行为识别的一个典型的应用场景是体育视频理解,体育战术自动分析等关键技术,具有重要的应用前景和商业价值。但由于背景杂乱、个体之间的关系复杂等原因,使得面向体育视频的行为识别成为一个及其重要而又非常具有挑战性的问题。本文对体育运动排球视
随着第五代移动通信(The Fifth Generation,5G)时代的到来,人们对传输速率和通信可靠性有了更高的要求,对未来无线通信生活的多样性有了更多的期待。然而在“万物互联”的时代,无线通信业务需求呈现出的巨大增长趋势导致现有的技术不足以支撑海量的通信设备,因此在发展现有通信技术的同时部署新的系统对提高通信性能有重要意义。与此同时,为缓和移动通信过程中的能量消耗与通信设备的有限电量存储之间
随着无线通信技术的快速发展,移动通信数据流量呈现出爆炸式增长趋势,这不仅给传统的通信网络体系带来了巨大的负担,也给未来绿色通信网络的设计、运行以及维持带来了严峻的挑战。同时随着未来通信网络中更多的无线移动终端设备连接到互联网中,“万物互联”的通信演进模式已成为必然。然而其也带来了一些非常严峻的挑战,比如,如何在保证绿色通信的情况下为用户提供可靠的通信服务,以及如何增强通信网络的智能化水平。为解决以