基于压缩学习的图像目标识别技术研究

来源 :河南大学 | 被引量 : 0次 | 上传用户:never0005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标识别技术研究是计算机视觉研究领域中重要的研究方向之一,该技术也已逐渐成为计算机应用领域中提供准确目标类别信息的一项重要技术。当前,很多目标识别技术均是基于深度学习框架实现的,但是在实际应用中,成像探测器获取原始图像数据并作为深度学习框架的输入,进而实现目标识别的方式并非高效,数据获取并识别的过程包含了大量的冗余信息,降低了识别效率,虽然池化层等网络层次的出现实现了深度学习框架数据量的降级,但与此同时也造成了识别过程部分数据特征的丢失。针对以上问题,本文以人脸识别以及手写字体识别研究为例,提出了一种通过压缩学习(Compressive Learning,CL)来感知多域特征的硬件图像获取与目标识别算法相结合的一体化图像目标识别技术,不仅大大减小了目标识别深度学习框架的数据输入量,而且保持了较高的识别准确率。该方法有望成为一种更高效,更灵活的目标识别方法,不仅可用于民用智能设备应用领域,而且在航天、军事等多个领域同样适用。本文的主要研究内容如下:(1)提出了一种在成像探测器内部实现的多维压缩数据快速构建生成方法,以解决当前的数据获取效率低、存储空间大、蕴含特征维度较低的问题。其具备的优势主要有两点:一是充分应用成像设备特性,基于成像探测器内部的Binning模块获取的下采样压缩数据与压缩感知模块获取的观测值数据可直接输出作为原始图像数据在不同域内的压缩特征数据,并且成像探测器内部不再需要额外的压缩重建模块,可进一步提升成像探测器内部的空间利用率,减小了数据量;二是对获取的下采样压缩数据与观测值数据进行快速合成以生成具备原始图像多域特征的多维压缩数据,该数据具备特征丰富度更高、数据量更小等优点。经过实验结果对比分析可知,本文提出的多维压缩数据快速构建生成方法与传统图像获取方式相比较,数据获取效率更高,占据的存储空间更小。(2)提出了一种结合多域特征实现的压缩学习图像目标识别技术,以解决基于深度学习的目标识别技术研究所面临的待处理数据量大、学习特征域单一而造成的识别效率低,以及数据压缩所带来的识别准确度下降的问题。该技术将压缩感知域数据与空间压缩域数据构建的多维压缩数据代替原始图像数据,并通过目标识别卷积神经网络进行训练,实现多域卷积学习,进而获取学习特征域更加丰富、效率更高的目标识别神经网络模型,而后将基于不同方法获取的目标识别神经网络模型进行目标识别实验验证,实验结果表明,本文提出的压缩学习图像目标识别方法在识别准确度上高于基于单域压缩的图像目标识别方法,降低了数据压缩对目标识别准确度的影响,并且具备比传统基于原始图像进行的目标识别方法更高效的识别速率。本文研究的基于多域特征压缩学习实现的图像目标识别方法不仅拓展了深度学习方法的学习特征丰富度,而且其具备的硬件友好性为目标识别一体化应用技术的发展提供了全新的思路,对目标识别方法的研究具备较高的参考意义。
其他文献
改革开放以来,中国经济实现跨越式发展,取得举世瞩目的成就。中国人均可支配收入逐年增加,城乡收入差距不断缩小。中国中等收入群体的规模不断扩大,已经拥有世界上最大的中等收入群体规模,成为我国经济发展的主体部分。伴随着收入的增加,居民的生活能源消费需求不断增加。收入水平的提高也增强了居民的节约能源及环境保护意识,并为节能产品的研发提供了资金支持。能源并不是取之不尽用之不竭的,如果无节制的开发,那么自然界
学位
在场景图像中对文字的位置进行检测,这是计算机视觉技术领域内的一个重要研究方向,在无人驾驶、票据分析、车牌识别、盲人导航、无人超市等各种应用场景里都有着十分重要的研究意义。与传统的光学字符识别(Optical Character Recognition,OCR)任务相比,在场景图像中的文字通常都有着颜色多样、字体大小不统一、背景信息复杂、文字表面遮挡、图像拍摄模糊、分辨率低等诸多影响因素,这些影响因
学位
近年来,随着中国经济的快速发展和城市化进程的不断加快,大气污染对空气质量和气候变化的影响日益显著,已成为关系到国计民生的重大问题。二氧化氮(NO2)作为传统光化学烟雾的代表性污染物和重要的痕量气体,在对流层大气化学中起着重要的作用。它不仅会形成雾霾、酸雨等环境问题,而且也会对人体健康产生很大危害。因此,本文基于卫星遥感和目标检测技术,以河南省区域为例,对NO2污染物时空分布特征及其影响因素进行研究
学位
行人重识别(Person re-identification)是指在非重叠监控视域下,对当前拍摄到的目标行人在其他视角域下进行再识别的技术。这项技术目前在刑侦破案等方面已经得到广泛应用,特别是在防范打击国际恐怖活动的任务中,能够从海量的图像或视频库中迅速匹配锁定犯罪嫌疑人,大大提升了公安部门的破案效率。然而,在真实场景应用中,不同监控设备所拍摄到的行人图像存在着分辨率、拍摄角度、光照强度的差异以及
学位
移动边缘计算是一种新型的无线网络架构,它将云计算能力“下沉”到距离用户很近的网络边缘,为用户提供低时延高可靠的服务。移动边缘计算中的任务迁移策略可将用户任务迁移到其附近的服务器上,利用服务器充足的计算资源来完成任务,是当前研究热点。目前现有的任务迁移策略研究大部分面向准静态环境,没有考虑到系统资源不可预知的动态变化。并且很多研究假设服务器资源充足且同构(即每台服务器上的各种资源相同)。这些迁移策略
学位
合成孔径雷达(Synthetic Aperture Radar,SAR)系统采用主动式微波遥感技术,可以不受光照与云雨雾等因素地影响,能够全天时、全天候对地成像,获取连续时间序列SAR图像。SAR图像分类作为一项重要的基础研究,其分类精度直接影响后续遥感应用的效果与质量。由于SAR系统侧视成像的特点,当地表为山脉等具有高程起伏的复杂地形时,其SAR图像中会相应出现叠掩、阴影、迎坡收缩和背坡拉伸等几
学位
随着带有全球卫星导航系统(Global Navigation Satellite System,GNSS)功能的移动设备快速普及,基于位置的社交网络(Location-based Social Network,LBSN)逐步成为日常生活中必不可少的移动应用。在这类应用中,地理位置推荐服务是其中的一个核心功能与研究热点。地理位置推荐是基于用户的历史签到数据和社交信息,发掘兴趣偏好,预测可能访问的地理
学位
小样本图像识别是深度学习领域中重要且有难度的课题。基于深度学习的图像识别在数据密集型的应用上卓有成效,但当数据集极小时,它常常受到阻碍。在小样本图像识别任务中,如何在图像特征表达能力和过拟合问题上进行权衡,是一个重要挑战。因为使用较深的卷积神经网络,虽然能够提升图像特征表达,但是容易出现过拟合问题。而为了缓解过拟合问题,通常选择结构较为简单的网络,但却不足以对图像中所蕴含的信息进行有效提取。另一个
学位
<正>“数缺形时少直觉,形少数时难入微。”著名数学家华罗庚先生的这一观点生动形象、深刻地指明了“数形结合”思想的价值,也揭示了数形结合思想的本质。教学中有效渗透这一思想尤为重要。所以,也有研究者结合“数”、“形”的本质的内涵探讨了小学数学中渗透数形结合思想的课堂教学把握。如教△+7=13,则△=?就算不上是渗透数形结合思想,属于符号思想。像利用图形讨论异分母分数加减法计算方法或利用图像讨论两个变量
期刊
随着物联网移动终端的大规模推广,移动终端供能问题成为无线通信系统的研究热点。解决供能问题的能量收集技术引起了科研工作者的极大关注,传统能量收集技术从自然能源中收集能量,可以有效解决供能问题。但由于自然能源的间歇性和不可预知性等特点,该技术易受自然环境变化因素影响,从而引发供能不稳定问题。新颖的无线携能(Simultaneous Wireless Information Power Transfer
学位