基于特征编码的细粒度图像识别

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:flyingflying
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的快速发展,图像识别在日常生活中得到广泛的应用。作为图像识别研究中的一个重要分支,细粒度图像识别旨在对同一大类中的多个子类别进行更细致地识别与分类。由于不同子类别具有较大的类内差异和较小的类间差异,区分多个子类别通常需要专家级的领域知识,目前的方法主要采用特征编码技术来学习细粒度物体的判别性属性。然而当前的特征编码方法存在计算复杂度较高,缺乏可解释性以及难以有效利用神经网络中不同卷积特征间的互补信息等问题。针对以上问题,本文提出新的特征编码算法,降低了网络模型的计算复杂度,并利用不同卷积特征间的互补信息有效提高了细粒度图像识别的性能。
  针对现有特征编码方法难以有效利用神经网络中不同卷积特征间互补信息的问题,本文提出了分层双线性池化模型(Hierarchical Bilinear Pooling, HBP),采用跨层双线性编码算法,引导神经网络学习不同卷积特征间的交互信息,有效地提高了神经网络的特征表达能力。实验结果表明,与多种经典的细粒度识别方法相比,本文模型在三个标准数据集上的识别精度都取得了明显改进。
  针对特征编码方法计算复杂度较高的问题,本文提出了深度超球嵌入模型(Deep Hypersphere Embedding, DHE),采用特征相位信息来编码细粒度物体的属性,有效地降低了网络模型的计算复杂度,并且特征相位能够更好地表征细粒度物体间细微的语义差异信息,提高了神经网络的学习能力。针对特征编码方法缺乏可解释性的问题,本文提出了相位激活图和类别贡献图,以直观解释深度超球嵌入网络对细粒度物体间细微差异信息的编码学习过程。相位激活图能够突出输入图像中的物体区域,具有显著的目标定位能力;类别贡献图定量地分析了神经网络的分类决策,直观展示了细粒度物体的判别性属性。实验结果表明,本文提出的深度超球嵌入模型与多种经典的细粒度识别方法相比具有较高的计算效率,并且能够精准定位细粒度物体的判别性属性区域。
其他文献
固执的喜欢老歌、喜欢回忆,2005年王心凌《Honey》大碟的那首同名主打曲,至今仍是我最多哼起的旋律。我会把它放在我的LG新巧克力BL20e上,甜甜蜜蜜、暖心的调子,恰如手机本身名字——“新巧克力”,永恒经典、甜蜜在心。    pm1:27    隆冬时节,选择坐在小店里捧着一杯“卡布奇诺”沐浴暖阳,惬意享受。将LG新15克力BL20e握在掌中,轻轻触碰,“咔哒、咔哒”地翻看其中的种种,甜蜜?幸
期刊
微软ZUNE HD多媒体播放器在中国市场上姗姗来迟,早在几个月前,它已经在国外卖开,受到了众多的时尚潮人所追捧。这么一个小小的多媒体播放器为何那么受欢迎?原因在于它是世界上首款支持1080P全高清播放能力的MP4。不仅如此,高清收音机接收器、全屏互联网浏览、整体发光二极管触摸屏以及Wi-Fi无线网络,这些特性能够将消费者带入一个全新的娱乐世界。    像手机一样的外观    将ZUNE HD拿在手
期刊
随着社会信息化的不断发展,纸质文档的数字化管理是行政办公及各类柜台业务的发展趋势。在金融、教育及消费等领域,平板扫描仪和高拍仪等是常见的图像扫描设备,该类设备成本较高且占用办公面积较大。接触式图像传感器(CIS)具有成像焦距短、结构紧凑和成本较低等优势,适合用于采集纸质文档和纺织品等物体的表面图像。CIS图像扫描系统可集成于打印机和登折机等设备中,为该类设备增加图像扫描功能,从而降低办公设备的总体成本和体积。然而,现有CIS图像扫描系统通过打印机等设备将原始图像数据中转至个人电脑,由于打印机等设备搭载的处
在机场和火车站等场所,利用人证核验系统可以对证件与持证人的身份一致性进行核验,基于计算机视觉技术的智能化人证核验系统可以提升核验的效率与可靠性。在智能化人证核验系统中,图像内的复杂背景会干扰证件区域的准确定位,影响证件信息的自动识读;此外,现有的人脸验证算法不能同时兼容各类证件中不同分辨率的人脸图像。本文对人证核验系统中的证件区域定位及多分辨率人脸验证问题开展研究,并设计和实现了一套人证核验系统。
  首先,针对复杂背景下的证件区域定位问题,本文提出了一种结合卷积神经网络与Canny算子的证件定位方
诺基亚X6采用了主频为433MHz的处理器,搭载最新的S60第五版操作系统配备了3.2英寸1600万色360×640分辨率的触摸屏幕,提供了16:9的宽屏显示效果。在用户界面方面X6优化了用户的图片,视频和浏览体验,在主屏可以添加20位朋友或者Facebook等虚拟社区。该手机在音乐功能上也有出色的表现,32GB大容量存储能够持续播放35个小时的音乐。此外,500万像素的“卡尔·蔡司”自动对焦摄头
期刊
预印刷的产品包装薄膜上没有产品的具体生产信息,因此在产品包装生产线上还需要喷码,喷印的标识包括生产日期、生产地、生产厂商等。由于人为因素或者设备异常情况的影响,喷码可能存在印漏、印错等质量问题,影响产品合格率。传统喷码缺陷检测以人工检测为主,准确率受主观因素影响,且带来很高的用工成本。随着图像处理和计算机技术的不断发展,应用机器视觉方法实现智能质检成为了一种趋势。本文研究喷码缺陷视觉检测关键技术,并完成视觉检测软件系统的研发,主要工作包括:
  第一,针对包装预印刷文本和图案干扰图像配准的问题,提出
旅行证件是各国公民在境外的重要身份凭证,常用的旅行证件包括护照、通行证、身份证等。随着国际往来的日益频繁,对旅行证件表面的文字信息进行高效自动化识别成为边境通关的迫切需要。尽管近年来出现了大量关于文本检测与识别的研究成果,但旅行证件底纹复杂、文本尺度不一与语言多样的特点使得现有的算法难以满足实际需求。针对以上问题,本文提出了针对旅行证件图像的文本检测与识别算法。
  针对旅行证件语言多样、文本尺度不一、底纹背景复杂的问题,本文提出基于多重注意力特征金字塔网络的文本检测算法。通过融合多尺度特征图,提高
为顺应大屏幕时代的需求,明基推出了PQ、SQ两大系列大尺寸全高清液晶电视新品,其中52英寸的全高清液晶电视PQ5231,集真色彩、真节能、真对比、真高清、真倍频五大特色于一身,为你轻松呈现非凡的大视界。  独特的艺术设计    PQ5231为明基数字时尚设计团队一大倾情力作,硕大的机身采用了全黑的色调,以一条细长的红线做一点缀,打破了颜色的单调。设计师特别在PQ5231电视下方采用了波浪型交错的视
期刊
LG在时下风行的触控手机领域可谓兢兢业业,不仅推出了高端时尚的BL40、技术领先的GD900e透明手机多媒体功能强大的GC900e,同时在中低端产品上也推出了Cookie(曲奇)这样时尚经典的触控手机产品。而现在又一款针对年轻用户的触控手机——Min Cookie再次推出这款手机不仅继承了Cookie的经典元素更是将更多的快乐带给了用户。  与Cookie相比,Mini Cookie毫无疑问是前作
期刊
智领MT710是摩托罗拉在华发布的首款基于最新的OPhone OS平台的3G智能手机,它拥有抢眼的3.7英寸超大FWVGA触摸彩屏,特有横屏支架设计,融合CMMB手机电视功能特有即时录放功能确保不错过任何精彩瞬间。智领MT710采用中国移动高速的TD-SCDMA网络,以及WAPI/WIFI,能滑动全屏浏览横纵屏自动适配,智领MT710极大地提高了互联网的浏览体验。智领MT710的视频通话功能让通话
期刊