细粒度物体分类算法研究与实现

来源 :北京交通大学 | 被引量 : 6次 | 上传用户:mqs129977
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机视觉成为越来越热门的研究领域,而图像语义理解更是其中非常活跃的研究方向,从而实现对图像数据的有效管理、组织和再利用。在计算机视觉领域中,对于图像的认知一般分为三个层次:第一层是以感知层为主的图像内容分析,主要是低层特征的提取和处理,比如纹理、颜色、时空关系等;第二层是以认知层为主的图像理解,主要是中层特征的提取和语义理解,包括图像、场景、视频的主要区域等;第三层是以情感层的图像情感分析为主,该层主要是高层特征的分析,如人脸表情分类、图像情感分类等。人类对于图像的理解和表达更接近于认知层的分析,因此对于物体的检索与分类主要是利用图像包含的主要场景和主要物体来进行。这是计算机视觉领域较核心的问题,近年来引起了很多学者的关注和研究。现今对于图像的物体分类大多是针对粗粒度物体类别的分类,比如:汽车、房子、花丛等不同类别之间的分析,缺少的是相似类别之间的分析,无法做进一步更精细的划分和多层次分类。因此,如何更精细、准确、高效地实现图像的物体分类,具有着重要的理论意义和实用价值。本文以细粒度物体分类为出发点,构建了细粒度车型图像数据库,并深入研究了两种主流的物体分类方法,最后通过实验对分类方法进行分析与验证。第一种方法是基于部件模型的细粒度物体分类方法。它首先通过弱标记方法和隐支持向量机迭代判别算法对物体进行模型训练,再通过图像特征金字塔与部件滤波器的匹配来确定物体的部件区域及图像的中层特征,最后将图像的低层特征与中层特征融合起来从而得到新的图像特征。第二种方法是基于卷积神经网络的细粒度物体分类方法。该方法采用的是一个八层卷积神经网络结构。经过对同层相邻节点的响应进行局部归一化、对卷积层进行重叠池化、减少过拟合等方法优化网络结构,使用非线性的线段调整函数作为输出函数,最后采用卷积神经网络的第六隐层特征图作为图像特征进行实验研究。本文采用的两类细粒度物体分类方法均有不错的效果,通过实验验证,尤其是基于卷积神经网络的细粒度物体分类方法更取得了较好的分类效果。
其他文献
随着科技的不断发展,网络技术和数据库技术得到广泛的应用,企业存储的数据量也急剧上升。虽然企业拥有着大量的客户数据,但却无法从海量数据中提取蕴藏在其中的商业信息。如
作为网络通信的安全保障,安全协议是整个信息系统架构的安全基础。为了保证安全协议的正确性,研究人员提出了一系列基于形式化方法的自动化验证算法来对安全协议进行分析验证
机器翻译是自然语言处理领域的一个重点和难点问题,拥有着巨大的科学研究价值以及广阔的商业应用前景。近年来,基于实例的机器翻译发展十分迅速,取得了较为突出的成绩。基于
在现代高技术战争中,迷彩伪装是军事武器和军事装备保存自我的重要方法。近年来,随着高空飞行器技术和卫星技术的发展,以及侦察机和侦察卫星在军事领域的广泛运用,对伪装技术的要
随着我国高速动车组的大规模投入使用,动车组成为了铁路客运与货运的重要工具。伴随着运行时间和运行里程的增长,动车组运营已经积累了海量的运营数据和丰富的运维经验。但目
本文对人类视觉感知经验进行数学化表示,并将其应用于三维深度估算当中。首先,用数学语言对人类视觉感知经验进行表示和研究。研究如何从单张二维图像中的点、线、面的二维坐
近些年来,燃气在使用、存贮和运输过程中引发的爆炸事故时有发生,造成了大量的人员伤亡和经济财产损失,因此燃气的安全问题被普遍关注,引起了相关部门的极大重视。但由于燃气
本文针对高速数据采集方法和实现机理展开研究,提出了基于SOPc(可编裎片上系统)酌8路并行采集架构,用低速、低成本的模/数转换器件实现了1GSPS高速数据采集的目标。研究工作主要
学位
随着企业规模的不断扩大以及运行自动化水平的不断提高,它要求有可靠、成熟的高新技术来保证其发展。企业质量管理实施的水平高低直接关系着产品质量的高低,由于在企业生产管
随着计算机技术和网络通信技术的不断发展,在数据交换和数据传输更加方便的背景下,数字信息的安全问题得到了大家的关注,应运而生的数字水印技术也成为解决数字化多媒体信息