基于空间金字塔模型的图像分类方法研究

被引量 : 0次 | 上传用户:ineedtoxiazai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类技术是计算机视觉领域中的一个重要研究方向,它的目的在于根据某些特征和需求对图像进行分类。较经典的分类模型主要包括BOF模型和SPM模型,其中,SPM模型在图像分类领域越来越受到关注,它考虑了视觉单词之间的空间关系,避免了BOF模型在分类过程中造成的一些有用的图像空间结构信息的丢失,减少了图像信息的损失,带来了高效的分类性能。本论文基于SPM模型的基本框架来研究图像分类问题,主要围绕集成学习思想和特征融合技术,通过改进空间视觉词典的构建方式,进一步对生成的图像描述采用不同的处理方法,对图像分类展开了研究。鉴于集成学习方法的优越性,提出了一种集成多特征与稀疏编码的图像分类方法,结合多种可用于提高图像分类性能的方法来分类图像。该方法首先对图像进行空间金字塔划分,结合SIFT和HOG特征之间的优势互补性,提取得到不同的特征集。然后,在不同的特征集上用不同的聚类方法得到不同的视觉词典,在每个词典上分别进行LLC和SC编码,得到不同的图像描述集。最后对得到的多个结果采用投票决策方法决定最终的分类情况。为了挖掘空间视觉词典在对图像表述上的潜力,本文进行了两个方面的研究:多级空间视觉词典集体的方法和构建强判别力的空间视觉词典的方法。前者,提出了一种多级空间视觉词典集体的构造方法,构造不同层级上的视觉词典,从全局视觉词典一直到划分比较细的子空间视觉词典,从而可以综合不同层级或不同粒度的图像信息进行分类。图像各子区域内的特征基于其对应的空间视觉词典进行LLC稀疏编码,根据各层次、各子区域对图像贡献程度的不同赋予不同的权重,将所有加权量化特征向量连接形成最终的图像描述。后者,提出了一种构建强判别力的空间视觉词典的方法,它的基本出发点是通过对图像进行空间金字塔划分后,对每个子区域提取最具有区分意义的视觉单词生成视觉词典。把所有训练图像的该子区域中的所有特征集合起来,统计特征集中各特征出现的次数来选择出现概率最大的单词,生成该子区域最终的视觉词典。
其他文献
当前,现代社会快速发展,对于物流货运的需求快速增长,物流管理系统的作用日益显著。不仅是对于物流企业,对于消费者,优秀的物流管理系统也提供了快速的信息共享与发布平台。
组织是企业发展的基本载体,组织结构是企业运营的基础框架,组织结构设计的合理性直接影响企业的生存与发展。在组织结构理论中,存在着很多组织结构模式,每一种模式都有自己的
随着科技、经济、文化的发展,人民生活水平的提高,人们的消费模式和生活方式已经发生了巨大的改变。尤其是互联网技术迅速的发展,使网络的重要性逐渐被我们所认识,网络营销与
随着国民经济的持续快速增长,以及国家对汽车产业的宏观牵引,城市的汽车数量也急剧增长。不但给动态交通而且也给静态交通带来了很多难题,其中停车便是其中的难题之一。昆明
中小企业是企业中的主力军,其发展情况直接关系着国民经济的健康发展。随着外界环境的不断变化,不确定性因素增多,中小企业面临的风险无处不在。我国中小企业的管理水平本身就比
<正>幼时读《水浒传》,对武大郎所卖"炊饼"究竟为何物,百索不得其解。后来看到有学者考证云,"炊饼"本即"蒸饼",宋代为避仁宗赵祯的名讳,便把"蒸饼"说成"炊饼"。这一说法已经
在欧美等西方国家,博物馆被看做是“儿童最重要的教育资源和最值得信赖的信息资源”之一。而我国,儿童在传统博物馆中常常容易受到忽视。近年来如何拉近博物馆与儿童的距离,
在移动互联网和网络新媒体不断走向成熟的今天,平面媒体面临着生死攸关的考验。平面媒体传统的信息生产方式已经逐渐被时代所淘汰,受众接受信息的方式较之从前也发生了天翻地
在系统生物学中,从大量的数据中识别对所研究问题具有丰富价值的信息是一个十分重要的课题。TSP (Top Scoring Pair)算法是一种基于对“特征对”进行评价且利用得分最高的的
客户关系管理,是一个不断加强与客户交流,不断了解客户需求,并不断对产品及服务进行优化和提高以满足客户需求的连续过程,它的重点是提高与客户的交流能力及客户收益率的最大