场景图像分类的算法研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:whitesharke
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着技术的发展,每天都有大量图片上传到互联网。特别是随着智能手机的应用,人们可以很容易地拍摄、编辑和上传图片。场景分类的目标是根据图像的视觉内容为图像赋予一个语义类别(例如:体育场或商场)。由于场景图片的二义性、多样性、光照和尺度等问题,场景分类是一个挑战性的问题。场景分类也是计算机视觉的基本问题,是图像检索、图像内容分析和目标识别等问题的基础。研究本课题研究意义十分重大,它可以帮助用户节省查找有用信息的时间,让搜索引擎功能更智能化,可以为我们节省更多的物力人力,可以使我们的网络更加智能化。  本文从图像的局部特征提取、视觉字典的生成、特征的编码方法和图像的表示与分类等方面对场景图像分类进行了深入研究:1)在局部特征提取阶段,本文提出用二进制特征作为局部图像特征,大大缩短视觉字典的学习时间和特征编码时间。本文还提出用在ImageNet数据集训练好的卷积神经网络模型抽取隐含层的数据作为图像块特征,避免了设计复杂的特征提取算法。2)本文利用特征编码的方法缩小了底层特征与语义之间的鸿沟,并对比了矢量量化、LLC编码和Fisher向量编码的性能。3)在场景图像的表示与分类阶段,本文采用基于空间金字塔匹配模型来表示图像,充分利用了局部特征的空间信息,提高了图像特征的区分能力,并测试了不同层数、不同块划分方法的空间金字塔的平均分类正确率。最后利用线性 SVM作为分类器,大大缩短了训练和测试的时间。  本文提出的方法在 Caltech-101数据集上的平均分类正确率是73.14%,相关实验表明,本文提出的场景图像分类算法是行之有效的。
其他文献
经济的发展,工业化水平的提高,人口的快速增长导致了大气污染问题的日益严重。2015年柴静的雾霾调查“穹顶之下”更是引发了全民的关注。为了合理整治大气污染问题,准确反映空气
数据挖掘的任务,就是从海量数据中,发现其中有用的信息。利用有价值信息可以指导人们的生产与生活,以此产生较大经济价值。随着科技的发展,人们也越来越重视从数据库中发现和
数字水印技术是目前信息隐藏技术领域的一个新方向,这种技术通过在载体数据中嵌入版权信息,成为对数字产品进行版权保护和内容认证的有效手段。几何攻击作为一种实现简单、破
随着互联网在世界范围内的迅猛发展,网络上的信息日益增加。人们迫切需要一种方法来从这些海量信息中快速获取有用信息、排除冗余信息,并将这些信息有机的结合到一起。多文档
在信息技术飞速发展的今天,办公自动化技术的内涵和外延都发生了根本的变化,各种技术的引入使人们能处理更广泛的业务和信息,如何灵活的重组业务过程,高效的集成业务模型,成
计算机病毒的知识,大多以文本和网页形式存在,缺乏一个结构化的组织方式。而本体作为领域信息的模型化表示,已经成为当前的研究热点,在许多领域得到了广泛的应用与深入的研究。本
Petri网的可覆盖性图(可达标识图)是分析Petri网的最常用方法之一,它能很好的分析Petri网的安全性、有界性、守恒性和可覆盖性等问题,但由于无界量符号ω的引入引起信息丢失,
图像分割方法是提取图像中感兴趣目标区域的方法,在图像工程中有着重要的研究意义。几十年来,国内外众多学者和研究人员对图像分割方法进行了深入的研究,发展了许多新的技术,
国际人工智能协会组织的机器人足球世界杯RoboCup(The Robot World Cup Soccer Games)比赛系统是人工智能和机器人研究的一种集中表现,它的仿真比赛融合了决策与对策、神经网
随着芯片内植入晶体管数量的逐年递增,在一块芯片内集成更多的处理器内核是可能的,根据摩尔定律,微处理器的速度以及单片集成度每18个月就会翻一番。那么,照此下去,到2010年