基于视觉描述子的图像检索与分类方法研究

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:cfzzfz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着个人媒体设备的快速普及和互联网技术的出现,现实生活中图像的数量急剧增长,因此如何快速有效地组织和管理这些图像成为一个研究热点。与此同时,各种新兴技术的迅速发展导致了用户对图像检索与分类需求的不断变化,尤其是在图像含义理解方面的需求,但内容越来越丰富的图像加剧了底层视觉描述信息与高层语义视觉描述信息之间的“语义鸿沟”,这给图像的分类与检索技术带来很大的挑战。图像有着丰富的视觉描述信息,包括颜色、形状、纹理、局部、空间信息以及高层的文本描述信息等,这些用来解释图像的视觉描述信息统称为视觉描述子,视觉描述子对图像检索与分类有着重要的研究意义。本文重点围绕图像中视觉描述子的表示、提取和使用,对图像检索与分类进行研究,主要工作体现在以下两个方面:(1)提出了基于粗糙集推理规则和颜色互信息描述子的图像检索方法。为了减小不确定信息给图像检索结果带来的限制,在底层描述子到高层语义的映射已经完成并形成图像对象文本表示的基础上,根据粗糙集规则提取的相关理论,本文提出了基于粗糙集推理规则的图像检索模型。在此模型中,由于底层视觉描述子到语义层描述子的映射存在信息丢失,这造成了“语义鸿沟”的问题。为了克服该问题带来的检索不精确性,在基于粗糙集推理规则的图像检索模型的基础上,进一步引入颜色相关视觉描述子,提出了基于粗糙集推理规则和颜色互信息描述子的图像检索模型,该模型利用了颜色互信息描述子充分考虑底层视觉描述信息变化的优势,从而实现了精确检索。本文提出的这两种检索模型实现了多模态的图像检索,通过仿真实验证明了该方法可以有效改善图像检索的精度。(2)提出了基于空间差异描述子的图像分类方法。在图像分类中,比较著名的一种方法是空间金字塔匹配模型,该模型是词袋(BoW)模型在特征编码方面的一个拓展,它首先将一幅图像分割为逐渐增加的子区域,然后将每个子区域的直方图级联起来。然而,空间金字塔匹配模型并没有考虑子区域间的空间差异信息,为了利用这一空间差异信息,本文提出一种新的描述子--空间差异描述子,在此基础上提出了基于空间差异描述子的图像分类方法。该方法主要包括五部分:底层描述子的提取,稀疏编码,描述子集成,空间差异描述子的计算和线性分类。计算出的空间差异描述子主要用于连接空间金字塔匹配模型的词袋直方图。为了验证所提方法的有效性,本文在Scene15、Caltech101和Caltech256图像库上进行了实验,实验结果表明本文所提出的方法可有效地提高图像的分类精度。
其他文献
隐写分析技术是信息隐藏技术的逆向技术,主要目的在于检测、提取或破坏可疑载体内藏有的秘密信息。由于网络语音流具有较大的信息隐藏容量和较高的实时性,因此网络语音流上的
互联网的出现和快速普及使得信息的获取和利用更加便捷,而信息无障碍建设使得残障人士特别是视障人士也能充分利用互联网上的资源与服务,真正实现信息社会的无差别接入。  
软件复用是指重复利用现有系统中具有相同或相近的软件元素来开发新系统的过程,它极大的提高了软件开发效率和软件质量。作为解决软件危机的有效途径,软件复用技术迅速发展,
分布式实时嵌入式系统(DRES)的安全性是系统的关键环节,而信息的传输是分布式实时嵌入式系统安全中的一个薄弱环节。随着计算机软硬件的迅速发展与网络的广泛应用,分布式实时
学位
随着计算机及网络技术的不断发展,流媒体凭借边下载边播放等优点而得到越来越充分的应用。P2P技术应用于流媒体经过近几年来的研究已不断地走向成熟,其中P2P流媒体直播系统在
随着互联网中信息爆炸式的增长,网络存储技术越来越收到人们的关注和重视。而这种网络存储技术面临的一个主要的问题就是怎样充分利用互联网中的这些曾被忽视的闲散PC资源形
近些年来,背景建模算法在计算机视觉领域得到了广泛的应用,如视频监控、目标跟踪、人体行为识别、车牌检测等。与此同时,背景建模算法的应用环境也发生了较大变化,从静止的室
随着科技发展,机器人产业的应用和需求与日俱增,人类生活各领域如工业、农业、教育、国防等逐渐出现机器人的影子。因此,机器人学是一个重要且极具广泛应用价值的研究课题。
XML以其扩展性、结构性、平台独立性和自描述性等诸多特性,越来越多的信息采用XML格式进行存储和交换,XML已经成为Web上信息表示和交换的标准。大量XML数据的出现给XML的存储和
生物命名实体识别是生物医学文本挖掘的关键步骤,只有正确地识别出生物命名实体,才能有效地完成基因(蛋白质)标准化和蛋白质-蛋白质相互关系抽取等更加复杂的工作。然而,由于生