单尺度词袋模型图像分类方法研究

来源 :西南大学 | 被引量 : 0次 | 上传用户:yingying0615
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术、互联网技术的发展,网络中涌现出了海量的图像,如何有效管理和利用这些图像成为了亟待研究的课题。解决该问题的突破口就是数字图像处理技术中的图像自动分类技术。然而,图像自动分类技术一直是困扰图像标注、图像检索发展的学术性难题。目前,在很多的图像分类系统中仍然是利用人工手动分类。由于网络中日益产生大量的图像,利用人工手动分类存在着工作量大而乏味,工作人员眼睛极易疲劳且效率低下,分类结果容易受分类人员主观因素影响而产生语义分歧等问题。因此,图像的自动分类得到了更多的重视。图像自动分类方法利用计算机视觉原理来代替人工进行图像分类,不仅可以提高效率,降低操作人员的劳动强度,而且使得分类结果更为客观。本文对图像的自动分类展开研究,当前在图像分类领域里应用较为广泛的词袋模型是本文分析研究的重点。传统的词袋模型的特征表示方式,在提取SIFT特征时需要构造多尺度的极值空间导致计算复杂,并且对局部区域所提取的特征点数目不够导致描述能力不足。针对以上不足,本文提出一种不需要构造极值空间,而是通过网格直接提取单尺度SIFT特征点并进行特征描述,形成词袋模型的图像分类方法。该方法直接通过网格确定特征点提取位置,不但在提取更多特征点时没有增加计算量,而且注重兼顾局部特征的全局性,使得在形成视觉词典之后,视觉单词之间的类间差别更大,从而更有利于利用svM的分类。通过实验证明单尺度SIFT词袋模型比常规SIFT词袋模型在查全率、查准率、综合指标等三方面都有所提高。由于提出的单尺度SIFT词袋模型的分类效率依然不高,实质还是描述符维度相对较高,影响了描述符检索的效率。进而提出一种基于单尺度提取低维度描述符的方法形成词袋模型。通过实验证明,该方法在查全率、查准率、综合指标等三方面保持了与单尺度SIFT词袋模型效果基本相同,但极大的减少了描述符生成过程中带来的运算复杂度。
其他文献
由于GPS设备能够提供定位、导航和路线规划等多种实用功能,它已经成为人们出行生活中必不可少的电子设备。与此同时,这也更突显出GPS设备所携带的数据的重要性。对于取证工作
随着互联网的发展,数据安全和隐私保护的重要性越来越明显。信息的负表示是一种新的很有前景的数据安全和隐私保护方法。负调查就是在信息负表示思想的基础上提出的。这种调查
由于人脸分析具有广泛的应用前景,该研究在近些年来得到了越来越多的关注。目前的人脸分析的工作主要都针对可见图像。而光照变化影响可见图片的外观特征,因此,基于可见图像的人
无线传感器/执行器网络是近年来发展起来的一种新型、无基础设施、自组织的无线网络。它衍生于无线传感器网络,由众多的传感器和执行器组成,通过无线自组网方式,完成分布式感测
3D-HEVC中引入深度图实现更好的视图合成。针对深度图的特点3D-HEVC在深度图帧内模式选择过程中增加了深度建模模型(Depth modeling modes,DMMs)。目前3D-HEVC中的帧内模式除
随着网络的发展和移动视频的兴起,以及支持Web的各种移动设备、平板电脑的涌入和普及,在多样化的显示设备上高质量地显示视频和图像的需求越来越强烈。要求视频和图像不仅能够
闪存作为一种新的存储介质,正在逐步取代磁盘的主导地位。但是由于历史原因,关系数据库的页面存储结构主要是针对于磁盘的特点设计的,未能充分发挥闪存的性能优势。因此基于
随着快速发展的计算机图形学技术、计算机仿真技术、图像处理技术、人工智能技术等,增强现实逐渐成为近几年来的研究热点。增强现实技术将真实世界与虚拟对象无缝的融合起来,融
随着移动通信和互联网的高速发展,各种网络技术不断涌现并迅速进入实际使用,使得现有的网络环境日益复杂。对于应用程序选择合适的网络以及用户选择合适的程序造成了额外的负担
近年来信息检索在社会经济发展中的重要性愈发显现。专利文档作为保存现代科技成果的重要方式,几乎包含一切应用领域的创新成果,涉及社会生活的方方面面。对专利文档信息的应