基于BoW模型的图像分类方法研究

被引量 : 0次 | 上传用户:ffyy5051
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像分类是图像分析与理解的基本问题之一。近年来,随着网络技术的飞速发展,越来越多的数字图像开始充斥人们的生活,如何对这些海量的图像信息进行快速、准确的分类,提取有用信息,就逐渐成为研究的热点之一。Bag of words (BoW)模型最初应用于文档分类领域并因其简单而有效的优点得到了广泛的应用,计算机视觉领域的研究者们尝试将同样的思想应用到图像处理和识别领域,建立了由文本处理技术向图像处理领域的过渡。本文将BoW模型应用于图像分类领域,并在研究该技术的基础上,针对模型中存在的一些缺陷进行了改进:首先,在研究了图像特征提取方法的基础上,针对传统的尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)描述子所存在的兴趣点有限、计算复杂度高以及在BoW模型中应用的局限性等问题,提出了一种改进的适用于BoW模型的多尺度DF-SIFT(Dense Fast SIFT)描述子。该描述子采用密集抽取的方法对图像进行均匀像素间隔的兴趣点计算,且对每个特征进行多尺度描述,能够更加充分的利用图像信息,且保证了特征的尺度不变性。此外,与传统的SIFT描述子不同,DF-SIFT描述子利用矩形窗代替高斯窗对图像进行平滑,对特征进行统一尺度分配,避免了定位兴趣点的复杂计算过程,提高了计算的效率。通过实验对DF-SIFT描述子进行了最优参数选取,使其在保证效率的同时提高了分类的正确率。其次,在分析了视觉词典构造方法的基础上,提出了一种基于稳定初值分布的聚类方法来对视觉词典进行构造,并且应用三角形不等式对计算进行了简化。该算法有效的解决了传统k-means聚类方法过度依赖初始中心选取的问题,避免了局部最优给分类性能带来的影响,减少了收敛的迭代次数,提高了计算效率。此外,基于此视觉词典构造方法,本文还提出了一种基于权值分布的视觉词典直方图表示方法,该方法根据图像特征与视觉单词的距离不同,即对视觉单词的贡献不同,为其分配不同的权值,将这些权值求和作为图像的基于视觉单词库的直方图表示。结果表明,本文提出方法有效地提高了分类的性能,最后在此基础上分析了视觉词典库大小对分类结果的影响。最后,提出了一种基于兴趣区域(Region of Interest, ROI)提取与金字塔匹配原理相结合的BoW模型优化方法,该方法首先对训练图像进行ROI提取,然后对其进行视觉单词的计算,由此生成的视觉单词库更具有代表性,更能精确地描述图像类的特征,且能在一定程度上抵抗位置信息变化以及背景无用信息带来的影响。应用金字塔匹配原理对图像进行表示,能够初步应用图像中区域的空间信息,使匹配精度更高。实验研究了不同的金字塔划分方法对分类结果的影响,验证了应用ROI提取与金字塔匹配原理相结合相比较于传统的BoW模型的优越性。文章最后整合全文,形成一个完整的优化模型进行实验,并与现有的相关方法进行了比较,结果表明,本文方法的分类结果要优于现有的其他同类方法。文章最后对本文方法的优劣性进行了详细分析。
其他文献
草畜产业作为西吉县第二大主导产业,对促进县域经济发展,增加农民收入发挥着越来越重要的作用,在发展现代农业,建设社会主义新农村新的历史进程中占居着重要的位置。数年来,
在详细分析霍尔电流传感器磁路的基础上,推导出电流传感器直流传递函数。并通过ANSYS电磁仿真软件对传感器进行三维电磁场仿真计算,验证了理论计算的正确性。最后给出了25kA霍
“一事一议”是指村民兴办直接受益的农田水利基本建设、道路维修、植树造林和村民认为需要兴办的其他集体生产生活等公益事业。经民主程序确定的自愿出资出劳的行为。2011年
随着人们生活水平的提高,物质上有了基本保障,在这个越来越城市化的社会里,人与人之间的交流越来愈少了,加之空巢家庭的增多,饲养宠物的人士越来越多,不少人觉得养宠物犬是一件很幸
模拟电子技术是电类专业本科教学的重点与难点。本文设计了一个基于运算放大器的线性相位计实验项目,适用于模拟电路课程设计,可提升学生模拟电路设计水平。该实验采用一片四
车辆自动识别是在智能交通领域的重要应用。车辆牌照识别技术因其获取的车牌信息能够为交通超速违章纠正、交通事故逃逸、盗抢机动车以及利用机动车作案等案件及时侦破提供重
企业履行社会责任不仅体现了企业的一种商业道德,更体现了企业的社会价值。本文通过对企业社会责任及其信息披露意义的探讨,企业社会责任信息披露的问题及其原因的分析,提出
液压机械手专利申请号:97210599简易液压机械手是一种结构简单、成本低、性能可靠,用于高棵农作物和果树果实的采摘及作为残疾人取放物品的辅助工具,它解决了现有液压机械手结构复杂,成本
铒掺杂的氧化镥(Er3+:Lu2O3)透明陶瓷材料具有优良的物理性能和光学特性,为陶瓷闪烁体和高功率激光器以及短脉冲激光器的激光增益介质提供了选择,可广泛的应用于生物、医学、
衰老机制与抗衰老研究一直是生命科学研究的热门话题,人体衰老的原因是多方面的,衰老的机制也极为复杂。本文将综述衰老机制的几大重点学说:自由基-线粒体衰老学说、褪黑素-