基于改进词袋模型的图像分类算法

来源 :上海师范大学 | 被引量 : 0次 | 上传用户:buugly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词袋模型(BOW)最早应用于文本文档的分类领域中,近年来,随着对词袋模型的进一步研究,以及模型本身具有简单有效的特点,使得模型广泛用于图像分类和图像检索中。但是现有的词袋模型方法存在以下问题,其一,在构建视觉单词时,将所有的SIFT特征用于聚类,而低鉴别力的SIFT特征会影响最终分类准确率;其二在构建视觉词组时,常用的KNN算法会造成视觉直方图过于稀疏。为了解决上述问题,本文提出了一种基于高鉴别力SIFT(Scale-invariant feature transform)特征和最小生成树的视觉词典构建算法。首先,利用类内相关系数和类间相关系数提取训练图像中高鉴别力SIFT关键点,其次,利用最小生成树构建高鉴别力SIFT关键点对,接着,分别对高鉴别力SIFT关键点和SIFT关键点对进行BSIFT编码,然后聚类得到视觉单词词典和视觉词组词典,最终,生成训练图像与测试图像的视觉单词直方图与视觉词组直方图,按两者的重要程度,分别乘以不同大小的权值并合并成联合直方图。论文首先详细介绍词袋模型的基本框架,然后介绍主流的图像底层特征提取算法SIFT,并根据SIFT算法提取的128维特征描述子在图像匹配以及聚类方面速度低的问题,提出二值化BSIFT方法,有效提高SIFT算法在图像匹配及聚类方面的速度。然后对训练图像得到的SIFT特征点进行高鉴别力SIFT特征点筛选,使用筛选后的高鉴别力SIFT特征构建词袋模型的视觉单词。接着对高鉴别力SIFT特征点利用最小生成树算法构建词袋模型的视觉词组,并根据图像视觉单词直方图和视觉词组直方图的不同重要程度,分别乘以不同大小的权值合并成联合直方图。在Caltech 101数据集上的实验表明,本文方法与主流词袋模型方法相比,本文算法的分类准确率要高于主流词袋模型方法。
其他文献
目的建立定喘止咳胶囊中盐酸麻黄碱含量测定的高效液相色谱法。方法色谱柱为Kromasil C18柱(250 mm×4 mm,5μm),0.02 mol/L磷酸二氢钾溶液(含0.2%三乙胺,用磷酸调pH至2.7)-
目的建立辛苍鼻舒胶囊的质量控制标准。方法采用薄层色谱法对处方中川芎、苍耳子、辛夷进行定性鉴别;采用毛细管气相色谱法对制剂中的α-蒎烯、β-蒎烯、桉油精进行含量测定,
金湖是国家级重点风景名胜区,地处福建西北部美丽的山城泰宁县境内.近年来,泰宁县委、县府紧紧抓住金湖旅游优势,以旅游为龙头带动经济全面发展.提出了"建新兴旅游城,创文明
胰腺神经内分泌肿瘤(pancreatic neuroendocrine neoplasms,p NENs)原称为胰岛细胞瘤,约占原发性胰腺肿瘤的3%。依据激素的分泌状态和患者的表现,分为功能性和无功能性神经内
<正>5S管理模式是一种起源于日本企业的现场管理法,其活动的对象是现场"环境",通过对现场环境全局进行综合考虑,并制订切实可行的计划与措施,从而达到规范化管理。目前,5S管
会议
目的通过调查独生女产妇家庭对陪产团队的临床预期明确团队工作目标。方法以问卷形式调查独生女产妇家庭对陪产团队的预期.统计结果及时反馈到团队各环节并督促改进。结果独生
为了确定X底水油藏含水上升规律,明确含水上升影响因素,找出减缓含水上升的方法,以该区块实际生产数据为基础,利用线性回归方法确定了该区块整体含水上升规律,并对单井含水上
开发有机茶是提高茶业效益、促进茶业向无公害化发展的重要途径.在分析有机茶生产对技术环境要求的基础上,针对当前宜昌茶叶生产向有机茶转换存在的问题和技术现状,从政策、
<正>消费互联网的发展步入巅峰之后,开始日趋饱和。与此同时,围绕产业互联网的布局,开始加速。一方面,地方政府纷纷出台政策加大支持,借势互联网推动企业转型升级;另一方面,
目的:应用RP-HPLC建立黄精药材酸水解物的指纹图谱。方法:色谱柱:YMC-PackODS-A柱(C18,250×46mm,5μm);流动相A:25mMKH2PO4(pH=6.6);流动相B:乙腈:甲醇=70:30;流速:1.5ml/mi